Metric Strategy

Metric	Threshold	Rationale
SQL Correctness	>98%	Execution-based: syntactically valid SQL is required to return results
Cost per Query	<$0.15	Business impact: $0.10 infra cost + $0.05 margin buffer at 10k queries/day
Policy Compliance	>97%	Regulatory: violations have legal consequences

Metric	Blocking?	Threshold	Rationale Source
SQL Syntax Validity	Yes	>98%	Execution-based correctness — if SQL doesn't parse, system returns nothing
Cost per Query	Yes	<$0.15	Business impact — $0.10 infra + $0.05 margin at 10k queries/day = unprofitable above this
Policy Compliance Rate	Yes	>97%	Regulatory — single violation could have legal consequences

Five ways metric strategy breaks

Everything is blocking → system never ships
10 blocking metrics = probability all pass simultaneously is vanishingly small
No threshold rationale → arbitrary and undefendable thresholds
When metric hovers near the line, team has no basis for hold/ship decision
Metric proliferation without hierarchy → dashboard paralysis
Flat list of 12 metrics, no clear story, arguments about individual numbers
Confusing blocking metrics with runtime checks → implementation mismatch
Blocking = aggregate quality, gates releases. Runtime = per-request protection
Static thresholds ignore context → one-size-fits-all quality bars
Lookup queries need perfect correctness. Complex causal analysis tolerates uncertainty