Prioritization

Segment	Failure Rate	vs. Overall
PM	8%	0.8x
DS	40%	4.0x
Eng	3%	0.3x
Exec	12%	1.2x

Work Item	Frequency	User Harm	Fixability	Time-to-Learn	Reversibility
Improve retrieval quality for metric definition queries	18%	Medium	High	Fast	High
Fix policy compliance failures on PII (Personally Identifiable Information) queries	0.8%	Catastrophic	Medium	Slow	Low

Rank	Work Item	Priority Score
1	Retrieval quality (metric def queries)	28.5
2	Hallucination rate (revenue queries)	26.5
3	SQL logic errors (multi-table joins)	24.0
4	Policy compliance (PII queries)	22.0
5	Cost guardrails (Eng segment)	20.5

Work Item	User Harm	Frequency	Biz Crit	Confidence	Fixability	Time-to-Learn	Reversibility
Retrieval quality	3	5	4	5	5	5	5
Hallucination rate	5	3	5	4	3	3	4
SQL logic errors	4	4	3	4	3	4	4
Policy compliance	5	1	5	4	3	2	2
Cost guardrails	3	3	4	5	4	3	4

Knowledge Check

Question 1: You write an acceptance criterion: "Improve task completion rate." A reviewer says this is not specific enough. Rewrite it as a well-formed acceptance criterion using the format from this lesson.

Question 2: Your #1 ranked item is "Fix retrieval failures on schema lookups." You perform a segment check and discover this issue affects 35% of Data Science user queries but only 5% of PM user queries. Data Science users generate 40% of revenue. Does this change your prioritization? Why or why not?

Prioritization

Knowing WHAT to fix vs. knowing which fixes to do FIRST?

Eight failure modes, all backed by evidence — which one do you fix first?

Prioritization uses seven dimensions plus acceptance criteria

User harm severity measures impact magnitude, including silent failures

Frequency, business criticality, and confidence form the evidence base

Fixability, time-to-learn, and reversibility control iteration velocity

Acceptance criteria define "done" — no perpetual refinement

Segment-aware and tail-risk weighting prevent frequency bias

Retrieval quality (18% frequency, medium harm) vs. policy compliance (0.8% frequency, catastrophic harm) — which ships first?

Retrieval quality ranks #1 with priority score 28.5 — high fixability and fast learning win

Acceptance criteria specify metric threshold, segment, and evidence

Segment check reveals Data Science users experience retrieval failures at 1.4x the overall rate

Build a ranked iteration backlog with acceptance criteria

Prioritization matrix heatmap showing tradeoffs across 7 dimensions

Knowledge Check

Ignoring tail risks because frequency is low — 0.5% policy violations get deprioritized

Stakeholder says "prioritize B — it affects way more users" — what's missing from this reasoning?

Evidence → Scoring Matrix → Ranked Backlog with Acceptance Criteria

Next: Ownership model, the AI Reliability Lead, and decision rights