Der Rubric ist meinungsstark. Er wird einige durchaus solide OKRs als unvollstaendig markieren, weil eine Baseline fehlt oder ein Alignment-Bezug nicht angegeben ist. Das ist ein Feature. Das Ziel sind keine perfekten OKRs nach einem abstrakten Standard, sondern OKRs, die tatsaechlich Ergebnisse veraendern, statt gut formatierten Planungs-Theater zu produzieren.

Jetzt ausprobieren →

Die 7 Kriterien

O1
Klarheit

Benennt das Objective einen spezifischen Kunden und einen spezifischen Umfang?

Vage Begienstigte produzieren vage KRs im Downstream. Wenn das Objective nicht sagt, wer profitiert oder wovon, kann das Team nicht zwischen den vielen Wegen zur angestrebten Richtung priorisieren.

Besteht (2 Punkte)
"Interne Backend-Engineers hoeren auf, Zeit durch Umgebungsfehler zu verlieren" benennt einen Kunden (interne Backend-Engineers) und einen Umfang (Umgebungsfehler). Keine Unklarheit darueber, wer profitiert.
Scheitert (0 Punkte)
"Developer Experience verbessern" koennte interne Engineers, externe API-Konsumenten oder beide bedeuten. "Experience" deckt alles ab und beschreibt daher nichts.
O2
Zeitrahmen

Gibt es ein explizites Datum oder Quartal?

Ein Objective ohne Zeitrahmen kann nicht nachverfolgt werden. Teams schieben das schwierige Gespraech darueber auf, ob sie im Plan liegen, weil es kein Datum gibt, gegen das man im Plan liegen koennte.

Besteht (2 Punkte)
"Bis Ende Q3 2026" ist ein expliziter Bezug, der einen Review-Moment und eine Deadline fuer das Team schafft.
Scheitert oder teilweise
"Dieses Jahr" gibt 1 Punkt. "Bald" und Objectives ohne Zeitbezug geben 0 Punkte.
O3
Strategie

Ist das Objective problemorientiert, ohne eine Loesung im Text vorzuschreiben?

Ein Team, das loesungszuerst-Objectives schreibt, hat den Problemdefinitions-Schritt normalerweise uebersprungen. Wenn sich die Loesung aendert, wird das Objective falsch. Problemorientierte Objectives ueberstehen Pivots.

Besteht (2 Punkte)
"Die Zeit kuerzen, die Kunden benoetigen, um ihre erste Bestellung abzuschliessen" benennt ein Problem und eine Richtung, ohne Features, Plattformen oder Methoden festzulegen.
Scheitert (0 Punkte)
"Self-Service-Checkout-Portal launchen, damit Kunden schneller bestellen koennen" bettet das Portal als Antwort ein, bevor die Arbeit begonnen hat.
KR
Outcome-Form

Folgt das Key Result der Struktur "wer tut was um wie viel"?

Output-Verben (launchen, migrieren, liefern, erstellen, bauen, implementieren, ausrollen) geben 0 Punkte. Eine Metrik mit einem vagen Akteur gibt 1 Punkt. Die vollstaendige Struktur "wer + tut was + von X auf Y" gibt 2 Punkte. Dieses Kriterium gilt pro Key Result.

Besteht (2 Punkte)
"Neue Kunden schliessen den Checkout ohne Support-Kontakt ab, von 34% auf 52%" hat einen benannten Akteur, ein spezifisches Verhalten und einen messbaren Bereich.
Scheitert (0 Punkte)
"Checkout-Verbesserungen bis Ende Q3 launchen" ist Arbeit, kein Ergebnis. Die Ergebnisversion fragt, was sich fuer Kunden nach dem Launch aendert.
KR
Messbarkeit

Enthaelt das KR sowohl eine Baseline als auch ein Ziel?

Eines vorhanden, eines fehlt, gibt 1 Punkt. Keines gibt 0 Punkte. Beide, plus eine implizierte oder benannte Datenquelle, gibt 2 Punkte. Wenn die Baseline unbekannt ist, ist das korrekte OKR, die Metrik zuerst zu instrumentieren, nicht sie zu verbessern.

Besteht (2 Punkte)
"Session-zu-Signup-Conversion bewegt sich von 2,1% auf 3,5% (Quelle: GA4, gleitender 30-Tage-Durchschnitt)" gibt den aktuellen Zustand, den Zielzustand und die Datenquelle an.
Teilweise (1 Punkt)
"Conversion-Rate auf 3,5% erhoehen" hat keine Baseline. Ohne sie laesst sich nicht verifizieren, ob Bewegung stattgefunden hat oder ob sich der Markt einfach bewegt hat.
A1
Alignment

Verweist das OKR-Set auf sein uebergeordnetes Objective oder die Strategie, zu der es beitraegt?

Alignment ist nicht nur Governance-Overhead. Es ist der Mechanismus, der Team-Einsatz mit organisatorischen Ergebnissen verbindet. Die Arbeit mag gut gemeint sein und trotzdem die falsche Sache optimieren.

Besteht (2 Punkte)
"Traegt zum Unternehmens-OKR bei: Erlebnis mit der geringsten Reibung in unserer Kategorie werden" gibt die Verbindung an, statt sie anzunehmen.
Scheitert (0 Punkte)
Ein OKR-Set ohne Bezug auf irgendetwas darueber gibt 0 Punkte, unabhaengig davon, wie gut die KRs konstruiert sind.
C1
Vollstaendigkeit

Gibt es Platzhalter im OKR-Set?

Alles markiert mit X%, TBD, (Owner), (tbc) oder "Zahlen folgen" gibt 0 Punkte. Ein Platzhalter ist eine aufgeschobene Entscheidung. Ein OKR mit Platzhaltern einzureichen bedeutet, einen Entwurf als Commitment einzureichen.

Besteht (2 Punkte)
Jedes Feld mit echten Zahlen, echten Verantwortlichen und echten Datenquellen besetzt, kein Folgegespraech noetig, um das Set zu interpretieren.
Scheitert (0 Punkte)
"NPS von X auf Y erhoehen (Verantwortlicher: TBD)" schafft den Anschein von Messbarkeit ohne die Substanz.

Die 6 Anti-Patterns

Output-als-KR

Ein KR, das Arbeit deines Teams beschreibt, statt eine Veraenderung, die in der Welt geschieht. Das Verb verraet es: migrieren, launchen, liefern, bauen, implementieren.

"100% der Bestellungen bis Q3 auf das neue OMS migrieren." Das Ergebnis der Migration koennte Geschwindigkeit, Zuverlaessigkeit oder weniger Fehler sein. Schreib das KR darueber.
Impact-als-KR

Ein KR auf so hoher Ebene und so nachlaufend, dass kein einzelnes Team es kontrollieren kann. Ein Team, das dieses KR schreibt, kann in Woche 6 nicht sagen, ob es beitraegt oder nur Zuschauer ist.

"Jaehrlichen Umsatz um 20% steigern." Umsatz ist das Ergebnis der Arbeit vieler Teams. Finde das spezifische Verhalten eine Ebene darunter: Was tun Kunden anders, was den Umsatz antreibt?
Vanity Metric

Eine plausibel klingende Zahl, die nicht mit einem spezifischen Akteur oder Verhalten verbunden ist. Vanity Metrics sind leicht zu bewegen, ohne das zu bewegen, was zaehlt. Der Test: Kann ich mir ein Szenario vorstellen, in dem diese Metrik steigt und das Geschaeft schlechter wird?

"Engagement um 25% steigern." Engagement von was, von wem, auf welcher Flaeche? Nenne Akteur und Handlung: "E-Mail-Abonnenten, die auf eine Produktkarte klicken, von 6% auf 11%."
Platzhalter

Ein KR mit unbekannten Zahlen, die als bekannt committed wurden. Wenn die Baseline unbekannt ist, ist das KR ein Wunsch. Der richtige Schritt ist, die Metrik zuerst zu instrumentieren.

"Ladezeit von X% auf Y% reduzieren." Keine Baseline, kein Ziel. Das ist eine Richtung, kein Ergebnis.
Binaerer Meilenstein

Ein Bestanden/Nicht-Bestanden-Meilenstein, der dir sagt, ob etwas passiert ist, nicht ob es funktioniert hat. Normalerweise ein Output-als-KR im Disguise. Frag, was der Meilenstein veraendern sollte, dann miss das.

"100% der Teams auf das neue Framework ongeboardet." Wenn das Onboarding die Planungszykluszeit reduzieren sollte, miss das stattdessen.
Aufgabenliste im Disguise

Drei oder mehr KRs, die eigentlich ein Projektplan sind. Sie beschreiben Inputs, keine Ergebnisse. Das ganze Set sollte auf ein oder zwei KRs ueber das Ergebnis komprimieren, das die Aufgaben produzieren sollten.

"Zwei Engineers zuweisen. Mapping-Dokument erstellen. Sign-Off von Legal einholen." Das sind Inputs. Komprimiere auf das Ergebnis, das diese Arbeit produzieren sollte.

Der "Und was?" Test

Fuer jedes KR stelle drei Fragen, bevor du es committest. Jedes "Nein" bedeutet, das KR muss neu geschrieben werden.

Frage 1
Wenn alle KRs gruen werden, ist das Objective offensichtlich erreicht? Wenn nicht, sind die KRs nicht eng mit dem Objective verbunden. Es fehlt etwas.
Frage 2
Wenn dieses KR rot wird, signalisiert es ein echtes Problem, das das Team angehen muss? Wenn die Antwort "wir wuerden es bemerken, aber weitermachen" ist, ist das KR nicht wichtig genug fuer das Set.
Frage 3
Kontrolliert das Team diese Metrik tatsaechlich? Wenn die Metrik sich aufgrund von Faktoren ausserhalb des Team-Einflusses bewegen kann, ist sie ein schwaches Signal fuer Team-Performance.

Der Test macht die Luecke zwischen Aktivitaet und Ergebnis sichtbar. Die meisten OKR-Probleme sind sichtbar, sobald du diese drei Fragen stellst. Teams, die den Test ueberspringen, entdecken die Luecke normalerweise in der Retrospektive, was zu spaet ist, um zu handeln.

Wie der Score berechnet wird

Jedes der 7 Kriterien gibt 0, 1 oder 2 Punkte. Die KR-Kriterien (Outcome-Form und Messbarkeit) gelten pro Key Result, sodass ein Set mit drei KRs mehr KR-Punkte im Spiel hat als eines mit einem. Der gesamte Rohscore wird auf einen 0-100-Prozentsatz normalisiert.

Score-Bereich Stufe Bedeutung
0-33 Kritische Maengel Strukturelle Kernfehler. Das OKR kann so nicht nachverfolgt oder bewertet werden.
34-55 Schwach Einige Kriterien bestehen, aber das Set hat Luecken, die mitten im Quartal Probleme verursachen werden.
56-77 Stark Solide Basis. Einige Kriterien brauchen Schaerfung vor dem Commitment.
78-100 Exzellent Alle Kriterien erfuellt oder fast erfuellt. Das ist ein commitbares OKR.

Die Stufen sind diagnostische Signale, keine Noten. Ein Score von 42 bedeutet, dass spezifische Kriterien das Set nach unten ziehen. Die Aufschluesselung pro Kriterium zeigt genau welche und warum.

Jetzt ausprobieren →