FAQ

Häufig gestellte Fragen.

Häufige Fragen zur OKR-Qualität, zu den Anti-Patterns, die das Raster prüft, und dazu, wie OKR Orca funktioniert.

Was bedeutet der Score eigentlich?

Der Score ist eine Normalisierung eines 7-Kriterien-Rasters auf 0 bis 100. Jedes Kriterium bringt 0, 1 oder 2 Punkte. Kriterien auf KR-Ebene gelten pro Key Result, ein Set mit drei KRs hat also mehr Punkte im Spiel als eines mit einem KR. Die Rohpunkte werden normalisiert.

Die Score-Bereiche bilden fünf handlungsorientierte Stufen ab: 0-20 Neu schreiben, 21-40 Neu fassen, 41-60 Schärfen, 61-80 Solide, 81-100 Startklar. In der Methodik steht, wie jedes Kriterium bewertet wird.

Was, wenn das LLM einen schlechten Rewrite liefert?

Rewrites sind Startpunkte, keine fertigen Antworten. Das Raster ist die Wahrheitsquelle: Wenn ein vorgeschlagener Rewrite weiterhin ein Output-Verb enthält oder kein Ausgangswert da ist, ist er kaputt, egal wie geschliffen er klingt. Lass die Diagnose über jeden Rewrite erneut laufen, indem du ihn ins Eingabefeld kopierst. Die Regel-Engine bewertet ihn lokal in unter einer Sekunde, ganz ohne Key.

LLMs erzeugen gelegentlich flüssige, aber strukturell schwache OKRs. Wende das Raster auf den Rewrite an. Ein Rewrite, der unter 56 landet, braucht noch eine Runde.

Was kostet der Coach-Modus pro Session?

Ungefähr 0,05 bis 0,15 USD für eine Session mit 6 bis 10 Zügen über GPT-4o. Claude Sonnet 4.6 kostet etwas mehr, rund 0,08 bis 0,20 USD für dieselbe Länge. Der Regel-Engine-Vorab-Score im Diagnose-Modus ist unabhängig vom Key kostenlos. Nur der LLM-Analyseschritt verbraucht API-Guthaben, mit 0,005 bis 0,015 USD pro Analyse.

Der Coach-Modus ist begrenzt: Er schickt bei jedem Zug deinen kompletten Gesprächsverlauf mit, längere Sessions kosten also mehr. Eine Session mit 15 Zügen kostet spürbar mehr als eine, die in 6 zu einem Entwurf kommt.

Was macht ein OKR schlecht?

Das verlässlichste Signal sind Key Results, die Arbeit statt Ergebnisse beschreiben. "Das Onboarding-Redesign launchen", "Auf die neue Plattform migrieren", "User Research abschließen": Das sind Aufgaben. Sie gehören in ein Sprint-Backlog. Ein KR sollte beschreiben, was sich für einen echten Menschen ändert, nachdem die Arbeit erledigt ist, nicht die Arbeit selbst.

Der zweithäufigste Fehler ist Unschärfe, die als Ambition durchgeht. "Die Kundenzufriedenheit verbessern" klingt wie ein Ziel. Ist es nicht. Ohne Ausgangswert, Zielwert und Datenquelle ist es nur ein Feldname. Eine Rasterprüfung fängt beide Probleme in unter 60 Sekunden ab.

Kann ein Objective messbar sein?

Ja, und das ist ein Zeichen für ein gut geschriebenes Objective. Das OKR-Framework reserviert Zahlen für Key Results, aber es gibt keine Regel gegen ein Objective, das eine konkrete, beobachtbare Bedingung enthält. "Die mediane PR-Durchlaufzeit senken, damit Teams bis Ende Q3 täglich shippen können" ist richtungsweisend und messbar.

Der entscheidende Unterschied liegt im Abstraktionsgrad zwischen Objective und KRs. Das Objective benennt den gewünschten Zustand. Die KRs belegen, dass er erreicht wurde.

Was ist falsch an "launch X" als Key Result?

"Launch X" ist Output-as-KR. Es beschreibt eine Aktion deines Teams, nicht eine Veränderung in der Welt, die geschieht, weil ihr sie unternommen habt. Der Test: Wenn du das KR abschließt und sich für keinen echten Nutzer etwas ändert, ist es kein KR.

Schreib stattdessen das Ergebnis hin. Wenn du ein Self-Service-Abrechnungsportal launchst, könnte das Ergebnis lauten: "Kunden, die ihren Tarif selbst ändern, ohne den Support zu kontaktieren, von 12 % auf 45 %." Jetzt kannst du in Woche 8 erkennen, ob der Launch funktioniert hat.

Eine Frage: Was wird für Nutzer anders sein, nachdem das ausgeliefert ist? Schreib das.

Wie vermeidest du Vanity Metrics?

Benenne den Akteur und die konkrete Handlung. "Engagement um 25 % steigern" scheitert, weil Engagement undefiniert ist. Engagement von was, durch wen, auf welcher Fläche, verglichen mit wann?

Ersetzungstest: Kannst du dir ein plausibles Szenario vorstellen, in dem diese Kennzahl steigt und das Geschäft schlechter wird? Wenn ja, ist es eine Vanity Metric. Seitenaufrufe steigen, wenn du minderwertige Inhalte veröffentlichst. E-Mail-Öffnungsraten steigen, wenn du panikmachende Betreffzeilen verschickst. Tausch sie gegen die Verhaltensänderung, für die sie eigentlich ein Stellvertreter sein sollte: "Blog-Leser, die einen kostenlosen Test starten, von 1,4 % auf 3,2 %."

Warum ist Ambition für ein OKR wichtig?

OKRs, die garantiert gelingen, sind Planning Theatre. Wenn der Zielwert auf einem Niveau liegt, das das Team ohnehin erreicht, treibt das OKR nichts an.

Ambition erzwingt ein Gespräch darüber, was wahr sein müsste. "Die Aktivierungsrate verdreifachen" erfordert, den Onboarding-Funnel neu zu denken. "Aktivierung um 5 % steigern" erlaubt inkrementelles Feintunen. Die Kalibrierungsfrage: Wären wir zufrieden, wenn wir 70 % davon erreichen? Wenn ja, ist der Zielwert wahrscheinlich zu niedrig.

Kann ein Team zu viele OKRs haben?

Ja, und die meisten Teams haben sie. Drei bis fünf Key Results pro Objective sind die praktische Obergrenze. Darüber hinaus ist das Set kein Priorisierungsmechanismus mehr, sondern ein Zusagenkatalog. Wenn alles ein KR ist, ist nichts eins.

Die nützliche Frage: Wenn dieses KR rot wird, lässt das Team alles stehen und liegen, um nachzugehen? Wenn "wir würden es bemerken, aber weitermachen", ist das KR nicht wichtig genug, um im Set zu sein.

Wie oft sollten wir OKRs bewerten?

Wöchentliche Check-ins zum KR-Fortschritt, formales Bewerten zur Halbzeit und am Zyklusende. Der wöchentliche Check ist ein Signal-Check, keine Bewertungsübung. Der Halbzeit-Score entscheidet, ob Umfang, Zielwerte oder Vorgehen angepasst werden.

Der Fehlerfall: Teams, die das Halbzeit-Review überspringen und am Quartalsende feststellen, dass zwei KRs nie messbar waren, weil die Instrumentierung nie gebaut wurde. Ein Check zur Zyklusmitte erzwingt dieses Gespräch in Woche 6 statt in Woche 13.

Ist "7 von 10 erreichen" ein gutes Key Result?

Nein. "7 von 10 erreichen" ist fast immer eine getarnte Vanity Metric oder ein Platzhalter. Erste Frage: 7 von 10 wovon? Wenn es eine NPS-Umfrage oder CSAT ist, könnte das eine echte Kennzahl sein. Wenn es die subjektive Bewertung eines Prozesses durch eine Führungskraft ist, ist es überhaupt keine Kennzahl.

Punktskalen-Werte auf nicht standardisierten Instrumenten sind manipulierbar und nicht handlungsleitend. Wenn du 6,8 statt 7 erreichst, was machst du anders? Der Test: Könnten zwei Teammitglieder diesen Wert unabhängig voneinander anhand derselben Daten bestätigen?

Welchen Score sollte ein gutes OKR tatsächlich erreichen?

Zwei verschiedene Zahlen, und sie werden ständig verwechselt. Dieses Tool bewertet, wie gut das OKR geschrieben ist, auf einer Skala von 0 bis 100. Das ist nicht, wie viel davon du erreichen solltest.

Ein gutes aspirationales OKR ist darauf ausgelegt, bis Quartalsende bei 60 bis 80 Prozent Zielerreichung zu landen. Wenn dein Team jedes Quartal 100 Prozent jedes OKRs erreicht, waren die Zielwerte zu weich. Die Ausnahme ist ein committed OKR, ein Ergebnis, das du wirklich vollständig liefern willst.

Und koppel die OKR-Zielerreichung nie an die Vergütung. Mach das einmal und du siehst nie wieder ein rotes oder gelbes OKR, weil alle still und leise Ziele setzen, die sie ohnehin übertreffen.

Ist das ein OKR oder ein KPI?

Ein KPI ist eine Zahl, die du beobachtest. Ein OKR ist eine Veränderung, die du vorantreibst. "99,9 Prozent Uptime halten" und "NPS über 30 halten" sind KPIs: Steady-State-Kennzahlen ohne Bewegung und ohne Enddatum. Sie gehören auf ein Dashboard, nicht in ein OKR.

Der Hinweis ist das Verb. Halten, beibehalten, sichern, überwachen: Das ist ein KPI. Von X auf Y bis Q3 steigern, von X auf Y senken: Das ist ein OKR. KPIs sagen dir, was passiert; OKRs verändern es.

Wenn du einen KPI in die Diagnose einfügst, sagt der Report das und zeigt dir, wie du ihn als Ergebnis neu fasst.

Aspirational oder committed: welche Art OKR ist das?

Zwei Arten, und sie werden unterschiedlich bewertet. Ein aspirationales OKR ist ein Stretch Goal, ambitioniert per Design und ausgelegt darauf, bei 60 bis 80 Prozent zu landen. Ein committed OKR ist ein Ergebnis, das du zu 100 Prozent erreichen willst, oft für Compliance, Vertragliches oder Launch-Gating-Arbeit.

Der Unterschied zählt für genau ein Kriterium: Ambition. Ein aspirationales OKR, das leicht zu erreichen ist, ist Planning Theatre. Ein committed OKR, das leicht zu erreichen ist, ist einfach eine klare Zusage, und das ist in Ordnung. Nutze den Umschalter über dem Eingabefeld, damit die Diagnose ein committed OKR nicht dafür abstraft, dass es erreichbar ist.

Alles andere, Ergebnisform, Messbarkeit, Klarheit, Frist und Stimmigkeit, ist in beiden Fällen erforderlich.

Bereit, es auszuprobieren?Füg dein OKR ein, bekomm in 60 Sekunden einen Raster-Score.
OKR bewerten