Die 80%-Falle – Warum hohe Auslastung Ihren Service Desk ruiniert

95% Auslastung. In einem Management-Report klingt das nach Effizienz. Jeder Agent arbeitet fast ununterbrochen, keine Leerlaufzeiten, maximale Produktivität. Die Personalkostenquote ist optimiert. Der CFO nickt zufrieden.

Die Mathematik sagt: Sie haben ein Problem. Ein großes.

Die Intuition und warum sie trügt

Der Instinkt ist nachvollziehbar: Wenn ein Agent nur zu 50% ausgelastet ist, "verschwendet" man die Hälfte der bezahlten Arbeitszeit. Also sollte man die Auslastung steigern – 70%, 80%, 90%. Je höher, desto besser. Mehr Output pro investiertem Euro.

Diese Logik funktioniert bei Maschinen, die deterministisch arbeiten. Ein Fließband, das exakt alle 60 Sekunden ein Werkstück ausspuckt, kann nahe 100% Auslastung laufen, ohne dass etwas passiert.

Ein Service Desk ist kein Fließband. Tickets kommen nicht im Minutentakt, sondern in Wellen. Manche dauern 10 Minuten, andere 4 Stunden. Manche kommen Montagmorgen um 8, andere Freitagnachmittag um 16:30. Diese Variabilität – in Ankunftszeiten und Bearbeitungszeiten – verändert das Bild fundamental.

Die Kingman-Formel: V × U × T

1961 leitete der britische Mathematiker John Kingman eine Approximation für die erwartete Wartezeit in einer Queue ab. Vereinfacht lässt sie sich schreiben als:

Die drei Faktoren:

V (Variability) – ein Maß für die Schwankungsbreite bei Ankunftszeiten und Bearbeitungszeiten. Je unregelmäßiger die Tickets kommen und je unterschiedlicher ihre Bearbeitungszeit, desto größer V.
U (Utilization) – der Auslastungsfaktor, wobei ρ die Auslastung ist (Anteil der genutzten Kapazität an der verfügbaren Kapazität). Berechnet als:

T (Time) – die mittlere Bearbeitungszeit pro Ticket.

Die Wartezeit ist das Produkt dieser drei Faktoren. Jeder einzelne kann sie in die Höhe treiben. Aber einer davon hat eine besondere Eigenschaft.

Der Auslastungsfaktor: Eine Hyperbel

Der Faktor U = ρ / (1 − ρ) verhält sich nicht linear. Er ist eine Hyperbel – und das verändert alles:

| Auslastung (ρ) | Auslastungsfaktor (U) | Interpretation | |---|---|---| | 50% | 1,0 | Basis | | 60% | 1,5 | +50% gegenüber Basis | | 70% | 2,3 | Noch moderat | | 80% | 4,0 | 4× Basis | | 85% | 5,7 | Spürbar | | 90% | 9,0 | 9× Basis | | 95% | 19,0 | 19× Basis | | 99% | 99,0 | 99× Basis |

Lesen Sie die Tabelle langsam. Der Sprung von 80% auf 90% Auslastung erhöht den Faktor nicht um 12,5% (wie die lineare Intuition vermuten lässt), sondern um 125% – von 4 auf 9. Der Sprung von 90% auf 95% verdoppelt ihn nochmals.

Ein Beispiel: Gleiches Team, gleiche Tickets

Nehmen wir ein 2nd-Level-Team mit 5 Agents. Im Durchschnitt dauert ein Ticket 45 Minuten Bearbeitungszeit (T = 0,75 h). Die Variabilität ist moderat (V = 2, typisch für einen Service Desk mit gemischten Ticket-Typen).

Gleiche Agents. Gleiche Tickets. Gleiche Bearbeitungszeit. Aber die Auslastung ist um 20 Prozentpunkte gestiegen – und die Wartezeit hat sich fast vervierfacht. Von einem halben Arbeitstag auf fast zwei volle Arbeitstage.

Für den Endanwender bedeutet das: Statt am selben Tag eine Antwort zu bekommen, wartet er bis übermorgen. Nicht weil jemand langsamer arbeitet, sondern weil das System voller ist.

Variabilität als Multiplikator

Der Faktor V in der Kingman-Formel misst die Schwankungsbreite – technisch den Variationskoeffizienten von Ankunfts- und Bearbeitungszeiten.

In einem Service Desk mit homogenen Tickets (z.B. nur Passwort-Resets, alle ungefähr gleich lang) ist V niedrig. Die Wartezeiten bleiben auch bei höherer Auslastung einigermaßen kontrollierbar.

In einem Service Desk mit heterogenen Tickets – einem Mix aus 5-Minuten-Standardfällen und mehrstündigen Infrastrukturproblemen – ist V hoch. Und hohe Variabilität verschiebt die gesamte Kurve: Der "Kniepunkt", ab dem die Wartezeiten spürbar steigen, kommt früher. Was bei niedriger Variabilität erst bei 85% Auslastung passiert, kann bei hoher Variabilität schon bei 70% einsetzen.

Das ist relevant, weil die meisten Service Desks genau diesen Mix haben. Der Variationskoeffizient ist selten unter 1,0 – und bei Teams, die sowohl einfache als auch komplexe Tickets bearbeiten, oft deutlich darüber.

Die Todesspirale

Hohe Auslastung erzeugt nicht nur längere Wartezeiten. Sie erzeugt auch Folgeeffekte, die die Situation weiter verschlechtern:

Mehr Rückfragen. Wenn ein Endanwender zwei Tage auf eine Antwort wartet, fragt er nach. Die Nachfrage erzeugt ein neues Ticket oder einen Eintrag im bestehenden Ticket. In beiden Fällen: zusätzliche Arbeit für das bereits überlastete Team.

Mehr Fehler. Unter Druck steigt die Fehlerquote. Tickets werden mit unvollständigen Lösungen geschlossen. Der Endanwender meldet das Problem erneut. Das Ticket kommt zurück – als Reopening oder als neues Ticket. Wie in unserem Artikel zum Ticket-Ping-Pong beschrieben: Jedes ungenau gelöste Ticket generiert im Schnitt 1,3 Folgekontakte.

Weniger Puffer für Spitzen. Bei 70% Auslastung kann ein Team eine Montagmorgen-Welle auffangen, ohne dass die Wartezeiten dramatisch steigen. Bei 92% Auslastung gibt es keinen Puffer mehr – jede kleine Spitze treibt das System in den überlasteten Bereich.

Höherer Krankenstand. Chronisch überlastete Teams haben höhere Ausfallraten. Jeder Ausfall erhöht die Auslastung der verbleibenden Agents weiter. Eine Abwärtsspirale.

Das Ergebnis: Ein System, das sich selbst verschlechtert. Jedes Prozent zusätzliche Auslastung erzeugt nicht nur proportional mehr Wartezeit, sondern auch Folgeeffekte, die die Auslastung weiter erhöhen. Die Kingman-Formel beschreibt den statischen Zusammenhang – die Todesspirale ist der dynamische Effekt.

Der Kapazitätspuffer ist kein Luxus

Aus der Kingman-Formel folgt eine unbequeme Erkenntnis: Ein gut funktionierender Service Desk braucht freie Kapazität. Nicht als Luxus, sondern als Systemvoraussetzung.

Die üblichen Empfehlungen aus der Warteschlangentheorie und dem Erlang-C-Modell konvergieren auf einen Zielkorridor: 70–80% Auslastung für Service-Desk-Teams. Das sind keine willkürlichen Zahlen – es ist der Bereich, in dem die Wartezeiten noch kontrollierbar sind und gleichzeitig genug Puffer für Variabilität und Spitzen existiert.

"Aber 20–30% ungenutzter Kapazität – das ist doch Verschwendung!"

Nein. Es ist Reaktionsfähigkeit. In einem System mit Variabilität – und jeder Service Desk hat Variabilität – ist der Puffer das, was den Unterschied zwischen "funktioniert" und "kollabiert" ausmacht. Wer diesen Puffer wegoptimiert, gewinnt kurzfristig Effizienz und verliert mittelfristig den Service Level.

Drei Hebel gegen die Auslastungsfalle

Die Kingman-Formel zeigt drei Ansatzpunkte:

1. Auslastung senken (U reduzieren) Nicht durch Leerlauf, sondern durch bewusste Kapazitätsplanung. Wenn ein Team dauerhaft über 85% liegt, ist das ein Signal – nicht für gute Arbeit, sondern für ein Systemrisiko. In unserem Artikel über strukturelle Engpässe zeigen wir, wie man erkennt, ob ein Team tatsächlich an der Kapazitätsgrenze arbeitet.

2. Variabilität senken (V reduzieren) Gleichmäßigere Ticket-Verteilung über den Tag (statt Montagmorgen-Spitzen). Besseres Routing, sodass Teams homogenere Tickets bekommen. Separation von einfachen und komplexen Tickets in verschiedene Queues. Jede Maßnahme, die den Mix homogener macht, senkt V – und damit die Wartezeit.

3. Bearbeitungszeit senken (T reduzieren) Automation von Standardfällen, bessere Knowledge-Base-Artikel, Vorlagen für häufige Lösungen. Jede Minute weniger Bearbeitungszeit wirkt direkt auf die Wartezeit – aber nur linear, nicht exponentiell wie die Auslastung.

Von den drei Hebeln ist die Auslastung der mächtigste – weil er exponentiell wirkt. Variabilität und Bearbeitungszeit wirken linear. Ein Team, das seine Auslastung von 90% auf 80% senkt, gewinnt mehr als ein Team, das seine Bearbeitungszeit um 10% reduziert.

Keine Empfehlung für Unterauslastung

Dieser Artikel argumentiert nicht für Ineffizienz. Ein Team bei 40% Auslastung hat ein anderes Problem – möglicherweise zu viel Personal für das aktuelle Volumen, oder die Tickets werden zu zögerlich zugewiesen.

Das Argument ist ein anderes: Es gibt einen optimalen Bereich. Darunter verschwendet man Kapazität. Darüber zerstört man Reaktionsfähigkeit. Die Kingman-Formel zeigt, wo die Grenze liegt – und dass sie nicht bei 95% liegt, sondern deutlich darunter.

Die Kunst der Kapazitätsplanung ist nicht Maximierung, sondern Balancierung.

Zusammenfassung

Die Kingman-Formel zeigt einen nicht-linearen Zusammenhang zwischen Auslastung und Wartezeit. Ab etwa 80% Auslastung steigen die Wartezeiten exponentiell – bei 90% sind sie bereits 9× so hoch wie bei 50%. Ein funktionierender Service Desk braucht bewusste Kapazitätspuffer von 20–30%, um Variabilität, Spitzen und Fehlerfolgen abzufangen. "Auslastung maximieren" ist kein Effizienz-Gewinn, sondern ein Systemrisiko.

Weiterführende Quellen

Kingman, J.F.C. (1961): "The single server queue in heavy traffic". Mathematical Proceedings of the Cambridge Philosophical Society, 57(4), 902–904.
Hopp, W.J. & Spearman, M.L. (2011): Factory Physics. 3. Aufl., Waveland Press. (Kap. 8: Variability)
Erlang, A.K. (1917): "Solution of some problems in the theory of probabilities of significance in automatic telephone exchanges". The Post Office Electrical Engineers' Journal, 10, 189–197.
Reinersten, D.G. (2009): The Principles of Product Development Flow. Celeritas Publishing.

Dieses Thema vertiefen: Kapazitätsengpass erkennen: Wenn Teams mehr bekommen als sie schaffen

Solche Muster automatisch erkennen?

Process Radar analysiert Ihre ITSM-Daten und zeigt strukturelle Probleme — ohne manuelles Reporting.

Zugang anfragen