Service-Level-Agreement (SLA)

Ein Service-Level-Agreement – kurz SLA – ist die verbindliche Vereinbarung zwischen Auftraggeber und Dienstleister über die Qualität einer IT-Leistung. Verfügbarkeit, Reaktionszeiten, Eskalationswege: All das wird im SLA messbar definiert. Dieser Leitfaden erklärt, was ein SLA enthält, welche Typen es gibt, wie sich SLAs von OLAs und Wartungsverträgen unterscheiden und worauf KMU und Behörden bei der Verhandlung achten sollten.
Büro mit großer Fensterfront. Ein Mann und zwei Frauen sind beim Business Meeting. Die Frauen schütteln sich die Hand und besiegeln das neue SLA für Softwarewartung.
© Владимир Platon

Was ist ein Service-Level-Agreement?

Ein Service-Level-Agreement (SLA) ist eine formalisierte Vereinbarung, die die Qualität, den Umfang und die Messbarkeit einer Dienstleistung zwischen zwei Parteien definiert. Im IT-Kontext regelt ein SLA typischerweise, welche Leistung ein Dienstleister erbringt, in welcher Qualität und innerhalb welcher Zeitrahmen.

Das Besondere am SLA: Es übersetzt abstrakte Leistungsversprechen in messbare Kennzahlen. Statt „schnelle Reaktion bei Problemen” steht im SLA: „Reaktionszeit bei Priorität 1: maximal 60 Minuten innerhalb der Servicezeiten.” Diese Präzision schafft Verbindlichkeit – und im Streitfall Klarheit.

Aufsführliche Informationen zum Managed Services sind in unserem Leitfaden IT-Service-Management: Prozesse und Best Practices zu finden.

Wofür braucht man ein SLA?

Ein SLA erfüllt drei zentrale Funktionen:

  1. Erwartungsmanagement: Beide Seiten wissen, was vereinbart ist – und was nicht.
  2. Qualitätssicherung: Messbare KPIs machen Leistungsabweichungen sichtbar, bevor sie zum Problem werden.
  3. Vertrauensgrundlage: Ein gutes SLA reduziert Konflikte, weil es Interpretationsspielräume minimiert.

Bestandteile eines SLA

Leistungsbeschreibung

Der erste Abschnitt eines SLA definiert die Dienstleistung: Was genau wird erbracht? Welche Systeme, Anwendungen oder Infrastrukturkomponenten sind abgedeckt? Welche Leistungen sind ausdrücklich ausgeschlossen?

Service Level Objectives (SLOs)

Die SLOs sind das Herzstück. Sie definieren die konkreten Zielwerte für jeden messbaren Parameter:

KPIBeschreibungTypischer Zielwert
VerfügbarkeitAnteil der Zeit, in der das System nutzbar ist99,5 % – 99,99 %
ReaktionszeitZeit bis zur ersten qualifizierten Reaktion15 Min. – 4 Std.
LösungszeitZeit bis zur Fehlerbehebung oder zum Workaround1 Std. – 5 Arbeitstage
Mean Time to Repair (MTTR)Durchschnittliche ReparaturdauerBranchenabhängig
Mean Time Between Failures (MTBF)Durchschnittliche Zeit zwischen AusfällenBranchenabhängig

Was bedeutet 99,9 % Verfügbarkeit?

Die Verfügbarkeitsangabe ist einer der am häufigsten missverstandenen SLA-Werte. Die Unterschiede wirken klein, sind aber erheblich:

VerfügbarkeitMax. Ausfallzeit/MonatMax. Ausfallzeit/Jahr
99,0 %7 Stunden 18 Min.3 Tage 15 Std.
99,5 %3 Stunden 39 Min.1 Tag 19 Std.
99,9 %43 Minuten8 Stunden 46 Min.
99,99 %4 Minuten52 Minuten

Entscheidend ist, was als „Ausfallzeit” zählt: Geplante Wartungsfenster, Teilausfälle und Ausfälle außerhalb der Servicezeiten werden je nach Vertrag unterschiedlich behandelt.

Prioritätsstufen und Eskalation

SLAs staffeln Reaktions- und Lösungszeiten nach Priorität. Eine bewährte Einteilung:

Zu jeder Stufe gehört eine Eskalationsmatrix: Wer wird nach welcher Frist informiert, wenn die vereinbarte Reaktionszeit überschritten wird?

Reporting und Messung

Ein SLA ohne Messung ist wertlos. Der Vertrag sollte regeln:

Konsequenzen bei Nichteinhaltung

SLAs enthalten in der Regel Regelungen für den Fall, dass Zielwerte nicht erreicht werden:

SLA-Typen

Kundenbasiertes SLA

Deckt alle Services ab, die ein bestimmter Kunde nutzt. Vorteil: Ein einziges Dokument regelt die gesamte Geschäftsbeziehung. Dieses Modell ist häufig bei KMU, die einen IT-Dienstleister für mehrere Leistungen beauftragen.

Servicebasiertes SLA

Definiert die Leistungsqualität für einen bestimmten Service – unabhängig davon, wer ihn nutzt. Beispiel: Ein SLA für das E-Mail-System gilt für alle Nutzer im Unternehmen gleichermaßen. Typisch für Enterprise-Umgebungen mit standardisierten IT-Services.

Mehrstufiges SLA (Multi-Level)

Kombiniert verschiedene Ebenen: Ein unternehmensweites Basis-SLA, ergänzt durch kunden- oder servicespezifische Vereinbarungen. Dieses Modell eignet sich für große Organisationen mit heterogenen Anforderungen.

Abgrenzung: SLA, OLA und Wartungsvertrag

SLAOLAWartungsvertrag
ParteienAuftraggeber ↔ DienstleisterInterne Abteilungen untereinanderAuftraggeber ↔ Dienstleister
FokusQualitätszusagen für den KundenInterne LeistungszusagenTechnische Instandhaltung
InhaltKPIs, Reaktionszeiten, PenaltiesInterne Prozesse und ZuständigkeitenUpdates, Patches, Monitoring
VerbindlichkeitVertraglich bindendOrganisatorisch bindendVertraglich bindend

Ein Wartungsvertrag definiert den Leistungsumfang (was wird gewartet?), das SLA definiert die Qualität (wie gut wird gewartet?). In der Praxis ist das SLA oft ein Bestandteil oder eine Anlage des Wartungsvertrags.

Ein Operational Level Agreement (OLA) regelt interne Vereinbarungen: Wie schnell liefert die Netzwerkabteilung dem Helpdesk die Informationen, die dieser braucht, um das SLA gegenüber dem Kunden einzuhalten?

SLA-Verhandlung: Tipps für die Praxis

Für KMU

Für Enterprise

Für Behörden

Weiterführende Informationen

FAQs

Was bedeutet 99,9% Verfügbarkeit in einem SLA – und wie viel Ausfallzeit ist das? keyboard_arrow_down keyboard_arrow_up
99,9% Verfügbarkeit bedeutet, dass das System maximal 43 Minuten pro Monat ausfallen darf (oder 8 Stunden 46 Minuten pro Jahr). Das klingt viel, aber in der Praxis ist es eine hohe Anforderung. Zum Vergleich: 99,5% erlaubt 3 Stunden 39 Minuten pro Monat. Die meisten KMU sind gut mit 99,5% bedient, während kritische Infrastrukturen 99,95% oder höher anstreben.
Reaktionszeit vs. Lösungszeit: Was ist der Unterschied? keyboard_arrow_down keyboard_arrow_up
Die Reaktionszeit ist die Zeit bis zur ersten Rückmeldung durch den Support. Das kann auch eine Bestätigung sein: 'Wir haben das Problem erhalten und arbeiten daran.' Die Lösungszeit ist der Zeitraum bis zur tatsächlichen Fehlerbehebung oder bis ein funktionsfähiger Workaround bereitgestellt wird. Reaktionszeiten sind typischerweise kurz (Minuten bis Stunden), Lösungszeiten können länger sein (Stunden bis Tage).
Wie wird ein SLA gemessen und überprüft? keyboard_arrow_down keyboard_arrow_up
SLA-Messung erfolgt automatisiert über Monitoring-Tools und Ticketsysteme. Die wichtigsten KPIs sind: Verfügbarkeit (Betriebszeit in %), Reaktionszeit (Zeit bis erste Antwort), Lösungszeit (Zeit bis Behebung). Regelmäßige Reports – meist monatlich oder quartalsweise – dokumentieren die Einhaltung. Wenn SLA-Ziele unterschritten werden, können Service Credits (Gutschriften) fällig werden. Transparente Dashboards erlauben Kunden, jederzeit den aktuellen Status zu prüfen.