Operative Exzellenz
Operative Exzellenz (OE) beinhaltet die Verpflichtung, Software korrekt zu entwickeln und dabei durchgehend ein hervorragendes Kundenerlebnis zu bieten. Dies umfasst bewährte Methoden für die Organisation Ihres Teams, die Gestaltung Ihres Workloads, den Betrieb in großem Maßstab und die Weiterentwicklung im Laufe der Zeit.
Ziel operativer Exzellenz ist es, neue Funktionen und Fehlerkorrekturen schnell und zuverlässig in die Hände der Kunden zu geben. Organisationen, die in operative Exzellenz investieren, stellen ihre Kunden durchweg bei der Entwicklung neuer Features, Vornahme von Änderungen und beim Umgang mit Ausfällen zufrieden. Auf dem Weg dorthin unterstützt die operative Exzellenz die Continuous Integration und Continuous Delivery (CI/CD) (kontinuierliche Integration und kontinuierliche Bereitstellung), indem sie Entwickler dabei unterstützt, durchgängig qualitativ hochwertige Ergebnisse zu erzielen.
Designprinzipien
Nachfolgend finden Sie die konzeptionellen Grundsätze für operative Exzellenz in der Cloud:
-
Organisieren von Teams nach Geschäftsergebnissen: Die Fähigkeit eines Teams, Geschäftsergebnisse zu erzielen, hängt von der Vision der Führung, effektiven Abläufen und einem geschäftsorientierten Betriebsmodell ab. Die Führungskräfte sollten sich voll und ganz für eine CloudOps-Transformation mit einem geeigneten Cloud-Betriebsmodell einsetzen, das die Teams dazu anregt, möglichst effizient zu arbeiten und Geschäftsergebnisse zu erzielen. Ein geeignetes Betriebsmodell nutzt Personal-, Prozess- und Technologiekapazitäten, um zu skalieren, die Produktivität zu optimieren und durch Agilität, Reaktionsfähigkeit und Anpassung einen Wettbewerbsvorteil zu erlangen. Die langfristige Vision der Organisation wird in Ziele umgesetzt, die Stakeholdern und Verbrauchern Ihrer Cloud-Services unternehmensweit vermittelt werden. Ziele und operative KPIs sind auf allen Ebenen aufeinander abgestimmt. Diese Vorgehensweise sorgt dafür, dass der langfristige Mehrwert, der sich aus der Umsetzung der folgenden Gestaltungsprinzipien ergibt, dauerhaft gewährleistet ist.
-
Implementieren von Beobachtbarkeit für umsetzbare Erkenntnisse: Verschaffen Sie sich einen umfassenden Überblick über das Verhalten, die Leistung, die Zuverlässigkeit, die Kosten und den Zustand von Workloads. Legen Sie wichtige Key Performance Indicators (KPIs, Leistungskennzahlen) fest und nutzen Sie die Telemetrie der Beobachtbarkeit, um fundierte Entscheidungen zu treffen und sofort einzugreifen, wenn die Geschäftsergebnisse gefährdet sind. Verbessern Sie proaktiv Leistung, Zuverlässigkeit und Kosten auf der Grundlage von verwertbaren Daten zur Beobachtbarkeit.
-
Sichere Automatisierung wo möglich: In der Cloud können Sie die gleichen technischen Vorgehensweisen wie beim Anwendungscode in Ihrer gesamten Umgebung anwenden. Sie können Ihre gesamte Workload und deren Betrieb (Anwendungen, Infrastruktur, Konfiguration und Verfahren) als Code definieren und aktualisieren. Anschließend können Sie den Betrieb Ihrer Workloads automatisieren, indem Sie sie als Reaktion auf Ereignisse initiieren. In der Cloud können Sie Automatisierungssicherheit einsetzen, indem Sie einen Integritätsschutz wie Ratenkontrolle, Fehlerschwellenwerte und Genehmigungen einrichten. Durch eine effektive Automatisierung können Sie konsistente Reaktionen auf Ereignisse durchsetzen, menschliche Fehler begrenzen und den Arbeitsaufwand der Mitarbeiter reduzieren.
-
Vornehmen kleiner, häufiger und umkehrbarer Änderungen: Entwerfen Sie skalierbare und lose verkoppelte Workloads, sodass Komponenten regelmäßig aktualisiert werden können. Automatisierte Bereitstellungstechniken in Verbindung mit kleineren, inkrementellen Änderungen verringern den „Blast Radius“ und ermöglichen eine schnellere Umkehrung bei Fehlern. Dadurch erhöht sich das Vertrauen, vorteilhafte Änderungen an Ihrer Workload vornehmen zu können, während die Qualität erhalten bleibt und Sie sich schnell an veränderte Marktbedingungen anpassen können.
-
Betriebliche Verfahren regelmäßig nachbessern: Wenn Sie Ihre Workloads weiterentwickeln, passen Sie auch Ihre Betriebsabläufe entsprechend an. Suchen Sie beim Einsatz betrieblicher Verfahren nach Möglichkeiten, diese zu verbessern. Führen Sie regelmäßige Überprüfungen durch und vergewissern Sie sich, dass alle Verfahren effektiv sind und dass die Teams mit ihnen vertraut sind. Wenn Lücken festgestellt werden, aktualisieren Sie die Verfahren entsprechend. Informieren Sie alle Beteiligten und Teams über Aktualisierungen der Verfahren. Gamifizieren Sie Ihren Betrieb zum Weitergeben von bewährten Methoden und zur Schulung von Teams.
-
Fehlern vorbeugen: Maximieren Sie den betrieblichen Erfolg, indem Sie Ausfallszenarien entwickeln, um das Risikoprofil der Workload und ihre Auswirkungen auf Ihre Geschäftsergebnisse zu verstehen. Testen Sie die Wirksamkeit Ihrer Verfahren und die Reaktion Ihres Teams auf diese simulierten Fehler. Treffen Sie fundierte Entscheidungen, um offene Risiken zu auszuräumen, die anhand Ihrer Tests identifiziert wurden.
-
Aus allen betrieblichen Ereignissen und Metriken lernen: Ziehen Sie aus allen betrieblichen Zwischenfällen und Ausfällen entsprechende Lehren und treiben Sie geeignete Verbesserungen voran. Geben Sie Ihre Erkenntnisse an alle Teams in Ihrer gesamten Organisation weiter. Die Erkenntnisse sollten Daten und Anekdoten enthalten, wie die Betriebsabläufe zu den Geschäftsergebnissen beitragen.
-
Verwaltete Services verwenden: Verringern Sie die operative Belastung, indem Sie verwaltete AWS-Services nutzen, wo immer dies möglich ist. Erstellen Sie operative Verfahren für die Interaktion mit diesen Services.
Definition
Die bewährten Methoden für betriebliche Exzellenz in der Cloud lassen sich in vier Bereiche einteilen:
-
Organisation
-
Vorbereitung
-
Betrieb
-
Weiterentwicklung
Die Leitung Ihrer Organisation definiert Geschäftsziele. Anforderungen und Prioritäten müssen in Ihrer Organisation bekannt sein, damit Aufgaben entsprechend organisiert und durchgeführt und die Geschäftsergebnisse erreicht werden können. Ihre Workload muss die Informationen ausgeben, die für die Unterstützung dessen erforderlich sind. Die Implementierung von Services zur Integration, Bereitstellung und Lieferung Ihrer Workload schafft einen erhöhten Fluss nützlicher Änderungen in die Produktion, indem wiederkehrende Prozesse automatisiert werden.
Es kann Risiken im Zusammenhang mit dem Betrieb Ihrer Workload geben. Sie müssen diese Risiken verstehen und eine fundierte Entscheidung dazu treffen, ob der Übergang in die Produktion vollzogen werden sollte. Ihre Teams müssen in der Lage sein, Ihre Workload zu unterstützen. Geschäfts- und Betriebsmetriken, die von den gewünschten Geschäftsergebnissen abgeleitet werden, helfen Ihnen, den Zustand Ihrer Workload und Ihrer Betriebsaktivitäten nachzuvollziehen und auf Vorfälle zu reagieren. Ihre Prioritäten ändern sich, wenn sich Ihre geschäftlichen Anforderungen und die geschäftliche Umgebung ändern. Verwenden Sie diese als Feedback-Schleife, um Ihre Organisation und den Betrieb Ihrer Workload kontinuierlich zu verbessern.