Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Stufe 4: Bedienen
Sie haben eine robuste Anwendung entwickelt und getestet. Jetzt hält es die tägliche Realität am Laufen. Aber in einem Startup können Sie nicht alle Operationen verfolgen, und Sie sollten es auch nicht versuchen. Der Schlüssel liegt darin, auf das Wesentliche aufmerksam zu bleiben, ohne zu viele Kennzahlen anzugeben oder Ihr Team zu überlasten.
Beginnen Sie mit der Kundenperspektive. Amazon CloudWatch Synthetics Canaries agieren als automatisierte Kunden. Sie testen kontinuierlich wichtige Benutzererfahrungen. Lassen Sie sie sich anmelden, Käufe mithilfe von Testkonten simulieren oder auf wichtige Funktionen zugreifen, insbesondere zu den geschäftigsten Zeiten. Dies hilft Ihnen, das Kundenerlebnis zu verstehen und Probleme zu catch, bevor es echte Benutzer tun. Wenn ein Frühwarnsystem versagt, wissen Sie sofort, dass aus Kundensicht etwas nicht stimmt.
Bauen Sie auf dieser Grundlage mit einer gezielten Überwachung der unterstützenden Infrastruktur auf. Welche Signale deuten darauf hin, dass es Probleme gibt? Amazon CloudWatch hilft Ihnen bei der Erstellung von Dashboards, die diese Anzeichen verfolgen. Überwachen Sie nicht nur technische Kennzahlen, sondern verknüpfen Sie sie auch mit den Auswirkungen auf Ihr Unternehmen. Beispielsweise ist eine hohe CPU-Auslastung wichtig, aber das liegt daran, dass dadurch das Kundenerlebnis, das Sie mit Canaries verfolgen, beeinträchtigt werden kann.
Als praktischen Ansatz sollten Sie Ihr Monitoring Ihren Kundenerfahrungen zuordnen. Wenn Sie eine Software-as-a-Service (SaaS) -Plattform betreiben, sind Ihnen wahrscheinlich API-Antwortzeiten, Erfolgsraten bei der Authentifizierung und Verfügbarkeit der Kernfunktionen wichtig. Richten Sie Benachrichtigungen ein, die Sie darüber informieren, wenn diese Messwerte abweichen. Seien Sie jedoch wählerisch. Jede Warnung sollte Maßnahmen erfordern. Wenn Ihr Team anfängt, Benachrichtigungen zu ignorieren, weil „es wahrscheinlich nichts ist“, haben Sie zu viele festgelegt oder verfolgen die falschen Kennzahlen.
Leite diese Benachrichtigungen über Tools weiter, die dein Team bereits verwendet. Wenn Ihre Techniker in einer bestimmten Messaging-Anwendung arbeiten, senden Sie Benachrichtigungen an diese. Das Ziel ist eine schnelle Erkennung, ohne dass ein neuer Prozess erstellt werden muss. Wenn eine Warnung ausgelöst wird, sollte Ihr Team genau wissen, was das bedeutet und was dagegen zu tun ist.
Halten Sie Ihre Betriebsdokumentation schlank und praktisch. Speichern Sie Runbooks mit Ihrem Code in der Versionskontrolle, aber denken Sie daran, dass es sich nicht um Romane handelt. Wenn etwas kaputt geht, benötigt Ihr Team klare, umsetzbare Schritte. Jede Warnung sollte mit einem entsprechenden Runbook verknüpft sein, und jedes Runbook sollte drei Fragen beantworten:
-
Was ist kaputt gegangen?
-
Warum ist das wichtig?
-
Wie lässt sich dies beheben?
Implementieren Sie einen einfachen Prozess für das Incident-Management. Sie benötigen keine komplexen Rahmenbedingungen, sondern lediglich klare Definitionen dessen, was einen Vorfall ausmacht und wen Sie anrufen müssen, wenn die Situation eskaliert. Führen Sie Vorfallprotokolle, da diese Ihnen helfen, die Ausfallsicherheit Ihrer Anwendung zu verbessern.
Der Schlüssel liegt darin, den idealen Kompromiss zwischen Wachsamkeit und Aufwand zu finden. Verwenden Sie AWS Tools, um alles zu automatisieren, was Sie können, konzentrieren Sie sich auf die Überwachung von Kennzahlen, die sich auf Kunden auswirken, und sorgen Sie dafür, dass Ihre Prozesse leicht genug sind, um sich mit Ihrem Wachstum weiterzuentwickeln.
Im nächsten Kapitel wird untersucht, wie eine Denkweise der Resilienz gefördert werden kann, ohne dabei auf Geschwindigkeit und Innovation zu verzichten, die Startups so besonders machen. Letzten Endes geht es bei Resilienz genauso um Menschen wie um Technologie.