Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Phase 1: Ziele setzen
Stellen Sie sich vor, Ihr Team befindet sich im Endspurt vor einer großen Produkteinführung. Die neuen Funktionen sind wegweisend und die Begeisterung der Anleger nimmt zu. Dann, während einer routinemäßigen Bereitstellung, fällt Ihr Hauptdienst aus. Wenn Kundenbeschwerden Ihre E-Mails überfluten, werden zwei Fragen schmerzlich deutlich: Wie lange können Sie es sich leisten, offline zu sein? Welche Daten können Sie sich leisten zu verlieren?
Zu hoffen, dass alles gut funktioniert, ist keine gute Strategie. Sie benötigen eine systematische Methode, um zu entscheiden, wo Resilienz am wichtigsten ist und wo nicht. An dieser Stelle wird eine Business Impact Analysis (BIA) entscheidend. Sie hilft Ihnen, fundierte Entscheidungen darüber zu treffen, wo Sie in Resilienz investieren sollten. Eine BIA hilft Ihnen zu verstehen, welche Teile Ihres Systems wirklich eine grundsolide Zuverlässigkeit benötigen und welche eine gewisse Flexibilität vertragen können.
Erstellen Sie zunächst einen Überblick über Ihre wichtigsten Benutzererfahrungen. Stellen Sie sich für jede einzelne Frage die folgenden Fragen:
-
Was sind die Auswirkungen, wenn dies gestört wird?
-
Wie schnell müssen wir den Service wiederherstellen?
-
Welche Daten müssen unbedingt geschützt werden?
Dies ist nicht nur eine technische Übung, sondern hilft Ihnen, die geschäftlichen Auswirkungen von Zuverlässigkeitsproblemen zu verstehen. Umsatzeinbußen sind erst der Anfang. Überlegen Sie, wie Ausfälle das Vertrauen der Kunden untergraben, gesetzliche Anforderungen verletzen oder Wettbewerbern einen Vorteil verschaffen könnten.
Aus dieser Analyse leiten Sie zwei wichtige Zahlen für jede Benutzererfahrung ab: Recovery Time Objective (RTO) und Recovery Point Objective (RPO). RTO definiert, wie schnell Sie diese Reise wiederherstellen müssen. RPO definiert, wie viel Datenverlust Ihre Kunden tolerieren können. Diese geschäftsorientierten Ziele bestimmen dann, welche Komponenten Sie wählen und wie Sie sie gestalten, ohne jeden Teil des Systems zu überarbeiten.
Das Schöne an diesem Ansatz ist, dass er Ihnen hilft, Ihre begrenzten Ressourcen dort zu konzentrieren, wo sie am wichtigsten sind. Vielleicht erfordert Ihre zentrale Transaktionsverarbeitung eine nahezu sofortige Wiederherstellung und keinen Datenverlust, aber Ihre Empfehlungsmaschine kann längere Ausfallzeiten tolerieren. Indem Sie sich klare Ziele setzen, schaffen Sie ein Framework, das es Ihnen ermöglicht, die schnelle Entwicklung von Funktionen fortzusetzen und gleichzeitig strategisch die Widerstandsfähigkeit zu erhöhen.
Dokumentieren Sie diese Ziele klar und deutlich. Sie sind nicht nur für Ihr Entwicklungsteam bestimmt. Wenn Sie Unternehmenskunden ansprechen oder mit Investoren eine technische Due Diligence durchführen, zeigt diese Dokumentation, dass Sie kritisch über Geschäftskontinuität nachgedacht haben.
Diese Ziele entwickeln sich, wenn Ihr Startup wächst. Die Resilienzanforderungen Ihrer ersten tausend Benutzer unterscheiden sich von denen Ihres ersten Unternehmenskunden. Beginnen Sie mit Zielen, die Sie heute realistischerweise erreichen können, planen Sie jedoch, wie sie sich bei der Skalierung verschärfen werden.
In diesem Leitfaden wird untersucht, wie Sie Resilienzmaßnahmen umsetzen können, um diese Ziele zu erreichen. Die Festlegung dieser Ziele ist Ihr entscheidender erster Schritt. Sie sind Ihr Kompass zur Bewältigung des ständigen Spannungsfeldes zwischen Innovation und Stabilität und helfen Ihnen dabei, ein System aufzubauen, das Ihren Kunden zuverlässig einen Mehrwert bietet.