

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Säule „Operational Excellence“
<a name="operational-excellence"></a>

Die Säule [Operational Excellence](https://docs.aws.amazon.com/wellarchitected/latest/framework/operational-excellence.html) des AWS Well-Architected Framework konzentriert sich auf den Betrieb und die Überwachung von Systemen sowie die kontinuierliche Verbesserung von Prozessen und Verfahren, um einen Mehrwert für das Unternehmen zu erzielen. Zur Säule der operativen Exzellenz gehört die Fähigkeit, die Entwicklung zu unterstützen und Workloads effektiv auszuführen sowie Einblicke in deren Betrieb zu gewinnen.

Sie können die betriebliche Komplexität reduzieren, indem Sie Workloads automatisch reparieren, wodurch die meisten Probleme ohne menschliches Eingreifen erkannt und behoben werden. Um dieses Ziel zu erreichen, folgen Sie den in diesem Abschnitt beschriebenen bewährten Methoden. Verwenden Sie [ CloudWatchAmazon-Metriken](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) für Amazon Timestream for InfluxDB, den nativen InfluxDB-Metriken-Endpunkt, und Mechanismen, um zu reagieren APIs, wenn Ihre Arbeitslast vom erwarteten Verhalten abweicht.

Diese Diskussion über den Pfeiler Operational Excellence konzentriert sich auf die folgenden Schlüsselbereiche:
+ Infrastructure as Code (IaC)
+ Änderungsmanagement
+ Strategien zur Resilienz
+ Vorfallmanagement
+ Protokollierung und Überwachung zu Prüfungszwecken

## Automatisieren Sie die Bereitstellung mithilfe eines IaC-Ansatzes
<a name="iac"></a>

Zu den bewährten Methoden für die Automatisierung der Bereitstellung auf Timestream for InfluxDB mithilfe von IaC gehören:
+ Wenden Sie IaC an, um Timestream für InfluxDB bereitzustellen, wann immer dies möglich ist. Verwenden Sie für eine konsistente Umgebungskonfiguration eine [AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html)Vorlage oder [HashiCorp Terraform [AWS Cloud Development Kit (AWS CDK)](https://docs.aws.amazon.com/cdk/v2/guide/home.html)](https://aws.amazon.com/blogs/apn/terraform-beyond-the-basics-with-aws/), um alle erforderlichen Ressourcen für Ihre Instanz zu erstellen.
+ Automatisieren Sie Timestream für InfluxDB-Betriebsabläufe, wie z. B. die Größenänderung von Instanzen.
+ Verwenden Sie Tags, um Ihrem Timestream für InfluxDB-Ressourcen Metadaten hinzuzufügen und die Nutzung anhand von Tags zu verfolgen. Weitere Informationen finden Sie unter [Amazon Timestream for InfluxDB taggen](https://docs.aws.amazon.com/timestream/latest/developerguide/tagging-keyspaces-influxdb.html).

## Nehmen Sie häufige, kleine, umkehrbare Änderungen vor
<a name="change-management"></a>

Die folgenden Empfehlungen konzentrieren sich auf kleine, umkehrbare Änderungen, um die Komplexität zu minimieren und die Wahrscheinlichkeit einer Unterbrechung der Arbeitslast zu verringern:
+ Speichern Sie IaC-Vorlagen und -Skripts in einem Quellcodeverwaltungsdienst, z. B. oder. GitHub GitLab Speichern Sie keine AWS Anmeldeinformationen in der Quellcodeverwaltung.
+ Erfordern Sie, dass IaC-Bereitstellungen einen CI/CD-Dienst (Continuous Integration and Continuous Delivery) verwenden, z. B. oder. [AWS CodeDeploy[AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html)](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) Diese Dienste kompilieren, testen und implementieren Code in einer Nicht-Produktionsumgebung, die eine kurzlebige InfluxDB-Instance enthält, bevor sie sich auf Ihre InfluxDB-Produktionsinstanz auswirken.
+ Testen Sie Infrastruktur- und Anwendungsabfragen in einer niedrigeren Umgebung, bevor Sie sie in der Produktion einsetzen. Dadurch wird die Wahrscheinlichkeit einer Unterbrechung minimiert und es wird sichergestellt, dass sie Ihrer Arbeitslast und Skalierung gerecht werden.

## Rechnen Sie mit Ausfällen
<a name="resilience"></a>

Eine selbstreparierende Infrastruktur ist ein Beispiel für betriebliche Exzellenz, da sie Ausfälle antizipiert und versucht, Probleme ohne Eingreifen zu lösen. Die folgenden Empfehlungen helfen Ihnen dabei, diese Reife mit Timestream for InfluxDB zu erreichen:
+ Verwenden Sie Metriken, um Ihre Arbeitsspeicher-, CPU- und Speichernutzung zu überwachen. Sie können CloudWatch so einrichten, dass Sie benachrichtigt werden, wenn sich Nutzungsmuster ändern oder wenn die Kapazität Ihrer Bereitstellung fast erreicht ist. Auf diese Weise können Sie leichter die Leistung und Verfügbarkeit des Systems wahren.
+ Skalieren Sie Ihre DB-Instance, wenn Sie sich dem Ressourcenlimit nähern. Sie sollten etwas Puffer in Speicher und Arbeitsspeicher haben, um unvorhergesehene Nachfragesteigerungen seitens Ihrer Anwendungen bewältigen zu können.
+ Wenn Ihre Datenbank-Arbeitslast mehr erfordert, I/O als Sie bereitgestellt haben, wird die Wiederherstellung nach einem Failover oder Datenbankausfall langsam sein. Um die Kapazität zu erhöhen. I/O capacity of a DB instance, migrate to a different DB instance that has higher I/O
+ Wenn Ihre Client-Anwendung die DNS-Daten Ihrer DB-Instances zwischenspeichert, legen Sie einen time-to-live (TTL) -Wert von weniger als 30 Sekunden fest. Die zugrunde liegende IP-Adresse einer DB-Instance kann sich nach einem Failover ändern. Das Zwischenspeichern der DNS-Daten über einen längeren Zeitraum kann zu Verbindungsausfällen führen. Ihre Anwendung versucht möglicherweise, eine Verbindung zu einer IP-Adresse herzustellen, die nicht mehr in Betrieb ist.
+ Wenn Ihre Anwendung einen kompletten AWS-Region Ausfall überstehen muss, sollten Sie im Rahmen Ihrer Disaster Recovery (DR) -Pläne die Einrichtung einer Replikation oder das Schreiben in eine andere Region in Erwägung ziehen. Machen Sie sich bei der Einrichtung der Replikation mit den Einschränkungen vertraut. Weitere Informationen zur Replikation finden Sie in der [InfluxDB-Dokumentation](https://docs.influxdata.com/influxdb/cloud/write-data/replication/replicate-data/).

## Lernen Sie aus allen Betriebsausfällen
<a name="incident-management"></a>

Eine Infrastruktur zur Selbstheilung ist ein langfristiges Projekt, das Sie in Iterationen entwickeln, wenn seltene Probleme auftreten oder die Reaktionen nicht so effektiv sind, wie Sie es sich wünschen. Wenden Sie die folgenden Methoden an, um sich auf das Erreichen einer Infrastruktur mit Selbstheilung zu konzentrieren:
+ Treiben Sie Verbesserungen voran, indem Sie aus allen Fehlern lernen.
+ Teilen Sie das Gelernte mit den Teams und der Organisation. Wenn mehrere Teams innerhalb einer Organisation Timestream for InfluxDB verwenden, erstellen Sie einen gemeinsamen Chatroom oder eine Benutzergruppe, um Erfahrungen und bewährte Verfahren auszutauschen.

## Verwenden Sie Protokollierungsfunktionen, um unbefugte oder ungewöhnliche Aktivitäten zu überwachen
<a name="logging-monitoring"></a>

Beachten Sie die folgenden Methoden, um ungewöhnliche Leistungs- und Aktivitätsmuster zu beobachten:
+ Aktivieren [Sie die Protokollzustellung](https://docs.aws.amazon.com/timestream/latest/developerguide/timestream-for-influx-managing-view-influx-logs.html), um InfluxDB-Protokolle in [Amazon Simple Storage Service (Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html)) zu speichern. InfluxDB-Protokolle zeichnen Informationen auf, mit deren Hilfe Folgendes überprüft werden kann:
  + [API-Ereignisse auf Datenebene](https://docs.influxdata.com/influxdb/v2/reference/api/)
  + Reaktionszeiten
  + Einzelheiten zur Verdichtung
  + Alle kritischen Fehler oder Warnungen, auf die das System gestoßen ist

  Überprüfen Sie die Protokolle auf unbefugten Zugriff oder Anomalien. Insgesamt liefert die Protokollierung Diagnoseinformationen für die Fehlerbehebung.
+ Timestream for InfluxDB unterstützt die Protokollierung von Aktionen auf der Kontrollebene mithilfe von. AWS CloudTrail Weitere Informationen finden Sie unter [Timestream für InfluxDB-API-Aufrufe protokollieren](https://docs.aws.amazon.com/timestream/latest/developerguide/logging-using-cloudtrail-influxdb.html) mit. AWS CloudTrail
+ **Sie können `DiskUtilization` Metriken von **TimeStream/InfluxDB** > < Namespace > in überwachen`CPUUtilization`. `MemoryUtilization`** CloudWatch

[Weitere Informationen finden Sie in der Timestream for InfluxDB-Dokumentation.](https://docs.aws.amazon.com/timestream/latest/developerguide/monitoring-influxdb.html)