PERF02-BP05 Nutzen verfügbarer Elastizität von Ressourcen - AWS Well-Architected Framework

PERF02-BP05 Nutzen verfügbarer Elastizität von Ressourcen

Die Cloud bietet Ihnen die Flexibilität, Ressourcen dynamisch durch verschiedene Mechanismen zu erweitern oder zu reduzieren, um einem veränderten Bedarf gerecht zu werden. In Kombination mit Rechenmetriken kann eine Workload automatisch auf Änderungen reagieren und die optimalen Ressourcen nutzen, um die Zielvorgabe zu erreichen.

Die optimale Anpassung des Angebots an die Nachfrage ist die kostengünstigste Variante für einen Workload. Wichtig ist jedoch, ein ausreichendes Angebot einzuplanen, um die Bereitstellungszeit und individuelle Ressourcenfehler abzudecken. Die Nachfrage kann fest oder variabel sein und Metriken sowie eine Automatisierung erfordern, um sicherzustellen, dass durch die Verwaltung keine unverhältnismäßig hohen Kosten entstehen.

In AWS können Sie eine Vielzahl verschiedener Ansätze für die Abstimmung von Angebot und Bedarf verwenden. Im Whitepaper zur Säule „Kostenoptimierung“ wird beschrieben, wie Sie die folgenden Kostenansätze anwenden:

  • Bedarfsbasierter Ansatz

  • Pufferbasierter Ansatz

  • Zeitabhängiger Ansatz

Sie müssen sicherstellen, dass Workload-Bereitstellungen sowohl Hoch- als auch Herunterskalierungsereignisse verarbeiten können. Erstellen Sie Testszenarien für Herunterskalierungen, damit sich die Workload wie erwartet verhält.

Gängige Antimuster:

  • Sie reagieren auf Alarme, indem Sie die Kapazität manuell erhöhen.

  • Sie belassen die erhöhte Kapazität nach dem Hochskalieren, anstatt wieder herunterzuskalieren.

Vorteile der Einführung dieser bewährten Methode: Durch das Konfigurieren und Testen der Workload-Elastizität können Sie Kosten verringern, Leistungs-Benchmarks erhalten und die Zuverlässigkeit bei sich änderndem Datenverkehr verbessern. Die meisten Instances außerhalb der Produktionsumgebung sollten bei Nichtgebrauch angehalten werden. Obwohl ungenutzte Instances manuell heruntergefahren werden können, ist dies bei einer größeren Anzahl von Instances unpraktisch. Sie können zudem die volumenbasierte Elastizität nutzen. Diese ermöglicht die Optimierung der Leistung und Kosten, indem Sie bei Bedarfsspitzen die Anzahl der Datenverarbeitungs-Instances erhöhen und bei sinkendem Bedarf die Kapazität verringern.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: Mittel

Implementierungsleitfaden

Elastizität nutzen: Elastizität ermöglicht das Anpassen der verfügbaren Ressourcen an den Bedarf. Instances, Container und Funktionen bieten Mechanismen für Elastizität, sei es in Kombination mit automatischer Skalierung oder als Merkmal des Service. Stellen Sie mithilfe von Elastizität in Ihrer Architektur sicher, dass Sie über genügend Kapazität zur Erfüllung der Leistungsanforderungen für den jeweiligen Nutzungsumfang verfügen. Sorgen Sie dafür, dass die Metriken zum Hoch- oder Herunterskalieren elastischer Ressourcen für die jeweilige Art der bereitgestellten Workload überprüft werden. Wenn Sie eine Anwendung zur Video-Transcodierung bereitstellen, wird eine CPU-Auslastung von 100 % erwartet, weshalb dies nicht die Hauptmetrik sein sollte. Alternativ können Sie die Warteschlangenlänge von Transcodierungsaufgaben messen, die auf die Skalierung der Instance-Typen warten. Stellen Sie sicher, dass Workload-Bereitstellungen sowohl mit Hoch- als auch mit Herunterskalierungen umgehen können. Das sichere Herunterskalieren von Workload-Komponenten ist genauso wichtig wie das Hochskalieren von Ressourcen bei entsprechendem Bedarf. Erstellen Sie Testszenarien für Herunterskalierungen, damit sich die Workload wie erwartet verhält.

Ressourcen

Zugehörige Dokumente:

Relevante Videos:

Zugehörige Beispiele: