Verpackung von YARN-Behältern - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verpackung von YARN-Behältern

Ab Amazon EMR Version 7.9.0 ist die Container-Bin-Packing-Richtlinie jetzt für den YARN-Kapazitätsplaner verfügbar, der auf der YARN-Platzierungsrichtlinie für mehrere Knoten aufbaut. Obwohl die Funktion standardmäßig deaktiviert ist, priorisiert YARN, wenn sie aktiviert ist, das Auffüllen eines einzelnen Knotens mit Containern, bevor es auf andere Clusterknoten erweitert wird. Dabei wird ein in der Konfiguration definierter, vordefinierter Packschwellenwert eingehalten. yarn.scheduler.capacity.multi-node-placement.container.bin-packing.percentage

Die Richtlinie zum Einpacken von Containern bietet im Vergleich zur Standardstrategie für die einheitliche Containerzuweisung mehrere Vorteile:

  • Sie reduziert die Fragmentierung von Cluster-Ressourcen.

  • Es beschleunigt potenziell den Cluster-Scale-Down-Vorgang, indem Container auf einer begrenzten Anzahl von Knoten gestartet werden, wenn Ressourcen auf diesen Knoten verfügbar sind, wodurch andere Knoten inaktiv bleiben, die dann herunterskaliert werden können — was zu besseren Kosteneinsparungen bei der dynamischen Skalierung eines Clusters führt.

Aktivieren Sie die Funktion

Um die Funktion zum Verpacken von Containern in Amazon EMR zu aktivieren, können Sie die folgende YARN-Standortklassifizierung hinzufügen:

[ { "Classification": "yarn-site", "Properties": { "yarn.scheduler.capacity.multi-node-placement.container.bin-packing.percentage": "integer value from 1-100" } } ]

Überlegungen

  • Die Funktion ist ausschließlich für den YARN-Kapazitätsplaner verfügbar.

  • Durch die Aktivierung der Funktion wird automatisch die YARN-Strategie zur Planung der Platzierung mehrerer Knoten aktiviert.

  • Aufgrund der konzentrierten Ressourcennutzung auf einer begrenzten Anzahl von Knoten kann es zu potenziellen Leistungseinbußen kommen.

  • Mit dieser Funktion weisen benutzerdefinierte Richtlinien für die auto-scaling im Vergleich zu verwalteten Skalierungsrichtlinien bessere Skalierungsvorgänge auf.