Training zu SageMaker AI HyperPod - Amazon Nova

Training zu SageMaker AI HyperPod

Sie können Amazon-Nova-Modelle mithilfe von Amazon-Nova-Rezepten anpassen und sie auf SageMaker AI HyperPod trainieren. Ein Rezept ist eine YAML-Konfigurationsdatei, welche SageMaker AI Informationen darüber liefert, wie Ihr Modellanpassungsjob ausgeführt wird.

SageMaker AI HyperPod bietet Hochleistungsdatenverarbeitung mit optimierten GPU-Instances und Speicher von Amazon FSx für Lustre, robuste Überwachung durch Integration von Tools wie TensorBoard, flexibles Checkpoint-Management für iterative Verbesserungen, nahtlose Bereitstellung auf Amazon Bedrock für Inferenz sowie effizientes, skalierbares, verteiltes Training mit mehreren Knoten. All dies bietet Organisationen eine sichere, leistungsstarke und flexible Umgebung, in der sie Amazon-Nova-Modelle an ihre spezifischen Geschäftsanforderungen anpassen können.

Durch die Anpassung von Amazon Nova an SageMaker AI HyperPod werden Modellartefakte, einschließlich Modell-Checkpoints, in einem serviceverwalteten Amazon-S3-Bucket gespeichert. Artefakte im serviceverwalteten Bucket werden mit von SageMaker verwalteten KMS-Schlüsseln verschlüsselt. Serviceverwaltete Amazon-S3-Buckets unterstützen derzeit keine Datenverschlüsselung mit kundenverwalteten Schlüsseln. Sie können diesen Checkpoint-Standort für Evaluierungsaufträge oder Amazon-Bedrock-Inferenz verwenden.

Dieser Abschnitt enthält detaillierte Informationen zu den Amazon-Nova-Modellparametern, welche Sie mit SageMaker AI HyperPod anpassen können, wann Sie diese möglicherweise optimieren sollten und wie sich dies auf die Modellleistung auswirken kann. Die Parameter werden nach Trainingstechnik sortiert dargestellt. Informationen zum Einreichen eines Auftrags finden Sie unter Ausführen eines SageMaker-Trainingsjobs.