Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Debuggen und Verbessern der Modellleistung
Der Kern des Trainings von Modellen für maschinelles Lernen, neuronalen Deep-Learning-Netzwerken und Transformatormodellen besteht darin, eine stabile Modellkonvergenz zu erreichen. state-of-the-art Daher haben Modelle Millionen, Milliarden oder Billionen von Modellparametern. Die Anzahl der Operationen zur Aktualisierung der gigantischen Anzahl von Modellparametern während jeder Iteration kann leicht astronomisch werden. Um Probleme mit der Modellkonvergenz zu identifizieren, ist es wichtig, auf die Modellparameter, Aktivierungen und Gradienten zugreifen zu können, die während der Optimierungsprozesse berechnet wurden.
Amazon SageMaker AI bietet zwei Debugging-Tools, mit denen Sie solche Konvergenzprobleme identifizieren und sich einen Überblick über Ihre Modelle verschaffen können.
Amazon SageMaker AI mit TensorBoard
Um eine größere Kompatibilität mit den Open-Source-Community-Tools innerhalb der SageMaker KI-Trainingsplattform zu gewährleisten, hostet SageMaker KI TensorBoard als Anwendung im SageMaker KI-Bereich. Sie können Ihre Trainingsjobs auf SageMaker KI übertragen und den TensorBoard Summary Writer weiterhin verwenden, um die Modellausgabetensoren zu sammeln. Da er in der SageMaker KI-Domäne implementiert TensorBoard ist, bietet er Ihnen auch mehr Optionen zur Verwaltung von Benutzerprofilen unter der SageMaker AI-Domäne in Ihrem AWS Konto und ermöglicht eine genaue Kontrolle über die Benutzerprofile, indem Zugriff auf bestimmte Aktionen und Ressourcen gewährt wird. Weitere Informationen hierzu finden Sie unter TensorBoard in Amazon SageMaker AI.
SageMaker Amazon-Debugger
Amazon SageMaker Debugger ist eine SageMaker KI-Funktion, die Tools zur Registrierung von Hooks für Callbacks bereitstellt, um Modellausgabetensoren zu extrahieren und sie in Amazon Simple Storage Service zu speichern. Es bietet integrierte Regeln zur Erkennung von Problemen mit der Modellkonvergenz, wie z. B. Überanpassung, gesättigte Aktivierungsfunktionen, verschwindende Farbverläufe und mehr. Sie können auch die integrierten Regeln AWS Lambda für Amazon CloudWatch Events einrichten und automatische Maßnahmen gegen erkannte Probleme ergreifen. Außerdem können Sie Amazon Simple Notification Service für den Empfang von E-Mail- oder Textbenachrichtigungen einrichten. Weitere Informationen hierzu finden Sie unter SageMaker Amazon-Debugger.