Datenaufbereitung mit Amazon EMR - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Datenaufbereitung mit Amazon EMR

Wichtig

Amazon SageMaker Studio und Amazon SageMaker Studio Classic sind zwei der Umgebungen für maschinelles Lernen, mit denen Sie mit SageMaker KI interagieren können.

Wenn Ihre Domain nach dem 30. November 2023 erstellt wurde, ist Studio Ihre Standardkonfiguration.

Wenn Ihre Domain vor dem 30. November 2023 erstellt wurde, ist Amazon SageMaker Studio Classic Ihr Standarderlebnis. Informationen zur Verwendung von Studio, wenn Amazon SageMaker Studio Classic Ihr Standarderlebnis ist, finden Sie unterMigration von Amazon SageMaker Studio Classic.

Wenn Sie von Amazon SageMaker Studio Classic zu Amazon SageMaker Studio migrieren, geht die Verfügbarkeit von Funktionen nicht verloren. Studio Classic ist auch als Anwendung in Amazon SageMaker Studio verfügbar, um Sie bei der Ausführung Ihrer älteren Machine-Learning-Workflows zu unterstützen.

Amazon SageMaker Studio und Studio Classic verfügen über eine integrierte Integration mit Amazon EMR. In JupyterLab und Studio Classic-Notebooks können Datenwissenschaftler und Dateningenieure bestehende Amazon EMR-Cluster erkennen und eine Verbindung zu ihnen herstellen und anschließend mithilfe von Apache Spark, ApacheHive oder Presto umfangreiche Daten interaktiv untersuchen, visualisieren und für maschinelles Lernen vorbereiten. Mit einem einzigen Klick können sie auf die Spark-Benutzeroberfläche zugreifen, um den Status und die Metriken ihrer Spark-Jobs zu überwachen, ohne ihr Notebook verlassen zu müssen.

Administratoren können CloudFormationVorlagen erstellen, die Amazon EMR-Cluster definieren. Sie können diese Cluster-Vorlagen dann AWS Service Catalogfür Studio- und Studio Classic-Benutzer zum Start verfügbar machen. Datenwissenschaftler können dann eine vordefinierte Vorlage auswählen, um direkt aus ihrer Studio-Umgebung heraus selbst einen Amazon-EMR-Cluster bereitzustellen. Administratoren können die Vorlagen weiter parametrisieren, sodass der Benutzer anhand vordefinierter Werte Aspekte des Clusters auswählen kann. Benutzer möchten z. B. die Anzahl der Core-Knoten angeben oder den Instance-Typ eines Knotens aus einem Auswahlmenü auswählen.

Mithilfe CloudFormation können Administratoren die Organisations-, Sicherheits- und Netzwerkkonfiguration von Amazon EMR-Clustern steuern. Datenwissenschaftler und Dateningenieure können diese Vorlagen dann an ihre Workloads anpassen, um Amazon EMR-Cluster bei Bedarf direkt aus Studio und Studio Classic zu erstellen, ohne komplexe Konfigurationen einrichten zu müssen. Benutzer können Amazon-EMR-Cluster nach Gebrauch beenden.