Überblick über Amazon EMR Notebooks - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überblick über Amazon EMR Notebooks

Anmerkung

EMR Notebooks sind als EMR Studio-Workspaces in der Konsole verfügbar. Mit der Schaltfläche „Arbeitsbereich erstellen“ in der Konsole können Sie neue Notizbücher erstellen. Um auf Workspaces zuzugreifen oder diese zu erstellen, benötigen EMR-Notebook-Benutzer zusätzliche IAM-Rollenberechtigungen. Weitere Informationen finden Sie unter Amazon EMR Notebooks sind Amazon EMR Studio Workspaces in der Konsole und Amazon EMR-Konsole.

Sie können Amazon EMR Notebooks zusammen mit Amazon EMR-Clustern verwenden, auf denen Apache Spark ausgeführt wird, um Jupyter Notebook und JupyterLab Schnittstellen innerhalb der Amazon EMR-Konsole zu erstellen und zu öffnen. Ein EMR-Notebook ist ein „Serverless“-Notebook, mit dem Sie Abfragen und Code ausführen können. Im Gegensatz zu einem herkömmlichen Notebook werden die Inhalte eines EMR-Notebooks – die Gleichungen, Abfragen, Modelle, der Code und der erläuternde Text in Notizbuchzellen – in einem Client ausgeführt. Die Befehle werden auf einem Kernel in dem EMR-Cluster ausgeführt. Notebook-Inhalte werden auch getrennt von den Cluster-Daten in Amazon S3 gespeichert, um eine sichere Speicherung und flexible Wiederverwendung zu gewährleisten.

Sie können einen Cluster starten, ein EMR Notebook zur Analyse anfügen und dann den Cluster beenden. Sie können auch ein Notebook schließen, das an einen ausgeführten Cluster angefügt ist, und zu einem anderen Cluster wechseln. Mehrere Benutzer können gleichzeitig Notebooks an denselben Cluster anfügen und in Amazon S3 Notebook-Dateien miteinander teilen. Diese Funktionen ermöglichen Ihnen die On-Demand-Ausführung von Clustern, um Kosten zu sparen und den Zeitaufwand für die Neukonfiguration von Notebooks für verschiedene Cluster und Datensätze zu reduzieren.

Sie können ein EMR-Notebook auch programmgesteuert mithilfe der Amazon-EMR-API ausführen, ohne mit der Amazon-EMR-Konsole interagieren zu müssen („Headless Execution“). Sie müssen eine Zelle in das EMR-Notebook aufnehmen, die über ein Parameter-Tag verfügt. Diese Zelle ermöglicht es einem Skript, neue Eingabewerte an das Notizbuch zu übergeben. Parametrisierte Notizbücher können mit unterschiedlichen Eingabewerten wiederverwendet werden. Es ist nicht erforderlich, Kopien desselben Notebooks zu erstellen, um es mit neuen Eingabewerten zu bearbeiten und auszuführen. Amazon EMR erstellt und speichert das Ausgabe-Notebook auf S3 für jeden Lauf des parametrisierten Notebooks. API-Codebeispiele für EMR-Notebooks finden Sie unter Beispiele für programmatische Befehle für EMR Notebooks.

Wichtig

Die EMR-Notebooks-Funktion unterstützt Cluster, die Amazon-EMR-Versionen 5.18.0 und höher verwenden. Wir empfehlen, EMR Notebooks mit Clustern zu verwenden, die die neueste Version von Amazon EMR oder mindestens 5.30.0, 5.32.0 oder 6.2.0 verwenden. Mit diesen Versionen werden Jupyter-Kernel auf dem angefügten Cluster und nicht auf einer Jupyter-Instance ausgeführt werden. Dies verbessert die Leistung und erweitert Ihre Möglichkeiten von Kerneln und Bibliotheken zu verbessern. Weitere Informationen finden Sie unter Unterschiede in den Funktionalitäten nach Cluster-Release-Version.

Es fallen Gebühren für Amazon-S3-Speicher und für Amazon-EMR-Cluster an.