Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen Sie eine SageMaker Amazon-Notebook-Instance
Wichtig
Benutzerdefinierte IAM-Richtlinien, die es Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ermöglichen, SageMaker Amazon-Ressourcen zu erstellen, müssen auch Berechtigungen zum Hinzufügen von Tags zu diesen Ressourcen gewähren. Die Berechtigung zum Hinzufügen von Tags zu Ressourcen ist erforderlich, da Studio und Studio Classic automatisch alle von ihnen erstellten Ressourcen taggen. Wenn eine IAM-Richtlinie Studio und Studio Classic das Erstellen von Ressourcen, aber kein Tagging erlaubt, können "AccessDenied" Fehler beim Versuch, Ressourcen zu erstellen, auftreten. Weitere Informationen finden Sie unter Erteilen Sie Berechtigungen für das Taggen von SageMaker KI-Ressourcen.
AWSverwaltete Richtlinien für Amazon SageMaker AIdie Berechtigungen zum Erstellen von SageMaker Ressourcen gewähren, beinhalten bereits Berechtigungen zum Hinzufügen von Tags beim Erstellen dieser Ressourcen.
Eine SageMaker Amazon-Notebook-Instance ist eine ML-Compute-Instance, auf der die Jupyter Notebook-Anwendung ausgeführt wird. SageMaker KI verwaltet die Erstellung der Instance und der zugehörigen Ressourcen. Verwenden Sie Jupyter-Notebooks in Ihrer Notebook-Instance, um:
-
Daten vorzubereiten und zu verarbeiten
-
Code zu schreiben, um Modelle zu trainieren
-
Modelle für SageMaker KI-Hosting bereitstellen
-
Testen oder Validieren von Modellen
Um eine Notebook-Instanz zu erstellen, verwenden Sie entweder die SageMaker AI-Konsole oder CreateNotebookInstanceAPI.
Der auszuwählende Notebook-Instance-Typ hängt von der von Ihnen beabsichtigten Verwendung Ihrer Notebook-Instance ab. Stellen Sie sicher, dass Ihre Notebook-Instance nicht an Arbeitsspeicher, CPU oder E/A gebunden ist. Um einen Datensatz zur Erkundung oder Vorverarbeitung in den Speicher der Notebook-Instance zu laden, wählen Sie einen Instance-Typ mit ausreichend RAM-Speicher für Ihren Datensatz aus. Dies erfordert eine Instance mit mindestens 16 GB Arbeitsspeicher (.xlarge oder größer). Wenn Sie das Notebook für die rechenintensive Vorverarbeitung verwenden möchten, empfehlen wir Ihnen, eine rechneroptimierte Instance wie c4 oder c5 zu wählen.
Eine bewährte Methode bei der Verwendung eines SageMaker Notebooks besteht darin, die Notebook-Instanz zur Orchestrierung anderer AWS Dienste zu verwenden. Sie können die Notebook-Instance beispielsweise verwenden, um die Verarbeitung großer Datensätze zu verwalten. Rufen Sie dazu AWS Glue für ETL-Services (Extrahieren, Transformieren und Laden) oder Amazon EMR für die Zuordnung und Datenreduzierung mit Hadoop auf. Sie können AWS Dienste als temporäre Berechnungs- oder Speicherformen für Ihre Daten verwenden.
Sie können Ihre Trainings- und Testdaten mit einem Bucket von Amazon Simple Storage Service speichern und abrufen. Anschließend können Sie SageMaker KI verwenden, um Ihr Modell zu trainieren und zu erstellen. Der Instance-Typ Ihres Notebooks hätte dann keine Auswirkungen auf die Geschwindigkeit des Modelltrainings und der Modelltests.
Nach Erhalt der Anfrage geht SageMaker AI wie folgt vor:
-
Erstellt eine Netzwerkschnittstelle — Wenn Sie die optionale VPC-Konfiguration wählen, erstellt SageMaker KI die Netzwerkschnittstelle in Ihrer VPC. Es verwendet die Subnetz-ID, die Sie in der Anfrage angeben, um zu bestimmen, in welcher Availability Zone das Subnetz erstellt werden soll. SageMaker AI ordnet die Sicherheitsgruppe, die Sie in der Anfrage angeben, dem Subnetz zu. Weitere Informationen finden Sie unter Verbinden einer Notebook-Instance in einer VPC mit externen Ressourcen.
-
Startet eine ML-Compute-Instanz — SageMaker KI startet eine ML-Compute-Instanz in einer SageMaker AI-VPC. SageMaker KI führt die Konfigurationsaufgaben aus, die es ihr ermöglichen, Ihre Notebook-Instanz zu verwalten. Wenn Sie Ihre VPC angegeben haben, ermöglicht SageMaker KI den Verkehr zwischen Ihrer VPC und der Notebook-Instance.
-
Installiert Anaconda-Pakete und -Bibliotheken für gängige Deep-Learning-Plattformen — SageMaker KI installiert alle Anaconda-Pakete, die im Installationsprogramm enthalten sind. Weitere Informationen finden Sie in der Anaconda-Paketliste.
SageMaker AI installiert auch die TensorFlow MXNet Deep-Learning-Bibliotheken und Apache. -
Hängt ein ML-Speichervolume an — SageMaker AI hängt ein ML-Speichervolume an die ML-Compute-Instance an. Sie können das Volume als Arbeitsbereich verwenden, um das Trainingsdatensatz zu bereinigen oder Überprüfungs-, Test- oder andere Daten vorübergehend zu speichern. Für das Volume können Sie eine beliebige Größe zwischen 5 GB und 16 384 GB verwenden. Größenänderungen sind in Schritten von 1 GB möglich. Der Standardwert ist 5 GB. ML-Speichervolumes sind verschlüsselt, sodass SageMaker KI die Menge an verfügbarem freiem Speicherplatz auf dem Volume nicht ermitteln kann. Daher können Sie beim Aktualisieren einer Notebook-Instance die Volume-Größe nur erhöhen, nicht jedoch verkleinern. Wenn Sie die Größe eines verwendeten ML-Speicher-Volumes verkleinern möchten, erstellen Sie eine neue Notebook-Instance mit der gewünschten Größe.
Nur Dateien und Daten, die im Ordner
/home/ec2-user/SageMakergespeichert sind, bleiben über Notebook-Instance-Sitzungen hinweg erhalten. Dateien und Daten, die außerhalb dieses Verzeichnisses gespeichert sind, werden überschrieben, wenn die Notebook-Instance angehalten und neu gestartet wird. Das/tmpVerzeichnis jeder Notebook-Instanz bietet mindestens 10 GB Speicherplatz in einem Instance-Speicher. Beim Instance-Speicher handelt es sich um temporären Speicher auf Blockebene, der nicht persistent ist. Wenn die Instanz gestoppt oder neu gestartet wird, löscht SageMaker AI den Inhalt des Verzeichnisses und alle Betriebssystemanpassungen. Dieser temporäre Speicher ist Teil des Root-Volumes der Notebook-Instance.Wenn die Notebook-Instanz nicht aktualisiert wird und unsichere Software ausgeführt wird, aktualisiert SageMaker KI die Instanz möglicherweise regelmäßig im Rahmen der regelmäßigen Wartung. Während dieser Updates werden Daten außerhalb des Ordners nicht dauerhaft
/home/ec2-user/SageMakergespeichert. Weitere Informationen zu Wartungs- und Sicherheitspatches finden Sie unterWartung.Wenn der von der Notebook-Instance verwendete Instance-Typ NVMe unterstützt wird, können Kunden die für diesen NVMe Instance-Typ verfügbaren Instance-Speicher-Volumes verwenden. Bei Instances mit NVMe Store-Volumes werden alle Instance-Speicher-Volumes beim Start automatisch an die Instance angehängt. Weitere Informationen zu Instance-Typen und den zugehörigen NVMe Speicher-Volumes finden Sie in den Amazon Elastic Compute Cloud-Instance-Typdetails
. Um das angehängte NVMe Speicher-Volume für Ihre Notebook-Instance verfügbar zu machen, führen Sie die Schritte unter Instance-Speicher-Volumes auf Ihrer Instance verfügbar machen aus. Führen Sie die Schritte mit Root-Zugriff oder mithilfe eines Skripts für die Lebenszykluskonfiguration aus.
Anmerkung
NVMe Instance-Speicher-Volumes sind kein persistenter Speicher. Dieser Speicher ist nur für die Dauer der Instance verfügbar und muss bei jedem Start einer Instance mit diesem Speicher neu konfiguriert werden.
So erstellen Sie eine SageMaker KI-Notebook-Instanz:
-
Öffnen Sie die SageMaker AI-Konsole unter https://console.aws.amazon.com/sagemaker/
. -
Wählen Sie Notebook instances (Notebook-Instances) und Create notebook instance (Notebook-Instance erstellen) aus.
-
Geben Sie auf der Seite Notebook-Instance erstellen folgende Informationen ein:
-
Geben Sie unter Notebook instance name (Name der Notebook-Instance) einen Namen für die Notebook-Instance ein.
-
Wählen Sie als Notebook-Instance-Typ eine Instance-Größe, die für Ihren Anwendungsfall geeignet ist. Eine Liste der unterstützten Instance-Typen und Kontingente finden Sie unter Amazon SageMaker AI Service Quotas.
-
Wählen Sie unter Platform Identifier einen Plattformtyp aus, auf dem die Notebook-Instance erstellt werden soll. Dieser Plattformtyp bestimmt das Betriebssystem und die JupyterLab Version, mit der Ihre Notebook-Instance erstellt wird. Die neueste und empfohlene Version ist
notebook-al2023-v1für eine Amazon Linux 2023 Notebook-Instance. Stand 30. Juni 2025 werden nur JupyterLab 4 für neue Instances unterstützt. Informationen zu den Typen von Plattformkennungen finden Sie unter AL2023 Notebook-Instanzen undAmazon Linux 2-Notebook-Instances. Informationen zu JupyterLab Versionen finden Sie unterJupyterLab Versionierung.Wichtig
JupyterLab 1 und JupyterLab 3 werden ab dem 30. Juni 2025 nicht mehr unterstützt. Mit diesen Versionen können Sie keine neuen Notebook-Instances mehr erstellen oder angehaltene Instances neu starten. Bestehende In-Service-Instances funktionieren möglicherweise weiterhin, erhalten aber keine Sicherheitsupdates oder Bugfixes. Migrieren Sie zu JupyterLab 4 Notebook-Instanzen, um weiterhin Support zu erhalten. Weitere Informationen finden Sie unter JupyterLab Wartung der Version.
-
(Optional) Über Additional configuration (Zusätzliche Konfiguration) können fortgeschrittene Benutzer ein Shell-Skript erstellen, das ausgeführt werden kann, wenn Sie die Instance erstellen oder starten. Dieses Skript, das als Lifecycle-Konfigurationsskript bezeichnet wird, kann verwendet werden, um die Umgebung für das Notebook festzulegen oder andere Funktionen auszuführen. Weitere Informationen finden Sie unter Anpassung einer SageMaker Notebook-Instanz mithilfe eines LCC-Skripts.
-
(Optional) Über Additional configuration (Zusätzliche Konfiguration) können Sie auch die Größe (in GB) des ML-Speichervolumes angeben, das der Notebook-Instance angefügt ist. Sie können eine Größe zwischen 5 GB und 16.384 GB in 1-GB-Schritten wählen. Sie können dieses Volume verwenden, um das Trainingsdatensatz zu bereinigen oder Überprüfungsdaten oder andere Daten temporär zu speichern.
-
(Optional) Wählen Sie für IMDS-Mindestversion eine Version aus der Dropdown-Liste aus. Wenn dieser Wert auf v1 gesetzt ist, können beide Versionen mit der Notebook-Instance verwendet werden. Wenn v2 ausgewählt ist, IMDSv2 kann es nur mit der Notebook-Instanz verwendet werden. Informationen zu finden IMDSv2 Sie unter Verwenden IMDSv2.
Anmerkung
Ab dem 31. Oktober 2022 ändert sich die standardmäßige IMDS-Mindestversion für SageMaker Notebook-Instances von IMDSv1 auf IMDSv2.
Ab dem 1. Februar 2023 IMDSv1 ist sie nicht mehr für die Erstellung neuer Notebook-Instanzen verfügbar. Nach diesem Datum können Sie Notebook-Instances mit einer Mindestversion von IMDS 2 erstellen.
-
Wählen Sie für die IAM-Rolle entweder eine bestehende IAM-Rolle in Ihrem Konto mit den erforderlichen Berechtigungen für den Zugriff auf SageMaker KI-Ressourcen aus oder erstellen Sie eine neue Rolle. Wenn Sie Neue Rolle erstellen wählen, erstellt SageMaker AI eine IAM-Rolle mit dem Namen.
AmazonSageMaker-ExecutionRole-Die AWS verwaltete RichtlinieYYYYMMDDTHHmmSSAmazonSageMakerFullAccessist der Rolle angehängt. Die Rolle bietet Berechtigungen, die es der Notebook-Instance ermöglichen, SageMaker KI und Amazon S3 aufzurufen. -
Um allen Benutzern der Notebook-Instance Root-Zugriff zu gewähren, wählen Sie für Root-Zugriff die Option Aktivieren aus. Wählen Sie zum Entfernen des Root-Zugriffs für Benutzer Deaktivieren aus. Wenn Sie den Root-Zugriff aktivieren, erhalten alle Benutzer der Notebook-Instance Administratorrechte und können alle Dateien öffnen und bearbeiten.
-
(Optional) Über die Option Encryption key (Verschlüsselungsschlüssel) können Sie Daten auf dem ML-Speichervolume, das der Notebook-Instance angefügt ist, mithilfe eines AWS Key Management Service-(AWS KMS-)Schlüssels verschlüsseln. Wenn Sie vertrauliche Informationen auf dem ML-Speichervolume speichern möchten, sollten Sie die Informationen verschlüsseln.
-
(Optional) Über die Option Network (Netzwerk) können Sie Ihre Notebook-Instance in eine Virtual Private Cloud (VPC) stellen. Eine VPC bietet zusätzliche Sicherheit und schränkt den Zugriff auf Ressourcen in der VPC von Quellen außerhalb der VPC ein. Weitere Informationen finden Sie im VPCs Amazon VPC-Benutzerhandbuch.
So fügen Sie Ihre Notebook-Instance zu einer VPC hinzu:
-
Wählen Sie die VPC und eine SubnetId.
-
Wählen Sie unter Security Group (Sicherheitsgruppe) die Standardsicherheitsgruppe der VPC aus.
-
Wenn Ihre Notebook-Instance über einen Internetzugang verfügen muss, aktivieren Sie den direkten Internetzugang. Wählen Sie für Direct internet access (Direkte Internetverbindung) die Option Enable (Aktivieren) aus. Es kann sein, dass Ihre Notebook-Instance mit Internetzugang weniger sicher ist. Weitere Informationen finden Sie unter Verbinden einer Notebook-Instance in einer VPC mit externen Ressourcen.
-
-
(Optional) Um Git-Repositorys mit der Notebook-Instance zu verknüpfen, wählen Sie ein Standard-Repository und bis zu 3 zusätzliche Repositorys. Weitere Informationen finden Sie unter Git-Repositorys mit SageMaker AI Notebook-Instanzen.
-
Wählen Sie Create notebook instance (Notebook-Instance erstellen) aus.
In wenigen Minuten startet Amazon SageMaker AI eine ML-Compute-Instance — in diesem Fall eine Notebook-Instance — und fügt ihr ein ML-Speicher-Volume hinzu. Die Notebook-Instance verfügt über einen vorkonfigurierten Jupyter-Notebook-Server und mehrere Anaconda-Bibliotheken. Weitere Informationen finden Sie in der
CreateNotebookInstance-API.
-
-
Wenn der Status der Notebook-Instance in der Konsole
InServicelautet, ist die Notebook-Instance einsatzbereit. Wählen Sie Open Jupyter (Jupyter öffnen) neben dem Notebook-Namen aus, um das klassische Jupyter-Dashboard zu öffnen.Anmerkung
Um die Sicherheit Ihrer Amazon SageMaker Notebook-Instance zu erhöhen, sind alle regionalen
Domains in der Internet Public Suffix List (PSLnotebook.region.sagemaker.aws) registriert. Aus Sicherheitsgründen empfehlen wir Ihnen, Cookies mit einem __Host-Präfix zu verwenden, um sensible Cookies für die Domänen Ihrer SageMaker Notebook-Instances zu setzen. Diese Vorgehensweise hilft Ihnen dabei, Ihre Domain vor CSRF (Cross-Site Request Forgery Attempts, Anforderungsfälschung zwischen Websites)-Versuchen zu schützen. Weitere Informationen finden Sie auf der Seite Set-Cookieauf der Website mit der Entwicklerdokumentation unter mozilla.org . Sie können Öffnen wählen JupyterLab, um das JupyterLab Dashboard zu öffnen. Das Dashboard bietet Zugriff auf Ihre Notebook-Instance.
Weitere Informationen zu Jupyter Notebooks finden Sie bei The Jupyter notebook
.