Datenquellenverbindungen für die SQL-Erweiterung - Amazon SageMaker AI

Datenquellenverbindungen für die SQL-Erweiterung

Bevor die SQL-Erweiterung in JupyterLab-Notebooks verwendet werden kann, müssen Administratoren oder Benutzer AWS Glue Verbindungen zu ihren Datenquellen herstellen. Die SQL-Erweiterung ermöglicht die Verbindung zu Datenquellen wie Amazon Redshift, Amazon Athena oder Snowflake.

Um die Verbindungen einzurichten, müssen Administratoren zunächst sicherstellen, dass ihre Netzwerkkonfiguration die Kommunikation zwischen Studio und den Datenquellen ermöglicht, und dann die erforderlichen IAM-Berechtigungen erteilen, damit Studio auf die Datenquellen zugreifen kann. Informationen darüber, wie Administratoren das Netzwerk einrichten können, finden Sie unterKonfigurieren Sie den Netzwerkzugriff zwischen Studio und Datenquellen (für Administratoren). Informationen darüber, welche Richtlinien eingerichtet werden müssen, finden Sie unterRichten Sie die IAM-Berechtigungen für den Zugriff auf die Datenquellen ein (für Administratoren). Sobald die Verbindungen eingerichtet sind, können Datenwissenschaftler die SQL-Erweiterung in ihren JupyterLab-Notebooks verwenden, um die verbundenen Datenquellen zu durchsuchen und abzufragen.

Anmerkung

Wir empfehlen, Ihre Datenbankanmeldeinformationen als Secret in Secrets Manager zu speichern. Informationen zum Erstellen von Secrets für das Speichern von Amazon-Redshift- oder Snowflake-Anmeldeinformationen finden Sie unter Erstellen Sie Secrets für Datenbankzugriffs-Anmeldeinformationen in Secrets Manager.

In diesem Abschnitt wird erklärt, wie eine AWS Glue Verbindung eingerichtet wird, und es werden die IAM-Berechtigungen aufgeführt, die die Studio JupyterLab-Anwendung benötigt, um über die Verbindung auf die Daten zuzugreifen.

Anmerkung

Amazon SageMaker Assets integriert Amazon DataZone mit Studio. Es enthält einen SageMaker-KI-Blueprint, mit dem Administratoren Studio-Umgebungen aus Amazon DataZone-Projekten innerhalb einer Amazon DataZone-Domain erstellen können.

Benutzer einer JupyterLab-Anwendung, die von einer mit dem Blueprint erstellten Studio-Domain gestartet wurde, können automatisch auf AWS Glue Verbindungen zu Datenbeständen in ihrem Amazon DataZone-Katalog zugreifen, wenn sie die SQL-Erweiterung verwenden. Auf diese Weise können Sie diese Datenquellen abfragen, ohne manuell Verbindungen einrichten zu müssen.