Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Guide de l'utilisateur
Cette section explique comment les data scientists et les ingénieurs de données peuvent lancer, découvrir, se connecter ou résilier un cluster Amazon EMR depuis Studio ou Studio Classic.
Avant que les utilisateurs puissent répertorier ou lancer des clusters, les administrateurs doivent avoir configuré les paramètres nécessaires dans l'environnement Studio. Pour plus d'informations sur la manière dont les administrateurs peuvent configurer un environnement Studio afin de permettre l'auto-approvisionnement et la liste des clusters Amazon EMR, consultez. Guide de l'administrateur
Rubriques
Lancer un cluster Amazon EMR depuis Studio ou Studio Classic
Répertorier les clusters Amazon EMR depuis Studio ou Studio Classic
Connectez-vous à un cluster Amazon EMR depuis SageMaker Studio ou Studio Classic
Mettre fin à un cluster Amazon EMR depuis Studio ou Studio Classic
Accédez à l'interface utilisateur de Spark depuis Studio ou Studio Classic
Images et noyaux pris en charge pour se connecter à un cluster Amazon EMR depuis Studio ou Studio Classic
Les images et noyaux suivants sont fournis avec sagemaker-studio-analytics-extension
-
Pour les utilisateurs de Studio : SageMaker Distribution est un environnement Docker pour la science des données utilisé comme image par défaut des instances de JupyterLab bloc-notes. Toutes les versions d'SageMaker AI Distribution
sont sagemaker-studio-analytics-extension
préinstallées. -
Pour les utilisateurs de Studio Classic : les images suivantes sont préinstallées avec
sagemaker-studio-analytics-extension
:-
DataScience — Noyau Python 3
-
DataScience 2.0 — Noyau Python 3
-
DataScience 3.0 — Noyau Python 3
-
SparkAnalytics 1.0 — SparkMagic et PySpark noyaux
-
SparkAnalytics 2.0 — SparkMagic et PySpark noyaux
-
SparkMagic — SparkMagic et PySpark amandes
-
PyTorch 1.8 — Noyaux Python 3
-
TensorFlow 2.6 — Noyau Python 3
-
TensorFlow 2.11 — Noyau Python 3
-
Pour vous connecter à des clusters Amazon EMR à l'aide d'une autre image intégrée ou de votre propre image, suivez les instructions fournies dans Apporter votre propre image.
Apporter votre propre image
Pour importer votre propre image dans Studio ou Studio Classic et permettre à vos ordinateurs portables de se connecter aux clusters Amazon EMR, installez l'extension sagemaker-studio-analytics-extension
pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension
En outre, pour vous connecter à Amazon EMR avec l'authentification Kerberos, vous devez installer le client kinit. Selon votre système d'exploitation, la commande d'installation du client kinit peut varier. Pour apporter une image Ubuntu (basée sur Debian), utilisez la commande apt-get
install -y -qq krb5-user
.
Pour plus d'informations sur l'importation de votre propre image dans SageMaker Studio ou Studio Classic, voir Apporter votre propre SageMaker image.