Guide de l’utilisateur - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Guide de l’utilisateur

Cette section explique comment les scientifiques des données et les ingénieurs de données peuvent lancer, découvrir, résilier un cluster Amazon EMR et s’y connecter depuis Studio ou Studio Classic.

Avant que les utilisateurs puissent répertorier ou lancer les clusters, les administrateurs doivent avoir configuré les paramètres nécessaires dans l’environnement Studio. Pour obtenir des informations sur la manière dont les administrateurs peuvent configurer un environnement Studio afin de permettre le provisionnement automatique et l’établissement de la liste des clusters Amazon EMR, consultez Guide de l’administrateur.

Images et noyaux pris en charge pour se connecter à un cluster Amazon EMR depuis Studio ou Studio Classic

Les images et noyaux suivants sont fournis avec sagemaker-studio-analytics-extensionl' JupyterLab extension qui se connecte à un cluster Spark (Amazon EMR) distant via la bibliothèque à SparkMagicl'aide d'Apache Livy.

  • Pour les utilisateurs de Studio : SageMaker Distribution est un environnement Docker pour la science des données utilisé comme image par défaut des instances de JupyterLab bloc-notes. Toutes les versions d'SageMaker AI Distribution sont sagemaker-studio-analytics-extension préinstallées.

  • Pour les utilisateurs de Studio Classic : les images suivantes sont fournies avec sagemaker-studio-analytics-extension préinstallé :

    • DataScience — Noyau Python 3

    • DataScience 2.0 — Noyau Python 3

    • DataScience 3.0 — Noyau Python 3

    • SparkAnalytics 1.0 — SparkMagic et PySpark noyaux

    • SparkAnalytics 2.0 — SparkMagic et PySpark noyaux

    • SparkMagic — SparkMagic et PySpark cerneaux

    • PyTorch 1.8 — Noyaux Python 3

    • TensorFlow 2.6 — Noyau Python 3

    • TensorFlow 2.11 — Noyau Python 3

Pour vous connecter à des clusters Amazon EMR à l’aide d’une autre image intégrée ou de votre propre image, suivez les instructions fournies dans Apporter votre propre image.

Apporter votre propre image

Pour importer votre propre image dans Studio ou Studio Classic et permettre à vos ordinateurs portables de se connecter aux clusters Amazon EMR, installez l'extension sagemaker-studio-analytics-extensionsuivante sur votre noyau. Il permet de connecter les blocs-notes SageMaker Studio ou Studio Classic aux clusters Spark (Amazon EMR) via SparkMagicla bibliothèque.

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

En outre, pour vous connecter à Amazon EMR avec l’authentification Kerberos, vous devez installer le client kinit. Selon votre système d’exploitation, la commande d’installation du client kinit peut varier. Pour apporter une image Ubuntu (basée sur Debian), utilisez la commande apt-get install -y -qq krb5-user.

Pour plus d'informations sur l'importation de votre propre image dans SageMaker Studio ou Studio Classic, voir Apporter votre propre SageMaker image.