Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Préparation des données à l’aide d’Amazon EMR
Important
Amazon SageMaker Studio et Amazon SageMaker Studio Classic sont deux des environnements d'apprentissage automatique que vous pouvez utiliser pour interagir avec l' SageMaker IA.
Si votre domaine a été créé après le 30 novembre 2023, Studio est votre expérience par défaut.
Si votre domaine a été créé avant le 30 novembre 2023, Amazon SageMaker Studio Classic est votre expérience par défaut. Pour utiliser Studio si Amazon SageMaker Studio Classic est votre expérience par défaut, consultezMigration depuis Amazon SageMaker Studio Classic.
Lorsque vous migrez d'Amazon SageMaker Studio Classic vers Amazon SageMaker Studio, il n'y a aucune perte de disponibilité des fonctionnalités. Studio Classic existe également sous forme d'application au sein d'Amazon SageMaker Studio pour vous aider à gérer vos anciens flux de travail d'apprentissage automatique.
Amazon SageMaker Studio et Studio Classic sont intégrés à Amazon EMR. Dans les blocs-notes JupyterLab et Studio Classic, les data scientists et les ingénieurs de données peuvent découvrir et se connecter aux clusters Amazon EMR existants, puis explorer, visualiser et préparer de manière interactive des données à grande échelle pour le machine learning à l'aide d'Apache Spark, Apache
Les administrateurs peuvent créer des modèles CloudFormation qui définissent les clusters Amazon EMR. Ils peuvent ensuite mettre ces modèles de cluster à disposition des utilisateurs de Studio et de Studio Classic dans AWS Service Catalog pour qu’ils puissent les lancer. Les scientifiques des données peuvent ensuite choisir un modèle prédéfini pour auto-provisionner un cluster Amazon EMR directement depuis leur environnement Studio. Les administrateurs peuvent paramétrer davantage les modèles pour permettre aux utilisateurs de choisir les aspects du cluster dans le cadre de valeurs prédéfinies. Par exemple, les utilisateurs peuvent souhaiter spécifier le nombre de nœuds principaux ou sélectionner le type d’instance d’un nœud dans un menu déroulant.
Les administrateurs peuvent ainsi contrôler l'organisation, la sécurité et la configuration réseau des clusters Amazon EMR. CloudFormation Les scientifiques des données et les ingénieurs de données peuvent ensuite personnaliser ces modèles pour leurs charges de travail afin de créer des clusters Amazon EMR à la demande directement depuis Studio et Studio Classic sans configurer de configurations complexes. Les utilisateurs peuvent résilier les clusters Amazon EMR après utilisation.
-
Si vous êtes administrateur :
Assurez-vous d’avoir activé la communication entre Studio ou Studio Classic et les clusters Amazon EMR. Pour obtenir des instructions, consultez la section Configuration de l’accès réseau pour votre cluster Amazon EMR. Une fois cette communication activée, vous pouvez :
-
Si vous êtes un scientifique des données ou un ingénieur de données, vous pouvez :
-
Lancement d’un cluster Amazon EMR depuis Studio ou Studio Classic
-
Établissement de la liste des clusters Amazon EMR depuis Studio ou Studio Classic
-
Connectez-vous à un cluster Amazon EMR depuis SageMaker Studio ou Studio Classic
-
Résiliation d’un cluster Amazon EMR depuis Studio ou Studio Classic
-
Accès à l’interface utilisateur de Spark depuis Studio ou Studio Classic
-