Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Preparazione dei dati con Amazon EMR
Importante
Amazon SageMaker Studio e Amazon SageMaker Studio Classic sono due degli ambienti di apprendimento automatico che puoi utilizzare per interagire con l' SageMaker intelligenza artificiale.
Se il tuo dominio è stato creato dopo il 30 novembre 2023, Studio è la tua esperienza predefinita.
Se il tuo dominio è stato creato prima del 30 novembre 2023, Amazon SageMaker Studio Classic è la tua esperienza predefinita. Per utilizzare Studio se Amazon SageMaker Studio Classic è la tua esperienza predefinita, consultaMigrazione da Amazon SageMaker Studio Classic.
Quando esegui la migrazione da Amazon SageMaker Studio Classic ad Amazon SageMaker Studio, non si verifica alcuna perdita nella disponibilità delle funzionalità. Studio Classic esiste anche come applicazione all'interno di Amazon SageMaker Studio per aiutarti a eseguire i flussi di lavoro di machine learning esistenti.
Amazon SageMaker Studio e Studio Classic sono dotati di integrazione integrata con Amazon EMR. All'interno JupyterLab dei notebook Studio Classic, data scientist e data engineer possono scoprire e connettersi ai cluster Amazon EMR esistenti, quindi esplorare, visualizzare e preparare in modo interattivo dati su larga scala per l'apprendimento automatico utilizzando Apache Spark, Apache Hive o Presto.
Gli amministratori possono creare modelli CloudFormation che definiscono i cluster Amazon EMR. Possono quindi rendere disponibili questi modelli di cluster in AWS Service Catalog, dove possono essere avviati dagli utenti di Studio e Studio Classic. I Data Scientist possono quindi scegliere un modello predefinito per allocare autonomamente un cluster Amazon EMR direttamente dal proprio ambiente Studio. Gli amministratori possono definire ulteriormente i parametri dei modelli per consentire agli utenti di definire vari aspetti del cluster entro valori predefiniti. Ad esempio, gli utenti potrebbero voler specificare il numero di nodi core o selezionare il tipo di istanza di un nodo da un menu a discesa.
UtilizzandoCloudFormation, gli amministratori possono controllare la configurazione organizzativa, di sicurezza e di rete dei cluster Amazon EMR. I Data Scientist e gli ingegneri dei dati possono quindi personalizzare tali modelli per i loro carichi di lavoro al fine di creare cluster Amazon EMR on demand direttamente da Studio e Studio Classic, senza dover ricorrere a configurazioni complesse. Gli utenti possono anche terminare i cluster Amazon EMR dopo l’utilizzo.
-
Se sei un amministratore:
Assicurati di aver abilitato la comunicazione tra Studio o Studio Classic e i cluster Amazon EMR. Per ulteriori istruzioni, consulta la sezione Configurazione dell’accesso di rete per il cluster Amazon EMR. Una volta abilitata questa comunicazione, puoi:
-
Se sei un Data Scientist o un ingegnere dei dati, puoi: