Configura la modalità di immissione dei dati utilizzando SageMaker Python SDK - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configura la modalità di immissione dei dati utilizzando SageMaker Python SDK

SageMaker Python SDK fornisce la classe generica Estimator e le sue varianti per i framework ML per l'avvio di lavori di formazione. È possibile specificare una delle modalità di immissione dei dati durante la configurazione della classe AI o del metodo. SageMaker Estimator Estimator.fit I seguenti modelli di codice mostrano i due modi per specificare le modalità di input.

Per specificare la modalità di input utilizzando la classe dello strumento di valutazione

from sagemaker.estimator import Estimator from sagemaker.inputs import TrainingInput estimator = Estimator( checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/', output_path='s3://amzn-s3-demo-bucket/output-path/', base_job_name='job-name', input_mode='File' # Available options: File | Pipe | FastFile ... ) # Run the training job estimator.fit( inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train") )

Per ulteriori informazioni, consulta la classe SageMaker.estimator.Estimator nella documentazione di Python SDK. SageMaker

Come specificare la modalità di input tramite il metodo estimator.fit()

from sagemaker.estimator import Estimator from sagemaker.inputs import TrainingInput estimator = Estimator( checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/', output_path='s3://amzn-s3-demo-bucket/output-path/', base_job_name='job-name', ... ) # Run the training job estimator.fit( inputs=TrainingInput( s3_data="s3://amzn-s3-demo-bucket/my-data/train", input_mode='File' # Available options: File | Pipe | FastFile ) )

Per ulteriori informazioni, vedete il metodo di classe SageMaker.estimator.fit e sagemaker.inputs. TrainingInputclasse nella documentazione di SageMaker Python SDK.

Suggerimento

Per ulteriori informazioni su come configurare Amazon FSx for Lustre o Amazon EFS con la configurazione VPC utilizzando gli estimatori dell'SDK SageMaker Python, consulta Use i file system come input di formazione nella documentazione di AI Python SDK. SageMaker

Suggerimento

Le integrazioni della modalità di input dei dati con Amazon S3, Amazon EFS FSx e for Lustre sono metodi consigliati per configurare in modo ottimale l'origine dati secondo le migliori pratiche. Puoi migliorare strategicamente le prestazioni di caricamento dei dati utilizzando le opzioni di storage gestito dall' SageMaker intelligenza artificiale e le modalità di input, ma non è strettamente limitato. È possibile scrivere la propria logica di lettura dei dati direttamente nel container di addestramento. Ad esempio, puoi impostare la lettura da un'origine dati differente, scrivere la tua classe di data loader S3 o utilizzare le funzioni di caricamento dei dati di framework di terze parti all'interno dello script di addestramento. Tuttavia, devi assicurarti di specificare i percorsi corretti che l' SageMaker IA è in grado di riconoscere.

Suggerimento

Se utilizzi un contenitore di formazione personalizzato, assicurati di installare il toolkit di SageMaker formazione che aiuta a configurare l'ambiente per i lavori di SageMaker formazione. Altrimenti, è necessario specificare le variabili di ambiente in modo esplicito nel Dockerfile. Per ulteriori informazioni, consulta Creare un container con algoritmi e modelli personalizzati.

Per ulteriori informazioni su come impostare le modalità di immissione dei dati utilizzando il livello basso SageMaker APIsCome Amazon SageMaker AI fornisce informazioni di addestramento, consulta CreateTrainingJobAPI e in. TrainingInputMode AlgorithmSpecification