Configura la modalità di immissione dei dati utilizzando SageMaker Python SDK

SageMaker Python SDK fornisce la classe generica Estimator e le sue varianti per i framework ML per l'avvio di lavori di formazione. È possibile specificare una delle modalità di immissione dei dati durante la configurazione della classe AI o del metodo. SageMaker Estimator Estimator.fit I seguenti modelli di codice mostrano i due modi per specificare le modalità di input.

Per specificare la modalità di input utilizzando la classe dello strumento di valutazione


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    input_mode='File'  # Available options: File | Pipe | FastFile
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train")
)

Per ulteriori informazioni, consulta la classe SageMaker.estimator.Estimator nella documentazione di Python SDK. SageMaker

Come specificare la modalità di input tramite il metodo estimator.fit()


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(
        s3_data="s3://amzn-s3-demo-bucket/my-data/train",
        input_mode='File'  # Available options: File | Pipe | FastFile
    )
)

Per ulteriori informazioni, vedete sagemaker.estimator. Estimator.fitmetodo class e sagemaker.inputs. TrainingInputclasse nella documentazione di SageMaker Python SDK.

Suggerimento

Per ulteriori informazioni su come configurare Amazon FSx for Lustre o Amazon EFS con la SageMaker configurazione VPC utilizzando gli estimatori dell'SDK Python, consulta Use i file system come input di formazione nella documentazione AI Python SDK. SageMaker

Suggerimento

Le integrazioni della modalità di input di dati con Amazon S3, Amazon EFS e FSx for Lustre sono metodi consigliati per configurare in modo ottimale l'origine dati secondo le best practice. Puoi migliorare strategicamente le prestazioni di caricamento dei dati utilizzando le opzioni di storage gestito dall' SageMaker intelligenza artificiale e le modalità di input, ma non è strettamente limitato. È possibile scrivere la propria logica di lettura dei dati direttamente nel container di addestramento. Ad esempio, puoi impostare la lettura da un'origine dati differente, scrivere la tua classe di data loader S3 o utilizzare le funzioni di caricamento dei dati di framework di terze parti all'interno dello script di addestramento. Tuttavia, devi assicurarti di specificare i percorsi corretti che l' SageMaker IA è in grado di riconoscere.

Suggerimento

Se utilizzi un contenitore di formazione personalizzato, assicurati di installare il toolkit di SageMaker formazione che aiuta a configurare l'ambiente per i lavori di SageMaker formazione. Altrimenti, è necessario specificare le variabili di ambiente in modo esplicito nel Dockerfile. Per ulteriori informazioni, consulta Creare un container con algoritmi e modelli personalizzati.

Per ulteriori informazioni su come impostare le modalità di immissione dei dati utilizzando le SageMaker API di basso livelloIn che modo Amazon SageMaker AI fornisce informazioni sulla formazione, consulta CreateTrainingJobAPI e in. TrainingInputMode AlgorithmSpecification

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Configurazione di job di addestramento per accedere ai set di dati

Configurazione del canale di input dei dati per utilizzare Amazon FSx per Lustre