Mapeamento de caminhos de armazenamento de treinamento gerenciados pelo Amazon SageMaker AI - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Mapeamento de caminhos de armazenamento de treinamento gerenciados pelo Amazon SageMaker AI

Esta página fornece um resumo geral de como a plataforma de treinamento do SageMaker gerencia caminhos de armazenamento para conjuntos de dados de treinamento, artefatos de modelo, pontos de verificação e saídas entre o armazenamento em nuvem da AWS e as tarefas de treinamento no SageMaker AI. Ao longo deste guia, você aprende a identificar os caminhos padrão definidos pela plataforma do SageMaker AI e como os canais de dados podem ser simplificados com suas fontes de dados no Amazon Simple Storage Service (Amazon S3), FSx para Lustre e Amazon EFS. Para obter mais informações sobre opções de armazenamento e modos de entrada de canais de dados, consulte Como configurar trabalhos de treinamento para acessar conjuntos de dados.

Visão geral de como o SageMaker AI mapeia caminhos de armazenamento

O diagrama a seguir mostra um exemplo de como o SageMaker AI mapeia caminhos de entrada e saída quando você executa uma tarefa de treinamento usando a classe Estimator do SageMaker Python SDK.

Um exemplo de como o SageMaker AI mapeia os caminhos entre o contêiner da tarefa de treinamento e o armazenamento quando você executa uma tarefa de treinamento usando a classe Estimador do SageMaker Python SDK e o respectivo método fit.

O SageMaker AI mapeia caminhos de armazenamento entre um armazenamento (como Amazon S3, Amazon FSx e Amazon EFS) e o contêiner de treinamento do SageMaker com base nos caminhos e no modo de entrada especificados por meio de um objeto estimador do SageMaker AI. Para ter mais informações sobre como o SageMaker AI lê ou grava nos caminhos e a finalidade dos caminhos, consulte Variáveis de ambiente do SageMaker AI e caminhos padrão para locais de armazenamento de treinamento.

Você pode usar OutputDataConfig na API CreateTrainingJob para salvar os resultados do treinamento de modelo em um bucket do S3. Use a API ModelArtifacts para descobrir buckets do S3 que contêm os artefatos do modelo. Consulte o caderno abalone_build_train_deploy para ver um exemplo de caminhos de saída e como eles são usados em chamadas de API.

Para ter mais informações e exemplos de como o SageMaker AI gerencia a fonte de dados, os modos de entrada e os caminhos locais nas instâncias de treinamento do SageMaker, consulte Acessar dados de treinamento.