As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
SageMaker HyperPod gerenciamento de clusters
Os tópicos a seguir abordam o registro e o gerenciamento de SageMaker HyperPod clusters.
Registrando SageMaker HyperPod eventos
Todos os eventos e registros de SageMaker HyperPod são salvos na Amazon CloudWatch com o nome do grupo de registros/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. Cada chamada para a API CreateCluster cria um novo grupo de logs. A lista a seguir contém todos os fluxos de logs disponíveis coletados em cada grupo de logs.
| Nome do grupo de logs | Nome do fluxo de logs |
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] |
LifecycleConfig/[instance-group-name]/[instance-id] |
Registro SageMaker HyperPod em nível de instância
Você pode acessar os LifecycleScript registros publicados CloudWatch durante a configuração da instância do cluster. Cada instância dentro do cluster criado gera um fluxo de log separado, que pode ser distinguido pelo formato LifecycleConfig/[instance-group-name]/[instance-id].
Todos os registros gravados /var/log/provision/provisioning.log são enviados para o CloudWatch stream anterior. Amostra LifecycleScripts ao 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configstdout e stderr para este local. Se você estiver usando seus scripts personalizados, grave seus registros no /var/log/provision/provisioning.log local em que eles estejam disponíveis CloudWatch.
Marcar recursos
AWS O sistema de marcação ajuda a gerenciar, identificar, organizar, pesquisar e filtrar recursos. SageMaker HyperPod oferece suporte à marcação, para que você possa gerenciar os clusters como um AWS recurso. Durante a criação do cluster ou a edição de um cluster existente, você pode adicionar ou editar marcações para o cluster. Para saber mais sobre a marcação em geral, consulte Como marcar seus AWS recursos.
Usando a interface do usuário SageMaker HyperPod do console
Quando você está criando um novo cluster ou editando um cluster, pode adicionar, remover ou editar marcações.
Usando o SageMaker HyperPod APIs
Ao escrever um arquivo de solicitação de UpdateClusterAPI CreateClusterou de uma API no formato JSON, edite a Tags seção.
Usando os comandos de AWS CLI marcação para IA SageMaker
Para marcar um cluster
Use aws sagemaker add-tags da seguinte forma:
aws sagemaker add-tags --resource-arncluster_ARN--tags Key=string,Value=string
Para desmarcar um cluster
Use aws sagemaker delete-tags da seguinte forma:
aws sagemaker delete-tags --resource-arncluster_ARN--tag-keys"tag_key"
Para listar as marcações para um recurso
Use aws sagemaker list-tags da seguinte forma:
aws sagemaker list-tags --resource-arncluster_ARN