Implantar modelos do JumpStart usando o Amazon SageMaker Studio
As etapas a seguir mostram como acessar modelos e soluções do JumpStart usando o Amazon SageMaker Studio.
Pré-requisitos
Verifique se você configurou recursos de inferência em seus clusters do Amazon SageMaker HyperPod. Para ter mais informações, consulte Configurar clusters do HyperPod para implantação de modelos.
Criar uma implantação do HyperPod
-
No Amazon SageMaker Studio, abra a página inicial do JumpStart no por meio do painel de navegação à esquerda.
-
Em Todos os modelos públicos, escolha um modelo que você deseja implantar.
nota
Se você selecionou um modelo fechado, precisará aceitar o contrato de licença de usuário final (EULA).
-
Escolha SageMaker HyperPod.
-
Em Configurações de implantação, o JumpStart recomendará uma instância para implantação. Você pode modificar essas configurações, se necessário.
-
Se você modificar o tipo de instância, verifique se ela é compatível com o cluster do HyperPod escolhido. Se não houver nenhuma instância compatível, você precisará selecionar um novo cluster do HyperPod ou entrar em contato com seu administrador para adicionar instâncias compatíveis ao cluster.
-
Para priorizar a implantação do modelo, instale o complemento de governança de tarefas, crie alocações de computação e configure classificações de tarefas para a política de cluster. Feito isso, você verá uma opção para selecionar uma prioridade para a implantação do modelo, que pode ser usada para antecipar outras implantações e tarefas no cluster.
-
Insira o namespace ao qual seu administrador lhe forneceu acesso. Talvez seja necessário entrar em contato diretamente com seu administrador para obter o namespace exato. Depois que um namespace válido for fornecido, o botão Implantar deverá estar habilitado para implantar o modelo.
-
-
Escolha Implantar e aguarde a criação do endpoint.
-
Depois que o endpoint for criado, selecione Testar inferência.
Editar uma implantação do HyperPod
-
No Amazon SageMaker Studio, selecione Computação e, no painel de navegação à esquerda, escolha Clusters do HyperPod.
-
Em Implantações, escolha a implantação do cluster do HyperPod que você deseja modificar.
-
No ícone de reticências verticais (⋮), escolha Editar.
-
Em Configurações de implantação, você pode habilitar ou desabilitar Ajuste de escala automático e alterar o número e, Máximo de réplicas.
-
Selecione Salvar.
-
O status mudará para Atualizando. Depois que o status voltar para Em serviço, suas alterações serão concluídas e você verá uma mensagem confirmando isso.
Excluir uma implantação do HyperPod
-
No Amazon SageMaker Studio, selecione Computação e, no painel de navegação à esquerda, escolha Clusters do HyperPod.
-
Em Implantações, escolha a implantação do cluster do HyperPod que você deseja modificar.
-
No ícone de reticências verticais (⋮), escolha Excluir.
-
Na janela Excluir implantação do HyperPod, marque a caixa de seleção.
-
Escolha Excluir.
-
O status mudará para Excluindo. Depois que a implantação do HyperPod for excluída, você verá uma mensagem confirmando isso.