

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Implante modelos JumpStart usando o Amazon SageMaker Studio
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui"></a>

As etapas a seguir mostram como implantar modelos JumpStart usando o Amazon SageMaker Studio.

## Pré-requisitos
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-prereqs"></a>

Verifique se você configurou recursos de inferência em seus SageMaker HyperPod clusters da Amazon. Para obter mais informações, consulte [Configurando seus HyperPod clusters para implantação de modelos](sagemaker-hyperpod-model-deployment-setup.md). 

## Crie uma HyperPod implantação
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-create"></a>

1. No Amazon SageMaker Studio, abra a **JumpStart**página inicial no painel de navegação esquerdo. 

1. Em **Todos os modelos públicos**, escolha um modelo que você deseja implantar.
**nota**  
Se você selecionou um modelo fechado, precisará aceitar o contrato de licença de usuário final (EULA).

1. Selecione **SageMaker HyperPod**.

1. Em **Configurações de implantação**, JumpStart recomendará uma instância para implantação. Você pode modificar essas configurações, se necessário.

   1. Se você modificar o **tipo de instância**, verifique se ela é compatível com o **HyperPod cluster** escolhido. Se não houver nenhuma instância compatível, você precisará selecionar um novo **HyperPod cluster** ou entrar em contato com seu administrador para adicionar instâncias compatíveis ao cluster.

   1. Para priorizar a implantação do modelo, instale o complemento de governança de tarefas, crie alocações de computação e configure classificações de tarefas para a política de cluster. Feito isso, você verá uma opção para selecionar uma prioridade para a implantação do modelo, que pode ser usada para antecipar outras implantações e tarefas no cluster. 

   1. Insira o namespace ao qual seu administrador lhe forneceu acesso. Talvez seja necessário entrar em contato diretamente com seu administrador para obter o namespace exato. Depois que um namespace válido for fornecido, o botão **Implantar** deverá estar habilitado para implantar o modelo.

   1. Se o tipo de instância for particionado (habilitado para MIG), selecione um tipo de partição de **GPU**.

   1. Se você quiser habilitar o L2 KVCache ou o roteamento inteligente para acelerar a inferência do LLM, ative-os. Por padrão, somente o L1 KV Cache está habilitado. Para obter mais detalhes sobre KVCache roteamento inteligente, consulte [implantação SageMaker HyperPod do modelo](sagemaker-hyperpod-model-deployment.md).

1. Escolha **Implantar** e aguarde a criação do **endpoint**.

1. Depois que o **endpoint** for criado, selecione **Testar inferência**.

## Editar uma HyperPod implantação
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-edit"></a>

1. No Amazon SageMaker Studio, selecione **Computação e**, em seguida, **HyperPodclusters** no painel de navegação esquerdo. 

1. Em **Implantações**, escolha a implantação do HyperPod cluster que você deseja modificar.

1. No ícone de reticências verticais (⋮), escolha **Editar**.

1. Em **Configurações de implantação**, você pode habilitar ou desabilitar **Ajuste de escala automático** e alterar o número e, **Máximo de réplicas**.

1. Selecione **Salvar**.

1. O **status** mudará para **Atualizando**. Depois que o status voltar para **Em serviço**, suas alterações serão concluídas e você verá uma mensagem confirmando isso.

## Excluir uma HyperPod implantação
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-delete"></a>

1. No Amazon SageMaker Studio, selecione **Computação e**, em seguida, **HyperPodclusters** no painel de navegação esquerdo. 

1. Em **Implantações**, escolha a implantação do HyperPod cluster que você deseja modificar.

1. No ícone de reticências verticais (⋮), escolha **Excluir**.

1. Na **janela Excluir HyperPod implantação**, marque a caixa de seleção.

1. Escolha **Excluir**.

1. O **status** mudará para **Excluindo**. Depois que a HyperPod implantação for excluída, você verá uma mensagem confirmando isso.