Implantar um modelo no Studio

Para implantar modelos JumpStart básicos, navegue até um cartão de detalhes do modelo na interface do usuário do Studio. Para obter mais informações sobre como abrir JumpStart no Studio, consulteAbrir JumpStart no Studio. Depois de navegar até a página de detalhes do modelo escolhido, selecione Implantar no canto superior direito da interface do usuário do Studio. Em seguida, siga as etapas em Implantar modelos com o SageMaker Studio.

A Amazon SageMaker JumpStart também oferece implantações otimizadas, que fornecem configurações de implantação predefinidas projetadas para casos de uso específicos, como geração de conteúdo, resumo ou interações no estilo de bate-papo. Ao implantar um modelo compatível, você pode selecionar seu caso de uso alvo e escolher uma otimização de restrição — otimizada para custos, otimizada para produtividade, otimizada para latência ou balanceada — e a Amazon configura SageMaker JumpStart automaticamente o endpoint para esse cenário. Isso oferece visibilidade das principais métricas de desempenho, como latência P50, tempo até o primeiro token (TTFT) e taxa de transferência, ao mesmo tempo em que garante que a implantação seja ajustada à sua carga de trabalho. Para começar, abra a página de detalhes de um modelo compatível no Studio, escolha Implantar e use o painel Desempenho para configurar sua implantação otimizada.

Importante

Alguns modelos de base exigem a aceitação explícita de um contrato de licença de usuário final (EULA) antes da implantação. Para obter mais informações, consulte Aceitação do EULA no Amazon Studio SageMaker.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Fine-tune um modelo no Studio

Avaliar um modelo no Studio