Implemente modelos básicos e modelos personalizados e ajustados - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Implemente modelos básicos e modelos personalizados e ajustados

Se você está implantando modelos pré-treinados de pesos abertos ou modelos fechados da Amazon ou seus próprios modelos personalizados ou SageMaker JumpStart ajustados armazenados no Amazon S3 ou na Amazon, fornece a infraestrutura flexível e escalável de que você precisa para cargas de trabalho de inferência de produção. FSx SageMaker HyperPod

Implemente modelos de fundações abertas e bloqueadas a partir de JumpStart Implemente modelos personalizados e ajustados do Amazon S3 e da Amazon FSx
Descrição

Implemente a partir de um catálogo abrangente de modelos básicos pré-treinados com políticas automáticas de otimização e escalabilidade personalizadas para cada família de modelos.

Traga seus próprios modelos personalizados e ajustados e aproveite a infraestrutura corporativa SageMaker HyperPod da empresa para inferência em escala de produção. Escolha entre armazenamento econômico com o Amazon S3 ou um sistema de arquivos de alto desempenho com a Amazon. FSx
Benefícios principais
  • Implantação com um clique por meio da interface do usuário do Amazon SageMaker Studio

  • Escalonamento automático com base nas solicitações recebidas ativado automaticamente

  • Contêineres e configurações pré-otimizados para cada família de modelos

  • Tratamento de EULA para modelos fechados

  • Support para vários back-ends de armazenamento: Amazon S3, Amazon FSx

  • Suporte flexível para contêineres e estruturas

  • Políticas de escalabilidade personalizadas com base nas características do seu modelo

Opções de implantação
  • Amazon SageMaker Studio para implantação visual

  • kubectl para operações nativas do Kubernetes

  • SDK do Python para integração programática

  • HyperPod CLI para automação de linha de comando

  • kubectl para operações nativas do Kubernetes

  • SDK do Python para integração programática

  • HyperPod CLI para automação de linha de comando

As seções a seguir orientam você na implantação de modelos da Amazon SageMaker JumpStart , do Amazon S3 e da Amazon. FSx