Implantar modelos de base e modelos personalizados e ajustados - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Implantar modelos de base e modelos personalizados e ajustados

Se você está implantando modelos pré-treinados de pesos abertos ou modelos fechados da Amazon ou seus próprios modelos personalizados ou SageMaker JumpStart ajustados armazenados no Amazon S3 ou na Amazon, fornece a infraestrutura flexível e escalável de que você precisa para cargas de trabalho de inferência de produção. FSx SageMaker HyperPod

Implemente modelos de fundações abertas e bloqueadas a partir de JumpStart Implemente modelos personalizados e ajustados do Amazon S3 e da Amazon FSx
Descrição

Implemente com base em um catálogo abrangente de modelos de base pré-treinados com políticas automáticas de otimização e escalabilidade personalizadas para cada família de modelos.

Traga seus próprios modelos personalizados e ajustados e aproveite a infraestrutura corporativa SageMaker HyperPod da empresa para inferência em escala de produção. Escolha entre armazenamento econômico com o Amazon S3 ou um sistema de arquivos de alto desempenho com a Amazon. FSx
Benefícios principais
  • Implantação com um clique por meio da interface do usuário do Amazon SageMaker Studio

  • Ajuste de escala automático habilitado automaticamente com base nas solicitações recebidas.

  • Contêineres e configurações pré-otimizados para cada família de modelos.

  • Tratamento de EULA para modelos fechados

  • Support para vários back-ends de armazenamento: Amazon S3, Amazon FSx

  • Suporte flexível a frameworks e contêineres.

  • Políticas de escalabilidade com base nas características do modelo.

Opções de implantação
  • Amazon SageMaker Studio para implantação visual

  • kubectl para operações nativas do Kubernetes.

  • Python SDK para integração programática.

  • HyperPod CLI para automação de linha de comando

  • kubectl para operações nativas do Kubernetes.

  • Python SDK para integração programática.

  • HyperPod CLI para automação de linha de comando

As seções a seguir orientam você na implantação de modelos da Amazon SageMaker JumpStart , do Amazon S3 e da Amazon. FSx