Implemente modelos básicos y modelos personalizados ajustados - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Implemente modelos básicos y modelos personalizados ajustados

Ya sea que esté implementando modelos básicos preentrenados de contrapesos o cerrados de Amazon SageMaker JumpStart o sus propios modelos personalizados o ajustados almacenados en Amazon S3 o Amazon FSx, SageMaker HyperPod proporciona la infraestructura flexible y escalable que necesita para las cargas de trabajo de inferencia de producción.

Implemente modelos de bases abiertas y cerradas desde JumpStart Implemente modelos personalizados y ajustados de Amazon S3 y Amazon FSx
Descripción

Implemente a partir de un catálogo completo de modelos básicos previamente entrenados con políticas de escalado y optimización automáticas adaptadas a cada familia de modelos.

Cree sus propios modelos personalizados y ajustados y aproveche la infraestructura empresarial de la empresa para realizar inferencias a escala SageMaker HyperPod de producción. Elija entre un almacenamiento rentable con Amazon S3 o un sistema de archivos de alto rendimiento con Amazon FSx.
Ventajas principales
  • Despliegue con un clic a través de la interfaz de usuario de Amazon SageMaker Studio

  • El escalado automático en función de las solicitudes entrantes se habilita automáticamente

  • Contenedores y configuraciones preoptimizados para cada familia de modelos

  • Gestión del EULA para modelos cerrados

  • Support para múltiples backends de almacenamiento: Amazon S3, Amazon FSx

  • Soporte flexible para contenedores y marcos

  • Políticas de escalado personalizadas en función de las características de su modelo

Opciones de implementación
  • Amazon SageMaker Studio para despliegue visual

  • kubectl para operaciones nativas de Kubernetes

  • SDK de Python para integración programática

  • HyperPod CLI para la automatización de la línea de comandos

  • kubectl para operaciones nativas de Kubernetes

  • SDK de Python para integración programática

  • HyperPod CLI para la automatización de la línea de comandos

En las siguientes secciones, se explica cómo implementar modelos de Amazon SageMaker JumpStart y Amazon S3 y Amazon FSx.