Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Características admitidas
Amazon SageMaker AI ofrece las siguientes cuatro opciones para implementar modelos con fines de inferencia.
-
Inferencia en tiempo real para cargas de trabajo de inferencia con requisitos en tiempo real, interactivos y de baja latencia.
-
Transformación por lotes para inferencias fuera de línea con grandes conjuntos de datos.
-
Inferencia asíncrona para realizar inferencias prácticamente en tiempo real con entradas de gran tamaño que requieren tiempos de preprocesamiento más prolongados.
-
Inferencia sin servidor para cargas de trabajo de inferencia que tienen períodos de inactividad entre picos de tráfico repentinos.
En la siguiente tabla se resumen las funciones principales de la plataforma compatibles con cada opción de inferencia. No muestra las funciones que pueden proporcionar los marcos, los contenedores Docker personalizados o el encadenamiento de diferentes servicios AWS.
| Característica | Inferencia en tiempo real | Transformación por lotes | Inferencia asíncrona | Inferencia sin servidor | Contenedores de Docker |
|---|---|---|---|---|---|
| Soporte de escalado automático | ✓ | N/A | ✓ | ✓ | N/A |
| Soporte de GPU | ✓1 | ✓1 | ✓1 | 1P, prediseñado, BYOC | |
| Modelo único | ✓ | ✓ | ✓ | ✓ | N/A |
| Punto de conexión multimodelo | ✓ | k-NN, XGBoost, aprendizaje lineal, RCF, TensorFlow, Apache MXNet, PyTorch, scikit-learn 2 | |||
| Punto de conexión con varios contenedores | ✓ | 1P, prediseñado, Extend prediseñado, BYOC | |||
| Canalización de inferencia en serie | ✓ | ✓ | 1P, prediseñado, Extend prediseñado, BYOC | ||
| Recomendador de inferencias | ✓ | 1P, prediseñado, Extend prediseñado, BYOC | |||
| Compatibilidad con enlace privado | ✓ | ✓ | ✓ | N/A | |
| Soporte para captura de datos/monitor de modelos | ✓ | ✓ | N/A | ||
| Compatible con DLC |
1P, prediseñado, Extend prediseñado, BYOC | 1P, prediseñado, Extend prediseñado, BYOC | 1P, prediseñado, Extend prediseñado, BYOC | 1P, prediseñado, Extend prediseñado, BYOC | N/A |
| Protocolos admitidos | HTTP(S) | HTTP(S) | HTTP(S) | HTTP(S) | N/A |
| Tamaño de carga | < 6 MB | ≤ 100 MB | ≤ 1 GB | ≤ 4 MB | |
| Codificación fragmentada HTTP | Depende del marco, no se admite 1P | N/A | Depende del marco, no se admite 1P | Depende del marco, no se admite 1P | N/A |
| Tiempo de espera de la solicitud | < 60 segundos | Días | 1 hora | < 60 segundos | N/A |
| Barreras de protección de implementación: implementaciones azul/verde | ✓ | N/A | ✓ | N/A | |
| Barreras de protección de implementación: implementaciones continuas | ✓ | N/A | ✓ | N/A | |
| Pruebas de sombra | ✓ | N/A | |||
| Escalado a cero | N/A | ✓ | ✓ | N/A | |
| Compatibilidad con los paquetes modelo de Market Place | ✓ | ✓ | N/A | ||
| Compatibilidad con nubes virtuales privadas | ✓ | ✓ | ✓ | N/A | |
| Compatibilidad con múltiples variantes de producción | ✓ | N/A | |||
| Aislamiento de red | ✓ | ✓ | N/A | ||
| Compatibilidad con servicio paralelo modelo | ✓3 | ✓ | ✓3 | ✓3 | |
| Cifrado de volumen | ✓ | ✓ | ✓ | ✓ | N/A |
| Cliente AWS KMS | ✓ | ✓ | ✓ | ✓ | N/A |
| Instancias compatibles d | ✓ | ✓ | ✓ | N/A | |
| soporte inf1 | ✓ | ✓ |
Con SageMaker AI, puede implementar un único modelo o varios modelos detrás de un único punto de conexión de inferencia para realizar inferencias en tiempo real. En la siguiente tabla se resumen las funciones principales compatibles con las distintas opciones de alojamiento que vienen con la inferencia en tiempo real.
| Característica | Puntos de conexión de modelo único | Puntos de conexión multimodelo | Canalización de inferencia en serie | Puntos de conexión con varios contenedores |
|---|---|---|---|---|
| Soporte de escalado automático | ✓ | ✓ | ✓ | ✓ |
| Soporte de GPU | ✓ 1 | ✓ | ✓ | |
| Modelo único | ✓ | ✓ | ✓ | ✓ |
| Puntos de conexión multimodelo | ✓ | ✓ | N/A | |
| Puntos de conexión con varios contenedores | ✓ | N/A | ||
| Canalización de inferencia en serie | ✓ | ✓ | N/A | |
| Recomendador de inferencias | ✓ | |||
| Compatibilidad con enlace privado | ✓ | ✓ | ✓ | ✓ |
| Soporte para captura de datos/monitor de modelos | ✓ | N/A | N/A | N/A |
| Compatible con DLC | 1P, prediseñado, Extend prediseñado, BYOC | k-NN, XGBoost, aprendizaje lineal, RCF, TensorFlow, Apache MXNet, PyTorch, scikit-learn 2 | 1P, prediseñado, Extend prediseñado, BYOC | 1P, prediseñado, Extend prediseñado, BYOC |
| Protocolos admitidos | HTTP(S) | HTTP(S) | HTTP(S) | HTTP(S) |
| Tamaño de carga | < 6 MB | < 6 MB | < 6 MB | < 6 MB |
| Tiempo de espera de la solicitud | < 60 segundos | < 60 segundos | < 60 segundos | < 60 segundos |
| Barreras de protección de implementación: implementaciones azul/verde | ✓ | ✓ | ✓ | ✓ |
| Barreras de protección de implementación: implementaciones continuas | ✓ | ✓ | ✓ | ✓ |
| Pruebas de sombra | ✓ | |||
| Compatibilidad con los paquetes modelo de Market Place | ✓ | |||
| Compatibilidad con nubes virtuales privadas | ✓ | ✓ | ✓ | ✓ |
| Compatibilidad con múltiples variantes de producción | ✓ | ✓ | ✓ | |
| Aislamiento de red | ✓ | ✓ | ✓ | ✓ |
| Compatibilidad con servicio paralelo modelo | ✓ 3 | ✓ 3 | ||
| Cifrado de volumen | ✓ | ✓ | ✓ | ✓ |
| Cliente AWS KMS | ✓ | ✓ | ✓ | ✓ |
| Instancias compatibles d | ✓ | ✓ | ✓ | ✓ |
| soporte inf1 | ✓ |
1 La disponibilidad de los tipos de instancias de Amazon EC2 depende de la Región AWS. Para conocer la disponibilidad de instancias específicas de AWS, consulte los precios de Amazon SageMaker AI
2 Para utilizar cualquier otro marco o algoritmo, use el conjunto de herramientas de inferencia de SageMaker AI para compilar un contenedor que admita puntos de conexión multimodelo.
3 Con SageMaker AI, puede implementar modelos grandes (hasta 500 GB) para realizar inferencias. Puede configurar la comprobación del estado del contenedor y los tiempos de espera de descarga, de hasta 60 minutos. Esto le permitirá disponer de más tiempo para descargar y cargar el modelo y los recursos asociados. Para obtener más información, consulte Parámetros de punto de conexión de SageMaker AI para inferencia de modelos grandes. Puede utilizar contenedores de inferencia de modelos grandes