Inferencia en tiempo real - Amazon SageMaker AI

Inferencia en tiempo real

La inferencia en tiempo real es idónea para cargas de trabajo de inferencia con requisitos en tiempo real, interactivos y de baja latencia. Puede implementar en modelo en los servicios de alojamiento de SageMaker AI y obtener un punto de conexión que pueda utilizarse para inferencia. Estos puntos de conexión están totalmente gestionados y admiten autoescalado (consulte Escalado automático de modelos de Amazon SageMaker AI).