Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Inférence en temps réel
<a name="realtime-endpoints"></a>

 L'inférence en temps réel est idéale pour les charges de travail d'inférence où vous avez des exigences en temps réel, interactives et à faible latence. Vous pouvez déployer votre modèle sur des services d'hébergement d' SageMaker IA et obtenir un point de terminaison pouvant être utilisé à des fins d'inférence. Ces points de terminaison sont entièrement gérés et prennent en charge la scalabilité automatique (voir [Mise à l'échelle automatique des modèles Amazon SageMaker AI](endpoint-auto-scaling.md)). 

**Topics**
+ [Déploiement de modèles pour l’inférence en temps réel](realtime-endpoints-deploy-models.md)
+ [Invocation de modèles pour une inférence en temps réel](realtime-endpoints-test-endpoints.md)
+ [Points de terminaison](realtime-endpoints-manage.md)
+ [Options d’hébergement](realtime-endpoints-options.md)
+ [Mise à l'échelle automatique des modèles Amazon SageMaker AI](endpoint-auto-scaling.md)
+ [Volumes de stockage d’instances](host-instance-storage.md)
+ [Validation de modèles en production](model-validation.md)
+ [Explicabilité en ligne avec Clarify SageMaker](clarify-online-explainability.md)
+ [Peaufinage des modèles avec les composants d’inférence des adaptateurs](realtime-endpoints-adapt.md)