

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Echtzeit-Inferenz
<a name="realtime-endpoints"></a>

 Echtzeit-Inferenz ist ideal für Inferenz-Workloads, bei denen interaktive Echtzeitanforderungen mit niedriger Latenz gestellt werden. Sie können Ihr Modell für SageMaker KI-Hosting-Dienste bereitstellen und einen Endpunkt erhalten, der für Inferenzen verwendet werden kann. Diese Endgeräte werden vollständig verwaltet und unterstützen Autoscaling (siehe [Automatische Skalierung von Amazon SageMaker AI-Modellen](endpoint-auto-scaling.md)). 

**Topics**
+ [Modelle für Echtzeit-Inferenzen bereitstellen](realtime-endpoints-deploy-models.md)
+ [Aufrufen von Modellen für Echtzeit-Inferenz](realtime-endpoints-test-endpoints.md)
+ [Endpunkte](realtime-endpoints-manage.md)
+ [Hosting-Optionen](realtime-endpoints-options.md)
+ [Automatische Skalierung von Amazon SageMaker AI-Modellen](endpoint-auto-scaling.md)
+ [Instance-Speicher-Volumes](host-instance-storage.md)
+ [Validieren von Modellen in der Produktion](model-validation.md)
+ [Online-Erklärbarkeit mit Clarify SageMaker](clarify-online-explainability.md)
+ [Optimierung von Modellen mit Adapter-Inferenzkomponenten](realtime-endpoints-adapt.md)