Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Streamen Sie die Integrationsantwort für Ihre Proxy-Integrationen in API Gateway
Sie können Ihre Proxyintegration so konfigurieren, dass sie die Art steuert, wie API Gateway die Integrationsantwort zurückgibt. Standardmäßig wartet API Gateway auf den Empfang der vollständigen Antwort, bevor die Übertragung gestartet wird. Wenn Sie jedoch den Antwortübertragungsmodus Ihrer Integration auf einstellenSTREAM, wartet API Gateway nicht, bis eine Antwort vollständig berechnet ist, bevor sie an den Client gesendet wird. Das Antwort-Streaming funktioniert für alle Arten von REST-API-Endpunkttypen.
Verwenden Sie das Antwort-Streaming für die folgenden Anwendungsfälle:
-
Senken Sie den time-to-first-byte (TTFB) für generative KI-Anwendungen wie Chatbots.
-
Streamen Sie große Bild-, Video- oder Musikdateien, ohne eine vorsignierte S3-URL zu verwenden.
-
Führen Sie lang andauernde Operationen durch und melden Sie inkrementelle Fortschritte, z. B. vom Server gesendete Ereignisse (SSE).
-
Überschreiten Sie das Limit von 10 MB Antwort-Nutzlast von API Gateway.
Überschreiten Sie das Timeout-Limit von 29 Sekunden von API Gateway, ohne eine Erhöhung des Integrations-Timeout-Limits zu beantragen.
Empfangen Sie eine binäre Nutzlast, ohne die binären Medientypen zu konfigurieren.
Überlegungen zum Streaming von Antwort-Payloads
Die folgenden Überlegungen könnten sich auf Ihre Verwendung von Antwort-Payload-Streaming auswirken:
-
Sie können das Streaming von Antwortnutzlasten nur für
HTTP_PROXYAWS_PROXYIntegrationstypen verwenden. Dazu gehören Lambda-Proxy-Integrationen und private Integrationen, die Integrationen verwenden.HTTP_PROXY Die Standardeinstellung für den Übertragungsmodus ist.
BUFFEREDUm das Antwortstreaming zu verwenden, müssen Sie den Antwortübertragungsmodus auf ändernSTREAM.-
Antwortstreaming wird nur für REST unterstützt APIs.
-
Anforderungsstreaming wird nicht unterstützt.
-
Sie können Ihre Antwort bis zu 15 Minuten lang streamen.
Bei Ihren Streams kann es zu Timeouts im Leerlauf kommen. Bei regionalen oder privaten Endpunkten beträgt das Timeout 5 Minuten. Bei Edge-optimierten Endpunkten beträgt das Timeout 30 Sekunden.
-
Wenn Sie das Antwort-Streaming für eine regionale REST-API mit Ihrer eigenen CloudFront Distribution verwenden, können Sie ein Leerlaufzeitlimit von mehr als 30 Sekunden erreichen, indem Sie das Antwort-Timeout Ihrer Distribution erhöhen. CloudFront Weitere Informationen finden Sie unter Antwort-Timeout.
-
Wenn der Antwortübertragungsmodus auf eingestellt ist
STREAM, kann API Gateway keine Funktionen unterstützen, die eine Pufferung der gesamten Integrationsantwort erfordern. Aus diesem Grund werden die folgenden Funktionen beim Antwort-Streaming nicht unterstützt:Endpunkt-Caching
-
Kodierung von Inhalten. Wenn Sie Ihre Integrationsantwort komprimieren möchten, tun Sie dies in Ihrer Integration.
Transformation der Antwort mit VTL
-
Innerhalb jeder Streaming-Antwort unterliegen die ersten 10 MB der Antwort-Nutzlast keinen Bandbreitenbeschränkungen. Antwort-Nutzdaten, die 10 MB überschreiten, sind auf 2 MB/s beschränkt.
-
Wenn die Verbindung zwischen dem Client und API Gateway oder zwischen API Gateway und Lambda aufgrund eines Timeouts geschlossen wird, wird die Lambda-Funktion möglicherweise weiterhin ausgeführt. Weitere Informationen finden Sie unter Lambda-Funktions-Timeout konfigurieren.
-
Das Streaming von Antworten ist mit Kosten verbunden. Weitere Informationen finden Sie unter API-Gateway-Preise
.