Streaming respons integrasi untuk integrasi proxy Anda di API Gateway - Amazon API Gateway

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Streaming respons integrasi untuk integrasi proxy Anda di API Gateway

Anda dapat mengonfigurasi integrasi proksi untuk mengontrol cara API Gateway menghasilkan respons integrasi Anda. Secara default, API Gateway menunggu untuk menerima respons lengkap sebelum memulai transmisi. Namun, jika Anda menyetel mode transfer respons integrasi keSTREAM, API Gateway tidak menunggu respons dihitung sepenuhnya sebelum mengirimkannya ke klien. Aliran respons berfungsi untuk semua jenis titik akhir API REST.

Gunakan streaming respons untuk kasus penggunaan berikut:

  • Turunkan time-to-first-byte (TTFB) untuk aplikasi AI generatif seperti chatbots.

  • Streaming file gambar, video, atau musik besar tanpa menggunakan URL S3 yang telah ditandatangani sebelumnya.

  • Lakukan operasi yang berjalan lama sambil melaporkan kemajuan tambahan seperti peristiwa terkirim server (SSE).

  • Melebihi batas muatan respons 10 MB API Gateway.

  • Melebihi batas waktu tunggu 29 detik API Gateway tanpa meminta peningkatan batas batas waktu integrasi.

  • Menerima payload biner tanpa mengkonfigurasi jenis media biner.

Pertimbangan untuk streaming payload respons

Pertimbangan berikut dapat memengaruhi penggunaan streaming payload respons Anda:

  • Anda hanya dapat menggunakan streaming payload respons untuk HTTP_PROXY atau jenis AWS_PROXY integrasi. Ini termasuk integrasi proxy Lambda dan integrasi pribadi yang menggunakan integrasi. HTTP_PROXY

  • Pengaturan mode transfer default adalahBUFFERED. Untuk menggunakan streaming respons, Anda harus mengubah mode transfer respons keSTREAM.

  • Streaming respons hanya didukung untuk REST APIs.

  • Permintaan streaming tidak didukung.

  • Anda dapat melakukan streaming respons Anda hingga 15 menit.

  • Streaming Anda tunduk pada batas waktu idle. Untuk titik akhir Regional atau pribadi, batas waktu adalah 5 menit. Untuk titik akhir yang dioptimalkan tepi, batas waktu adalah 30 detik.

  • Jika Anda menggunakan streaming respons untuk REST API Regional dengan CloudFront distribusi Anda sendiri, Anda dapat mencapai waktu idle lebih dari 30 detik dengan meningkatkan batas waktu respons distribusi Anda CloudFront. Untuk informasi selengkapnya, lihat Batas waktu respons.

  • Saat mode transfer respons disetel keSTREAM, API Gateway tidak dapat mendukung fitur yang memerlukan buffering seluruh respons integrasi. Karena itu, fitur berikut tidak didukung dengan streaming respons:

    • Caching titik akhir

    • Pengkodean konten. Jika Anda ingin mengompres respons integrasi Anda, lakukan ini dalam integrasi Anda.

    • Transformasi respons dengan VTL

  • Dalam setiap respons streaming, muatan respons 10MB pertama tidak tunduk pada batasan bandwidth apa pun. Data payload respons melebihi 10MB dibatasi hingga 2MB/s.

  • Ketika koneksi antara klien dan API Gateway atau antara API Gateway dan Lambda ditutup karena batas waktu, fungsi Lambda mungkin terus dijalankan. Untuk informasi selengkapnya, lihat Mengonfigurasi batas waktu fungsi Lambda.

  • Streaming respons menimbulkan biaya. Untuk informasi selengkapnya, lihat Harga API Gateway.