Mode throughput - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mode throughput

Amazon SageMaker Feature Store menyediakan dua model harga untuk dipilih: mode throughput on-demand (On-demand) dan provisioned (Provisioned). On-demandbekerja paling baik untuk lalu lintas yang kurang dapat diprediksi, sementara Provisioned bekerja paling baik untuk lalu lintas yang konsisten dan dapat diprediksi.

Anda memiliki opsi untuk beralih antara On-demand dan mode Provisioned throughput untuk grup fitur tertentu, untuk mengakomodasi periode di mana pola lalu lintas aplikasi berubah atau kurang dapat diprediksi. Anda hanya dapat memperbarui mode throughput grup fitur Anda menjadi On-demand sekali dalam periode 24 jam. Mode throughput dapat diperbarui secara terprogram menggunakan UpdateFeatureGroupAPI atau melalui UI konsol. Untuk informasi selengkapnya tentang konsol X-Ray, lihat Menggunakan Amazon SageMaker Feature Store di konsol.

Anda dapat menggunakan mode Provisioned throughput dengan grup fitur khusus offline atau grup fitur dengan jenis penyimpanan. Standard Untuk konfigurasi penyimpanan lainnya, mode On-demand throughput digunakan. Untuk informasi tentang konfigurasi penyimpanan online dan offline, lihat Toko online danToko offline, masing-masing.

Untuk detail selengkapnya, lihat harga Amazon ElastiCache.

Mode throughput sesuai permintaan

Mode throughput On-demand (default) berfungsi paling baik saat Anda menggunakan grup fitur dengan beban kerja yang tidak diketahui, lalu lintas aplikasi yang tidak dapat diprediksi, dan Anda tidak dapat memperkirakan persyaratan kapasitas.

On-demandMode ini menagih biaya untuk membaca dan menulis yang dilakukan aplikasi pada grup fitur Anda. Anda tidak perlu menentukan berapa banyak throughput baca dan tulis yang Anda harapkan untuk dijalankan oleh aplikasi Anda, karena DynamoDB langsung mengakomodasi beban kerja Anda saat beban kerja tersebut naik atau turun. Anda hanya membayar untuk apa yang Anda gunakan, yang diukur dalam ReadRequestsUnits danWriteRequestsUnits.

Anda dapat mengaktifkan mode On-demand throughput menggunakan CreateFeatureGroupatau UpdateFeatureGroup APIs atau melalui UI konsol. Untuk informasi lebih lanjut mengenai penggunaan konteks IDT, lihat Menggunakan Amazon SageMaker Feature Store di konsol.

penting

Anda hanya dapat memperbarui mode throughput grup fitur Anda menjadi On-demand sekali dalam periode 24 jam.

Throughput yang Disediakan

Mode Provisioned throughput bekerja paling baik saat Anda menggunakan grup fitur dengan beban kerja yang dapat diprediksi dan Anda dapat memperkirakan persyaratan kapasitas untuk mengontrol biaya. Ini dapat membuatnya lebih hemat biaya untuk beban kerja tertentu di mana Anda dapat mengantisipasi persyaratan throughput sebelumnya.

Saat Anda mengatur grup fitur ke Provisioned mode, Anda menentukan unit kapasitas yang merupakan jumlah maksimum kapasitas yang dapat dikonsumsi aplikasi dari grup fitur. Jika aplikasi Anda melebihi kapasitas throughput yang disediakan pada tabel atau indeks, aplikasi tersebut akan dikenakan throttling permintaan.

Berikut ini mencakup informasi tentang unit kapasitas baca dan tulis.

  • Mengambil satu record hingga 4 KB menggunakan GetRecord API akan mengkonsumsi setidaknya 1 RCU (unit kapasitas baca). Mengambil muatan yang lebih besar mungkin membutuhkan lebih banyak. Jumlah total unit kapasitas baca yang diperlukan tergantung pada ukuran item, termasuk metadata kecil per catatan yang ditambahkan oleh layanan Feature Store.

  • Permintaan tulis tunggal dengan muatan 1 KB menggunakan PutRecord API akan menggunakan setidaknya 1 WCU (unit kapasitas tulis), dengan muatan pecahan dibulatkan ke KB terdekat. Ini mungkin mengkonsumsi lebih banyak tergantung pada waktu acara, status penghapusan catatan, dan status time to live (TTL). Untuk informasi selengkapnya tentang IAM, lihat Durasi waktu ke tayang (TTL) untuk rekaman.

penting

Saat mengatur unit kapasitas Anda, pertimbangkan hal berikut:

  • Anda akan dikenakan biaya untuk kapasitas baca dan tulis yang Anda berikan untuk grup fitur Anda, bahkan jika Anda tidak sepenuhnya memanfaatkan kapasitas tersebutProvisioned.

  • Jika Anda menyetel kapasitas baca atau tulis terlalu rendah, permintaan Anda mungkin mengalami pembatasan.

  • Dalam beberapa kasus, catatan dapat menggunakan unit kapasitas tambahan karena metadata tingkat rekaman yang ditambahkan oleh layanan Feature Store untuk mengaktifkan berbagai fitur.

  • Mengambil hanya sebagian fitur yang menggunakan GetRecord atau masih BatchGetRecord APIs akan menggunakan RCU yang sesuai dengan seluruh catatan.

  • Untuk kapasitas tulis, Anda harus menyediakan 2x kapasitas puncak baru-baru ini untuk menghindari pelambatan saat melakukan pengisian ulang atau konsumsi massal yang dapat menghasilkan sejumlah besar penulisan catatan sejarah. Ini karena menulis catatan sejarah menghabiskan kapasitas menulis tambahan.

  • Toko Fitur saat ini tidak mendukung penskalaan otomatis untuk Provisioned mode.

Anda dapat mengaktifkan mode On-demand throughput menggunakan CreateFeatureGroupatau UpdateFeatureGroup APIs atau melalui UI konsol. Untuk informasi lebih lanjut mengenai penggunaan konteks IDT, lihat Menggunakan Amazon SageMaker Feature Store di konsol.

Berikut ini menjelaskan bagaimana Anda dapat menambah atau mengurangi throughput RCU dan WCU untuk grup fitur Anda saat Provisioned mode diaktifkan.

Meningkatkan throughput yang disediakan

Anda dapat meningkatkan RCU atau WCU sesering yang diperlukan menggunakan UpdateFeatureGroupAPI atau UI konsol.

Menurunkan throughput yang disediakan

Anda dapat mengurangi RCU dan WCU (atau keduanya) untuk grup fitur yang menggunakan UpdateFeatureGroupAPI atau UI konsol.

Terdapat kuota default pada jumlah penurunan kapasitas yang tersedia yang dapat Anda lakukan pada tabel DynamoDB per hari. Satu hari ditentukan berdasarkan Waktu Universal Terkoordinasi (UTC). Pada hari tertentu, Anda dapat memulai dengan melakukan hingga empat penurunan dalam satu jam selama Anda belum melakukan penurunan lainnya pada hari tersebut. Selanjutnya, Anda dapat melakukan satu penurunan tambahan per jam selama tidak ada penurunan pada jam sebelumnya. Hal ini secara efektif menjadikan jumlah maksimum penurunan dalam sehari menjadi 27 kali (4 penurunan dalam satu jam pertama, dan 1 penurunan untuk masing-masing jendela 1 jam berikutnya dalam sehari).

Metrik mode keluaran

Grup fitur dalam On-demand mode akan memancarkan ConsumedReadRequestsUnits dan ConsumedWriteRequestsUnits metrik. Grup fitur dalam Provisioned mode akan memancarkan ConsumedReadCapacityUnits dan ConsumedWriteCapacityUnits metrik. Untuk informasi lebih lanjut tentang metrik Lensa Penyimpanan, silakan lihat Metrik Toko SageMaker Fitur Amazon.

Batas mode throughput

Masing-masing Akun AWS memiliki kuota atau batasan layanan default yang diterapkan untuk membantu memastikan ketersediaan dan mengelola risiko penagihan. Untuk informasi tentang kuota dan batas default, lihatPeraturan Penamaan dan Jenis Data.

Dalam beberapa kasus, batasan ini mungkin lebih rendah dari yang dinyatakan dalam dokumentasi. Jika Anda membutuhkan batas yang lebih tinggi, Anda dapat mengajukan permintaan kenaikan. Sebaiknya lakukan sebelum mencapai batas saat ini untuk menghindari gangguan pada pekerjaan Anda. Untuk informasi lebih lanjut tentang service quotas Amazon Kendra dan meminta kenaikan kuota, lihat AWS Service Quotas.