Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Memahami data Laporan Biaya dan Penggunaan Batuan Dasar Amazon Anda
AWS Laporan Biaya dan Penggunaan Ekspor Data (CUR 2.0) adalah cara yang AWS disarankan untuk menerima data biaya dan penggunaan terperinci Anda. CUR 2.0 memberikan detail item baris untuk setiap permintaan inferensi Amazon Bedrock. Setiap permintaan menghasilkan item baris terpisah untuk setiap jenis token, dengan jenis penggunaan dan harga unit yang berbeda. Halaman ini menjelaskan cara membaca entri Amazon Bedrock di CUR dan mendamaikannya dengan pengeluaran Anda yang sebenarnya. Untuk informasi selengkapnya tentang AWS CUR 2.0, lihat dokumentasi Ekspor AWS Data.
Memahami harga Amazon Bedrock di CUR
Harga Amazon Bedrock di CUR ditentukan oleh tiga faktor: jenis token, tingkat layanan, dan apakah permintaan dialihkan melalui inferensi lintas wilayah. Memahami masing-masing ini sangat penting untuk rekonsiliasi biaya yang akurat.
Jenis token
Biaya Amazon Bedrock dipecah berdasarkan empat jenis token. Masing-masing memiliki harga satuan yang berbeda.
| Jenis token | Pola jenis penggunaan CUR | Deskripsi |
|---|---|---|
| Token masukan | *-input-tokens atau *-mantle-input-tokens-* |
Token dikirim dalam prompt permintaan |
| Token keluaran | *-output-tokens atau *-mantle-output-tokens-* |
Token yang dihasilkan dalam respons |
| Token baca cache | *-cache-read-input-token-count |
Token dibaca dari cache prompt (jauh lebih murah daripada input) |
| Cache menulis token | *-cache-write-input-token-count |
Token ditulis untuk meminta cache (lebih mahal dari input) |
penting
Keempat jenis token harus diperhitungkan saat merekonsiliasi penggunaan untuk dibelanjakan. Jika Anda hanya menjumlahkan token input dan output, total Anda tidak akan cocok dengan tagihan Anda. Ini adalah sumber kesenjangan rekonsiliasi yang paling umum, terutama untuk beban kerja yang banyak menggunakan caching cepat.
Tingkatan layanan
Amazon Bedrock mendukung berbagai tingkatan layanan yang memengaruhi harga dan ketersediaan. Tingkat layanan untuk permintaan tercermin dalam jenis penggunaan CUR. Saat merekonsiliasi biaya, pastikan Anda menerapkan harga satuan yang benar untuk tingkat layanan yang terkait dengan setiap item baris.
Untuk informasi lebih lanjut tentang tingkatan layanan dan bagaimana pengaruhnya terhadap harga inferensi, lihat. Tingkat layanan untuk mengoptimalkan kinerja dan biaya
Contoh jenis penggunaan CUR
line_item_usage_typeBidang mengidentifikasi model, jenis token, tingkat layanan, dan apakah permintaan tersebut menggunakan inferensi lintas wilayah. Formatnya bervariasi menurut titik akhir:
-
{region}-{model}-{token-type}untuk permintaan tingkatbedrock-runtimestandar -
{region}-{model}-{token-type}-{tier}untukbedrock-runtimepermintaan tingkat prioritas atau fleksibel -
{region}-{model}-mantle-{token-type}-standarduntukbedrock-mantlepermintaan -
{region}-{model}-{token-type}-cross-region-globaluntuk permintaan lintas wilayah
| Jenis penggunaan | Model | Tingkat Layanan | Jenis token | Perutean |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | Standar | Input | In-region |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | Prioritas | Output | In-region |
USE1-Nova2.0Lite-input-tokens-flex |
Amazon Nova 2 Lite | Melenturkan | Input | In-region |
USE1-Claude4.6Sonnet-input-tokens |
Claude Soneta 4.6 | Standar | Input | In-region |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
Claude Soneta 4.6 | Standar | Cache dibaca | In-region |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
Claude Soneta 4.6 | Standar | Output | Cross-region |
Tag alokasi biaya di CUR
Tag alokasi biaya dari kepala sekolah IAM, Proyek, dan profil inferensi aplikasi muncul sebagai kolom di CUR dengan awalan dan. resourceTags/{key} iamPrincipal/{key} Misalnya, tag dengan kunci Team muncul sebagairesourceTags/Team.
| Metode atribusi | Bagaimana tag muncul di CUR |
|---|---|
| Tag utama IAM | Tag dari pengguna IAM atau peran yang membuat permintaan |
| Tanda sesi | Tag disahkan selama asumsi peran atau federasi |
| Tag proyek | Tag yang ditetapkan ke Proyek Batuan Dasar Amazon |
| Tag profil inferensi aplikasi | Tag yang ditetapkan ke profil inferensi aplikasi |
Tag harus diaktifkan sebagai tag alokasi biaya di konsol AWS Penagihan sebelum muncul di CUR. Untuk informasi selengkapnya, lihat Mengaktifkan tag alokasi biaya.
Hal-hal penting yang perlu diketahui saat membaca data CUR Anda
Untuk mendapatkan hasil maksimal dari data CUR Anda dan menghindari kebingungan saat menganalisis biaya, ingatlah hal-hal berikut.
-
Akun untuk semua jenis token. Amazon Bedrock mengenakan biaya secara terpisah untuk input, output, pembacaan cache, dan token penulisan cache. Masing-masing memiliki harga satuan yang berbeda. Jika Anda hanya melihat token input dan output, analisis Anda akan mengurangi biaya, terutama untuk beban kerja yang banyak menggunakan caching cepat.
-
Terapkan tarif yang benar untuk setiap jenis perutean. In-region dan inferensi lintas wilayah memiliki harga satuan yang berbeda. Jika beban kerja Anda menggunakan keduanya, pastikan Anda menggunakan tingkat pencocokan untuk masing-masing saat menganalisis biaya.
-
Aktifkan tag sebelum mengharapkannya di CUR. Tag alokasi biaya harus diaktifkan di konsol AWS Penagihan sebelum muncul di CUR atau Cost Explorer. Setelah aktivasi, biarkan hingga 24 jam agar tag mulai terisi.
-
Gunakan CUR 2.0 untuk atribusi utama IAM. Identitas utama IAM dan data tag membutuhkan CUR 2.0 (Ekspor AWS Data). Jika Anda menggunakan format CUR lama, bidang utama IAM tidak akan tersedia. Per-token kerusakan biaya tersedia dalam kedua format CUR. Untuk petunjuk penyiapan terperinci, lihat Menggunakan prinsipal IAM untuk alokasi biaya.