Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Perintah R
Cohere — Perintah R
Detail Model
Command R adalah LLM Cohere yang dapat diskalakan yang dioptimalkan untuk pembuatan dan penggunaan alat tambahan dalam aplikasi perusahaan dengan jendela konteks 128K. Untuk informasi selengkapnya tentang pengembangan dan kinerja model, lihat model/kartu layanan
Tanggal peluncuran model: Agustus 2024
Tanggal model EOL: N/A
Perjanjian Lisensi Pengguna Akhir dan Ketentuan Penggunaan: Lihat
Siklus hidup model: Aktif
Jendela konteks: 128K token
Token keluaran maks: 4K
Batas pengetahuan: Mar 2024
| Modalitas Masukan | Modalitas Keluaran | APIs didukung | Endpoint didukung |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Harga
Untuk harga, silakan merujuk ke halaman Harga Amazon Bedrock
Akses Terprogram
Gunakan model IDs dan titik akhir berikut URLs untuk mengakses model ini secara terprogram. Untuk informasi selengkapnya tentang tersedia APIs dan titik akhir, lihat APIs didukung dan Endpoint yang didukung.
| Titik akhir | ID Model | URL titik akhir Dalam Wilayah | ID inferensi geo | ID inferensi global |
|---|---|---|---|---|
bedrock-runtime |
cohere.command-r-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
Tidak didukung | Tidak didukung |
Misalnya, jika wilayah adalah us-east-1 (Virginia N.), maka URL endpoint batuan dasar runtime akan menjadi "" dan untuk mantel dasar akan menjadi "https://bedrock-mantle.us-east-1.api.aws/v1 “. https://bedrock-runtime.us-east-1.amazonaws.com
Tingkatan Layanan
Amazon Bedrock menawarkan beberapa tingkatan layanan agar sesuai dengan persyaratan beban kerja Anda. Standar menyediakan pay-per-token akses tanpa komitmen. Prioritas menawarkan throughput yang lebih tinggi dengan komitmen berbasis waktu. Flex menyediakan akses berbiaya lebih rendah untuk beban kerja yang fleksibel. non-time-sensitive Reserved menyediakan throughput khusus dengan komitmen jangka untuk beban kerja yang dapat diprediksi. Untuk informasi selengkapnya, lihat tingkatan layanan.
| Standar | Prioritas | Fleksibel | Reserved |
|---|---|---|---|
Ketersediaan Wilayah
Sekilas tentang ketersediaan regional
Bedrock menawarkan tiga opsi inferensi: In-Region menyimpan permintaan dalam satu Wilayah untuk kepatuhan yang ketat, rute Geo Cross-Region di seluruh Wilayah dalam geografi (AS, UE, dll.) untuk throughput yang lebih tinggi sambil menghormati residensi data, dan rute Lintas Wilayah Global di mana saja di seluruh dunia untuk throughput maksimum ketika tidak ada kendala residensi. Lihat Ketersediaan wilayah halaman untuk lebih jelasnya.
| Wilayah | Dalam Wilayah | Geo | Global |
|---|---|---|---|
us-east-1(Virginia Utara) | |||
us-west-2(Oregon) |
Kuota dan Batas
Akun AWS Anda memiliki kuota default untuk mempertahankan kinerja layanan dan untuk memastikan penggunaan Amazon Bedrock yang tepat. Kuota default yang ditetapkan ke akun dapat diperbarui tergantung pada faktor regional, riwayat pembayaran, penggunaan penipuan, and/or persetujuan permintaan peningkatan kuota. Untuk lebih jelasnya, silakan merujuk ke Kuota untuk Amazon Bedrock dokumentasi dan lihat batas untuk model.
Kode Sampel
Langkah 1 - Akun AWS: Jika Anda sudah memiliki akun AWS, lewati langkah ini. Jika Anda baru mengenal AWS, daftar akun AWS
Langkah 2 - Kunci API: Buka konsol Amazon Bedrock
Langkah 3 - Dapatkan SDK: Untuk menggunakan panduan memulai ini, Anda harus memiliki Python yang sudah diinstal. Kemudian instal perangkat lunak yang relevan tergantung pada yang APIs Anda gunakan.
pip install boto3
Langkah 4 - Tetapkan variabel lingkungan: Konfigurasikan lingkungan Anda untuk menggunakan kunci API untuk otentikasi.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Langkah 5 - Jalankan permintaan inferensi pertama Anda: Simpan file sebagai bedrock-first-request.py