View a markdown version of this page

GLM 4,7 - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

GLM 4,7

Z.AI — GLM 4.7

Detail Model

GLM 4.7 adalah Z.AI model bahasa besar dengan kemampuan multibahasa yang kuat dan kinerja yang solid pada penalaran, pengkodean, dan tolok ukur pengetahuan. Untuk informasi lebih lanjut tentang pengembangan dan kinerja model, lihat model/service kartu.

  • Tanggal peluncuran model: 22 Des 2025

  • Tanggal model EOL: N/A

  • Perjanjian Lisensi Pengguna Akhir dan Ketentuan Penggunaan: Lihat

  • Siklus hidup model: Aktif

  • Jendela konteks: token 203K

  • Token keluaran maks: 4K

Modalitas Masukan Modalitas Keluaran API didukung Endpoint didukung
AudioMenyematkan Responses bedrock-runtime
GambarGambar Chat Completions bedrock-mantle
PidatoPidato Invoke
TeksTeks Converse
VideoVideo
catatan

Bila memungkinkan, kami sarankan Anda menggunakan bedrock-mantle endpoint.

Kemampuan dan Fitur

Fitur Batuan Dasar

Fitur yang didukung menggunakan bedrock-mantle endpoint

Fitur yang didukung menggunakan bedrock-runtime endpoint

Harga

Untuk harga, silakan merujuk ke halaman Harga Amazon Bedrock.

Akses Terprogram

Gunakan ID model dan URL titik akhir berikut untuk mengakses model ini secara terprogram. Untuk informasi selengkapnya tentang API dan titik akhir yang tersedia, lihat API yang didukung dan Endpoint didukung.

Titik akhir ID Model In-Region URL titik akhir ID inferensi geo ID inferensi global
bedrock-runtime zai.glm-4.7 https://bedrock-runtime.{region}.amazonaws.com Tidak didukung Tidak didukung
bedrock-mantle zai.glm-4.7 https://bedrock-mantle.{region}.api.aws/v1 Tidak didukung Tidak didukung

Misalnya, jika wilayah adalah us-east-1 (Virginia N.), maka URL endpoint batuan dasar runtime akan menjadi "" dan untuk mantel dasar akan menjadi "”. https://bedrock-runtime.us-east-1.amazonaws.com https://bedrock-mantle.us-east-1.api.aws/v1

Tingkatan Layanan

Amazon Bedrock menawarkan beberapa tingkatan layanan agar sesuai dengan persyaratan beban kerja Anda. Standar menyediakan akses bayar per token tanpa komitmen. Prioritas menawarkan throughput yang lebih tinggi dengan komitmen berbasis waktu. Flex menyediakan akses berbiaya lebih rendah untuk beban kerja yang fleksibel dan tidak sensitif terhadap waktu. Reserved menyediakan throughput khusus dengan komitmen jangka untuk beban kerja yang dapat diprediksi. Untuk informasi selengkapnya, lihat tingkatan layanan.

Standar Prioritas Fleksibel Reserved

Ketersediaan Wilayah

Sekilas tentang ketersediaan regional

Bedrock menawarkan tiga opsi inferensi: In-Regionmenyimpan permintaan dalam satu Wilayah untuk kepatuhan yang ketat, Cross-Region rute Geo lintas Wilayah dalam geografi (AS, UE, dll.) untuk throughput yang lebih tinggi sambil menghormati residensi data, dan Cross-Region rute Global di mana saja di seluruh dunia untuk throughput maksimum ketika tidak ada kendala residensi. Lihat Ketersediaan wilayah halaman untuk lebih jelasnya.

Wilayah In-Region Geo Global
us-east-1(Virginia Utara)
us-east-2(Ohio)
us-west-2(Oregon)
eu-north-1(Stockholm)
eu-west-2(London)
ap-northeast-1(Tokyo)
ap-south-1(Mumbai)
ap-southeast-2(Sydney)
ap-southeast-3(Jakarta)
sa-east-1(Sao Paulo)
ap-southeast-4(Melbourne)

Kuota dan Batas

Akun AWS Anda memiliki kuota default untuk mempertahankan kinerja layanan dan untuk memastikan penggunaan Amazon Bedrock yang tepat. Kuota default yang ditetapkan ke akun dapat diperbarui tergantung pada faktor regional, riwayat pembayaran, penggunaan penipuan, and/or persetujuan permintaan peningkatan kuota. Untuk lebih jelasnya, silakan merujuk ke Kuota untuk Amazon Bedrock dokumentasi dan lihat batas untuk model.

Kode Sampel

Langkah 1 - Akun AWS: Jika Anda sudah memiliki akun AWS, lewati langkah ini. Jika Anda baru mengenal AWS, daftar akun AWS.

Langkah 2 - Kunci API: Buka konsol Amazon Bedrock dan buat kunci API jangka panjang.

Langkah 3 - Dapatkan SDK: Untuk menggunakan panduan memulai ini, Anda harus memiliki Python yang sudah diinstal. Kemudian instal perangkat lunak yang relevan tergantung pada API yang Anda gunakan.

Chat Completions API
pip install boto3 openai
Invoke/Converse API
pip install boto3

Langkah 4 - Tetapkan variabel lingkungan: Konfigurasikan lingkungan Anda untuk menggunakan kunci API untuk otentikasi.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
Invoke/Converse API
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Langkah 5 - Jalankan permintaan inferensi pertama Anda: Simpan file sebagai bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="zai.glm-4.7", messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}] ) print(response)
Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='zai.glm-4.7', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='zai.glm-4.7', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)