本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
GLM 4.7
Z.AI — GLM 4.7
模型详细信息
GLM 4.7 Z.AI 是大型语言模型,具有强大的多语言能力,在推理、编码和知识基准测试方面表现出色。有关模型开发和性能的更多信息,请参阅model/service 卡片
车型发布日期:2025年12月22日
型号停产日期: N/A
最终用户许可协议和使用条款:查看
模型生命周期:活跃
上下文窗口:20.3K 个代币
最大输出代币:4K
注意
只要有可能,我们建议您使用bedrock-mantle终端节点。
功能和特点
基岩特征
使用bedrock-mantle端点支持的功能
| 支持的 | 不支持 |
|---|---|
使用bedrock-runtime端点支持的功能
定价
有关定价,请参阅 Amazon Bedrock 定价
以编程方式访问
使用以下模型 ID 和端点 URL 以编程方式访问此模型。有关可用 API 和终端节点的更多信息,请参阅支持的 API 和支持的终端节点。
| Endpoint | 型号标识 | In-Region 端点网址 | 地理推理 ID | 全局推理 ID |
|---|---|---|---|---|
bedrock-runtime |
zai.glm-4.7 |
https://bedrock-runtime.{region}.amazonaws.com |
不支持 | 不支持 |
bedrock-mantle |
zai.glm-4.7 |
https://bedrock-mantle.{region}.api.aws/v1 |
不支持 | 不支持 |
例如,如果区域为 us-east-1(弗吉尼亚北部),则基岩运行时端点 URL 将为 “”,基岩地幔的 URL 将https://bedrock-runtime.us-east-1.amazonaws.com为 “”。https://bedrock-mantle.us-east-1.api.aws/v1
服务等级
Amazon Bedrock 提供多个服务等级,以满足您的工作负载要求。标准版提供按令牌付费的访问权限,无需任何承诺。P@@ ri ority 通过基于时间的承诺提供更高的吞吐量。Flex 为灵活、非时间敏感型工作负载提供更低成本的访问权限。Reserved 为可预测的工作负载提供@@ 专用吞吐量和定期承诺。有关更多信息,请参阅服务等级。
| Standard | 优先级 | Flex | 已保留 |
|---|---|---|---|
区域可用性
地区供应情况一览
Bedrock 提供三种推断选项:In-Region将请求保留在单个区域内以实现严格合规;在尊重数据驻留的情况下跨地理区域(美国、欧盟等)进行地理 Cross-Region路由,以提高吞吐量;以及全球任何地方的全球 Cross-Region路由,以便在没有驻留限制的情况下实现最大吞吐量。有关更多详细信息,请参阅该区域可用性页面。
| 区域 | In-Region | Geo | Global |
|---|---|---|---|
us-east-1(弗吉尼亚北部) | |||
us-east-2(俄亥俄州) | |||
us-west-2(俄勒冈州) | |||
eu-north-1(斯德哥尔摩) | |||
eu-west-2(伦敦) | |||
ap-northeast-1(东京) | |||
ap-south-1(孟买) | |||
ap-southeast-2(悉尼) | |||
ap-southeast-3(雅加达) | |||
sa-east-1(圣保罗) | |||
ap-southeast-4(墨尔本) |
配额和限制
您的 AWS 账户具有默认配额,以保持服务性能并确保适当使用 Amazon Bedrock。分配给账户的默认配额可能会根据地区因素、付款历史记录、欺诈性使用情况、增加配额请求的 and/or 批准而更新。有关更多详细信息,请参阅Amazon Bedrock 的配额文档并查看该模型的限制。
示例代码
第 1 步-AWS 账户:如果您已经拥有 AWS 账户,请跳过此步骤。如果您不熟悉 AWS,请注册一个 A WS 账户
第 2 步-API 密钥:前往 Amazon Bedrock 控制台
第 3 步-获取 SDK:要使用本入门指南,必须已安装 Python。然后根据您使用的 API 安装相关软件。
第 4 步-设置环境变量:将您的环境配置为使用 API 密钥进行身份验证。
第 5 步-运行您的第一个推理请求:将文件另存为 bedrock-first-request.py