按需型推理

按需推理提供无服务器方式访问 Amazon Nova 模型，无需预先配置算力资源。该模式可自动扩缩容以适配工作负载，并按实际使用量计费。

优势

按需推理具有以下多项优势：

无需容量规划：自动扩缩容以满足需求
按使用量付费：仅按处理的词元计费
即时可用：无需预置或预热时间
经济高效：适用于波动或不可预测的工作负载

使用按需推理

按需推理是 Amazon Nova 模型的默认模式。只需在进行 API 调用时指定模型 ID 即可：


import boto3

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    messages=[
        {
            'role': 'user',
            'content': [{'text': 'Hello, Nova!'}]
        }
    ]
)

# Print the response text
content_list = response["output"]["message"]["content"]
text = next((item["text"] for item in content_list if "text" in item), None)
if text is not None:
    print(text)

定价

按需推理根据处理的输入和输出词元数量计费。有关当前定价详细信息，请参阅 Amazon Bedrock 定价。

限额和限制

按需推理具有默认配额，具体配额因模型和区域而异。要请求增加配额，可以使用服务配额控制台。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

使用 Amazon Nova Embeddings

使用 Nova 的功能