View a markdown version of this page

按需型推理 - Amazon Nova

按需型推理

按需推理提供无服务器方式访问 Amazon Nova 模型,无需预先配置算力资源。该模式可自动扩缩容以适配工作负载,并按实际使用量计费。

优势

按需推理具有以下多项优势:

  • 无需容量规划:自动扩缩容以满足需求

  • 按使用量付费:仅按处理的词元计费

  • 即时可用:无需预置或预热时间

  • 经济高效:适用于波动或不可预测的工作负载

使用按需推理

按需推理是 Amazon Nova 模型的默认模式。只需在进行 API 调用时指定模型 ID 即可:

import boto3 bedrock = boto3.client('bedrock-runtime', region_name='us-east-1') response = bedrock.converse( modelId='us.amazon.nova-2-lite-v1:0', messages=[ { 'role': 'user', 'content': [{'text': 'Hello, Nova!'}] } ] ) # Print the response text content_list = response["output"]["message"]["content"] text = next((item["text"] for item in content_list if "text" in item), None) if text is not None: print(text)

定价

按需推理根据处理的输入和输出词元数量计费。有关当前定价详细信息,请参阅 Amazon Bedrock 定价

限额和限制

按需推理具有默认配额,具体配额因模型和区域而异。要请求增加配额,可以使用服务配额控制台