什么是 Amazon Nova? - Amazon Nova

什么是 Amazon Nova?

Amazon Nova 基础模型可提供前沿情报并具有行业领先的性价比。各类组织都可以使用 Amazon Nova 来构建和扩展安全、可靠且经济高效的生成式人工智能应用程序。Amazon Nova 加速了跨模态和使用案例的 AI 创新,包括文本、图像、视频、语音、API 调用和代理式人工智能。要开始使用 Amazon Nova 进行构建,必须使用 Amazon Bedrock 通过 API 访问模型。

Amazon Nova 提供了多种强大的基础模型,涵盖理解、图像、视频和语音等功能。

理解模型

Amazon Nova 理解模型可理解各种广泛的输入,包括文本、图像、视频、文档和代码。这些模型尤为适合用于交互式聊天界面、检索增强生成(RAG)系统、人工智能体应用、视频分析和用户界面工作流自动化解决方案。

  • Amazon Nova Micro 是一种纯文本模型,以极低的成本提供最低的延迟回复。

  • Amazon Nova Lite 是一种成本非常低的多模态模型,处理图像、视频和文本输入的速度快如闪电。

  • Amazon Nova Pro 是一种功能强大的多模态模型,实现准确度、速度和成本的理想组合,可以用于各种任务。

  • Amazon Nova Premier 是适用于复杂任务的强大多模态模型,也是为经济高效的应用程序提炼定制模型的优秀教师。

Amazon Nova 理解模型已在美国东部(弗吉尼亚州北部)和 AWS GovCloud(美国西部)区域开放。Amazon Nova Micro、Lite 和 Pro 也已在亚太地区(悉尼)和欧洲地区(伦敦)区域开放。可通过跨区域推理配置文件在以下区域访问这些模型:美国西部(北加利福尼亚)、美国西部(俄勒冈州)、欧洲地区(斯德哥尔摩)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(巴黎)、亚太地区(东京)、亚太地区(首尔)、亚太地区(孟买)、亚太地区(新加坡)和亚太地区(悉尼)。

创意模型

Amazon Nova 创意模型可将文本和图像输入转换为专业级的图像和视频。此类模型旨在提供具有控制功能的可自定义视觉内容,从而让媒体、娱乐、零售、营销和广告行业可以方便地使用并高效地生成创意内容。

  • Amazon Nova Canvas 是一种具有自定义和控制功能的高质量图像生成模型。

  • Amazon Nova Reel 是一种旨在促进创意内容生成普及的视频生成模型。

Amazon Nova Canvas 和 Amazon Nova Reel 已在美国东部(弗吉尼亚州北部)、欧洲地区(爱尔兰)和亚太地区(东京)区域开放。

语音模型

Amazon Nova Sonic 是用于对话语音理解和生成的基础模型,支持五种语言:英语(美国、英国)、法语、意大利语、德语和西班牙语。该模型接受语音作为输入,并提供文本转录语音作为输出。Amazon Nova Sonic 提供上下文丰富、自然、类人的对话式人工智能体验。这是第一款具有双向流式 API 功能的模型,可实现实时、低延迟的多回合对话。

  • Amazon Nova Sonic 提供类似真人的实时语音对话。

Amazon Nova Sonic 目前已在美国东部(弗吉尼亚州北部)、欧洲地区(斯德哥尔摩)和亚太地区(东京)推出,并提供英语(美国、英国)、法语、意大利语、德语和西班牙语版本。

有关 Amazon Bedrock 中的完整模型和区域支持信息,请参阅 Supported foundation models in Amazon Bedrock

模型整体信息

Amazon Nova Premier

Amazon Nova Pro

Amazon Nova Lite

Amazon Nova Micro

模型 ID

amazon.nova-premier-v1:0

amazon.nova-pro-v1:0

amazon.nova-lite-v1:0

amazon.nova-micro-v1:0

推理配置文件 ID

us.amazon.nova-premier-v1:0

us.amazon.nova-pro-v1:0

us.amazon.nova-lite-v1:0

us.amazon.nova-micro-v1:0

输入模态

文本、图像、视频

文本、图像、视频

文本、图像、视频

文本

输出模态

文本

文本

文本

文本

上下文窗口

1M

300K

300K

128k

最大输出词元数

10K

10k

10k

10k

支持的语言

超过 200 种1

超过 200 种1

超过 200 种1

超过 200 种1

区域

美国东部(弗吉尼亚州北部)2

美国东部(弗吉尼亚州北部)2、亚太地区(东京)2、亚太地区(悉尼)2、欧洲地区(伦敦)2、AWS GovCloud(美国西部)

美国东部(弗吉尼亚州北部)2、亚太地区(东京)2、亚太地区(悉尼)2、欧洲地区(伦敦)2、AWS GovCloud(美国西部)

美国东部(弗吉尼亚州北部)2、亚太地区(东京)2、亚太地区(悉尼)2、欧洲地区(伦敦)2、AWS GovCloud(美国西部)

文档支持

PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD

PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD

PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD

Converse API

支持

InvokeAPI

支持

流式传输

支持

批量推理

支持

微调

预调配吞吐量

Bedrock 知识库

支持

Bedrock 座席

支持

Bedrock 护栏

是(仅限文本)

是(仅限文本)

是(仅限文本)

Bedrock 评估

是(仅限文本)

是(仅限文本)

是(仅限文本)

Bedrock 提示工作流程

支持

Bedrock Studio

支持

Bedrock 模型蒸馏

教师:Pro、Lite 和 Micro

教师:Lite 和 Micro

学生:Premier

学生:Premier 和 Pro

学生:Premier 和 Pro

1:针对以下 15 种语言进行了优化:英语、德语、西班牙语、法语、意大利语、日语、韩语、阿拉伯语、简体中文、俄语、印地语、葡萄牙语、荷兰语、土耳其语和希伯来语。

2:可以通过跨区域推理在以下地区访问此模型:美国东部(俄亥俄州)、美国西部(俄勒冈州)、欧洲地区(斯德哥尔摩)、欧洲地区(爱尔兰)、欧洲地区(法兰克福)、欧洲地区(巴黎)、亚太地区(东京)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(首尔)和亚太地区(孟买)。跨区域推理让您能够通过利用跨不同 AWS 区域 的计算来无缝管理计划外的流量暴增。通过跨区域推理,您可以跨多个 AWS 区域分配流量。要了解跨区域推理的更多信息,请参阅《Amazon Bedrock User Guide》中的 Supported Regions and models for inference profilesImprove resilience with cross-region inference

Amazon Nova Canvas

Amazon Nova Reel

模型 ID

amazon.nova-canvas-v1:0

amazon.nova-reel-v1:1

输入模态

文本、图像

文本、图像

输出模态

图像

视频

最大提示长度

1024 个字符

输入上下文窗口

512 个字符

输出分辨率(生成任务)

419 万像素(即 2048 x 2048、2816 x 1536)

1280 x 720,每秒 24 帧

最大输出分辨率(编辑任务)

必须满足以下所有条件:

  • 最长边为 4096 像素

  • 宽高比在 1:4 到 4:1 之间

  • 总像素数为 419 万或更小

支持的输入类型

PNG、JPEG

PNG、JPEG

支持的语言

English

English

区域

美国东部(弗吉尼亚州北部)、欧洲地区(爱尔兰)和亚太地区(东京)

美国东部(弗吉尼亚州北部)、欧洲地区(爱尔兰)和亚太地区(东京)

异步调用模型 API

调用模型 API

Amazon Nova Sonic

模型 ID

amazon.nova-sonic-v1:0

输入模态

语音

输出模态

带有转录和文本回复的语音

上下文窗口

300K 上下文

最大连接持续时间

连接超时 8 分钟,每位客户最多 20 个并发连接。1

支持语言 2

英语(美国、英国)、法语、意大利语、德语和西班牙语

区域

美国东部(弗吉尼亚州北部)、欧洲地区(斯德哥尔摩)和亚太地区(东京)

双向流式 API 支持

Bedrock 知识库

通过“工具使用”(调用函数)提供支持

1:默认情况下,连接限制为 8 分钟,但可以提供先前对话的历史记录来续订连接并继续对话。

2:有关支持声音的列表,请参阅 Amazon Nova Sonic 的可用声音