View a markdown version of this page

Speech-to-Speech(Amazon Nova 2 Sonic) - Amazon Nova

Speech-to-Speech(Amazon Nova 2 Sonic)

Amazon Nova 2 Sonic 可透過語音輸入和輸出啟用即時對話式 AI。下節涵蓋建置互動式語音助理、客戶服務自動化和對話式應用程式的進階功能。

主要功能

Amazon Nova 2 Sonic 提供下列功能：

具有雙向串流 API State-of-the-art串流語音理解功能，可實現即時、低延遲的多迴轉對話。
具有自動語言偵測和切換的多語言支援。以下列語言提供表達式語音，包括男性聲音和女性聲音：
- 英文（美國、英國、印度、澳洲）
- 法文
- 義大利文
- 德文
- 西班牙文
- 葡萄牙文
- 北印度文
Polyglot 語音可以說任何支援的語言，即使使用者在相同工作階段中切換語言，也能提供一致的使用者體驗。
適用於真實世界部署案例的強大背景雜訊。
對於支援的語言，強健到不同的口音。
自然、類似人類的對話式 AI 體驗，具有所有支援語言的上下文豐富度。
自適應語音回應可根據輸入語音的韻律動態調整輸出。
智慧型輪換，可偵測使用者何時完成說話，以及助理何時應回應，進而建立自然的對話節奏。
優雅地處理使用者中斷，而不會丟失對話上下文。
使用檢索增強生成 (RAG) 以企業資料進行知識接地。
用於建置複雜 AI 應用程式的函數呼叫與代理式工作流程支援。
非同步工具處理，在維護對話流程的同時執行工具呼叫，允許助理在工具在背景處理時繼續說話。
跨模式輸入支援相同對話中的音訊和文字輸入，啟用靈活的互動模式。
連線限制為 8 分鐘，並在程式碼範例中提供連線續約和工作階段持續模式。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

多模式理解

開始使用