本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Speech-to-Speech(Amazon Nova 2 Sonic)
Amazon Nova 2 Sonic 可透過語音輸入和輸出啟用即時對話式 AI。下節涵蓋建置互動式語音助理、客戶服務自動化和對話式應用程式的進階功能。
主要功能
Amazon Nova 2 Sonic 提供下列功能:
-
具有雙向串流 API State-of-the-art串流語音理解功能,可實現即時、低延遲的多迴轉對話。
-
具有自動語言偵測和切換的多語言支援。以下列語言提供表達式語音,包括男性聲音和女性聲音:
-
英文 (美國、英國、印度、澳洲)
-
法文
-
義大利文
-
德文
-
西班牙文
-
葡萄牙文
-
北印度文
-
-
Polyglot 語音可以說任何支援的語言,即使使用者在相同工作階段中切換語言,也能提供一致的使用者體驗。
-
適用於真實世界部署案例的強大背景雜訊。
-
對於支援的語言,強健到不同的口音。
-
自然、類似人類的對話式 AI 體驗,具有所有支援語言的上下文豐富度。
-
自適應語音回應可根據輸入語音的韻律動態調整輸出。
-
智慧型輪換,可偵測使用者何時完成說話,以及助理何時應回應,進而建立自然的對話節奏。
-
優雅地處理使用者中斷,而不會丟失對話上下文。
-
使用檢索增強生成 (RAG) 以企業資料進行知識接地。
-
用於建置複雜 AI 應用程式的函數呼叫與代理式工作流程支援。
-
非同步工具處理,在維護對話流程的同時執行工具呼叫,允許助理在工具在背景處理時繼續說話。
-
跨模式輸入支援相同對話中的音訊和文字輸入,啟用靈活的互動模式。
-
連線限制為 8 分鐘,並在程式碼範例中提供連線續約和工作階段持續模式。