View a markdown version of this page

Speech-to-Speech(Amazon Nova 2 Sonic) - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Speech-to-Speech(Amazon Nova 2 Sonic)

Amazon Nova 2 Sonic 可透過語音輸入和輸出啟用即時對話式 AI。下節涵蓋建置互動式語音助理、客戶服務自動化和對話式應用程式的進階功能。

主要功能

Amazon Nova 2 Sonic 提供下列功能:

  • 具有雙向串流 API State-of-the-art串流語音理解功能,可實現即時、低延遲的多迴轉對話。

  • 具有自動語言偵測和切換的多語言支援。以下列語言提供表達式語音,包括男性聲音和女性聲音:

    • 英文 (美國、英國、印度、澳洲)

    • 法文

    • 義大利文

    • 德文

    • 西班牙文

    • 葡萄牙文

    • 北印度文

  • Polyglot 語音可以說任何支援的語言,即使使用者在相同工作階段中切換語言,也能提供一致的使用者體驗。

  • 適用於真實世界部署案例的強大背景雜訊。

  • 對於支援的語言,強健到不同的口音。

  • 自然、類似人類的對話式 AI 體驗,具有所有支援語言的上下文豐富度。

  • 自適應語音回應可根據輸入語音的韻律動態調整輸出。

  • 智慧型輪換,可偵測使用者何時完成說話,以及助理何時應回應,進而建立自然的對話節奏。

  • 優雅地處理使用者中斷,而不會丟失對話上下文。

  • 使用檢索增強生成 (RAG) 以企業資料進行知識接地。

  • 用於建置複雜 AI 應用程式的函數呼叫與代理式工作流程支援。

  • 非同步工具處理,在維護對話流程的同時執行工具呼叫,允許助理在工具在背景處理時繼續說話。

  • 跨模式輸入支援相同對話中的音訊和文字輸入,啟用靈活的互動模式。

  • 連線限制為 8 分鐘,並在程式碼範例中提供連線續約和工作階段持續模式。