View a markdown version of this page

음성-음성(Amazon Nova 2 Sonic) - Amazon Nova

음성-음성(Amazon Nova 2 Sonic)

Amazon Nova 2 Sonic은 음성 입력 및 출력을 통해 실시간 대화형 AI를 지원합니다. 다음 섹션에서는 대화형 음성 어시스턴트, 고객 서비스 자동화 및 대화형 애플리케이션을 빌드하기 위한 고급 기능을 설명합니다.

주요 기능

Amazon Nova 2 Sonic은 다음과 같은 기능을 제공합니다.

  • 지연 시간이 짧은 실시간 멀티턴 대화를 지원하는 양방향 스트림 API를 사용하는 최첨단 스트리밍 음성 이해.

  • 자동 언어 탐지 및 전환을 통한 다국어 지원. 표현력 있는 음성은 남성 음색과 여성 음색의 음성을 모두 포함하여 다음 언어로 제공됩니다.

    • 영어(미국, 영국, 인도, 호주)

    • 프랑스어

    • 이탈리아어

    • 독일어

    • 스페인 요리

    • 포르투갈어

    • 힌디어

  • 사용자가 동일한 세션 내에서 언어를 전환할 때도 일관된 사용자 경험을 뒷받침하기 위해 지원되는 모든 언어를 말할 수 있는 다각형 음성.

  • 실제 배포 시나리오에서 배경 소음에 대한 강건성.

  • 지원되는 언어의 여러 액센트에 대한 견고한 지원.

  • 지원되는 모든 언어에서 컨텍스트에 맞는 풍부한 정보가 제공되는 자연스럽고 사람과 같은 대화형 AI 경험.

  • 입력된 스피치의 운율에 따라 동적으로 전달을 조정하는 적응형 스피치 응답

  • 사용자가 말을 마치는 시점과 어시스턴트가 응답해야 하는 시점을 탐지하여 자연스러운 대화 리듬을 생성하는는 지능형 턴 기반 방식.

  • 대화의 맥락을 잃지 않고 자연스럽게 사용자 중단 처리

  • 검색 증강 생성(RAG)을 사용하여 엔터프라이즈 데이터로 지식 근거 마련

  • 복잡한 AI 애플리케이션 구축을 위한 함수 직접 호출 및 에이전트 워크플로 지원

  • 대화 흐름을 유지하면서 도구 직접 호출을 실행하는 비동기식 도구 처리로, 도구를 백그라운드에서 처리하는 동안 어시스턴트가 계속 말할 수 있습니다.

  • 동일한 대화 내에서 오디오 입력과 텍스트 입력 모두에 대한 교차 모달 입력 지원을 제공하며, 이를 통해 유연한 상호 작용 패턴이 가능합니다.

  • 연결 제한은 8분이며, 연결 갱신 및 세션 지속 패턴을 코드 샘플에서 사용할 수 있습니다.