View a markdown version of this page

감청 - Amazon Nova

감청

개입을 통해 사용자는 자연스러운 사람의 대화와 같이 말하는 동안 AI 어시스턴트 발언을 중단할 수 있습니다. 어시스턴트가 발언을 마칠 때까지 기다리는 대신 사용자는 새 정보로 개입하거나 이전 설명을 수정 또는 명확히 하거나 대화를 다른 주제로 리디렉션하거나, 충분히 들었으면 어시스턴트를 중지할 수 있습니다. 이렇게 하면 보다 자연스럽고 응답성이 뛰어난 대화 경험이 구축됩니다.

다음 다이어그램에서는 전체 개입 대화 흐름을 보여줍니다.

Amazon Nova 2 Sonic이 개입을 처리하는 방법

Amazon Nova 2 Sonic은 중단을 정상적으로 처리하도록 설계되었습니다. 사용자가 응답 중에 말을 시작하면 시스템은 즉시 현재 응답 생성을 중지하고 전체 대화 컨텍스트를 유지하며 클라이언트에 중단 신호를 보내고 새 사용자 입력을 처리하기 시작합니다.

컨텍스트 보존: 중단된 경우에도 Nova Sonic은 중단 전의 내용, 논의 중인 주제, 대화 기록 및 이전 턴의 관련 컨텍스트를 기억합니다. 이렇게 하면 일관되고 자연스러운 대화를 유지합니다.

클라이언트 측 구현 요구 사항

Amazon Nova 2 Sonic은 서버 측에서 개입을 처리하지만 완전한 경험을 위해 사용자가 클라이언트 측 로직을 구현해야 합니다.

오디오 대기열 문제: 오디오 생성이 재생 속도보다 빠릅니다. 이는 다음을 의미합니다.

  • Nova Sonic에서 오디오 청크를 빠르게 생성함

  • 클라이언트가 이러한 청크를 수신하고 대기열에 넣습니다.

  • 클라이언트가 정상 발화 속도로 이를 재생합니다.

  • 개입이 발생하면 오디오가 이미 재생 대기 중인 것입니다.

필수 클라이언트 측 로직: 애플리케이션이 다음과 같은 4가지 주요 단계를 처리해야 합니다.

  1. 중단 신호 감지: Nova Sonic에서 중단 이벤트를 대기하고, 수신되면 즉시 대응합니다.

  2. 현재 재생 중지: 현재 재생 중인 오디오를 일시 중지하고 중간 재생 상태인 모든 오디오를 중지합니다.

  3. 오디오 대기열 지우기: 대기 중인 모든 오디오 청크를 제거하고 중단된 응답에서 버퍼링된 오디오를 모두 버립니다.

  4. 새 오디오 시작: 새로 수신한 오디오 재생을 시작하고 일반 재생 흐름을 재개합니다.