스피치 마크 형식 - Amazon Polly

스피치 마크 형식

스피치 마크는 SynthesizeSpeech 또는 StartSpeechSynthesisTask 명령을 위한 SpeechMarkTypes 옵션을 사용하여 요청합니다. 입력 텍스트에서 반환할 메타데이터 요소를 지정합니다. 최대 네 가지 형식의 메타데이터를 요청할 수 있지만, 요청당 반드시 하나 이상을 지정해야 합니다. 요청 시 오디오 출력이 생성되지 않습니다.

예를 들어 AWS CLI에서

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly는 다음 요소를 사용하여 스피치 마크를 생성합니다.

  • sentence – 입력 텍스트의 문장 요소를 나타냅니다.

  • word – 텍스트의 단어 요소를 나타냅니다.

  • viseme – 말하는 각 음소에 대응하는 얼굴과 입의 움직임을 설명합니다. 자세한 내용은 Viseme과 Amazon Polly을(를) 참조하세요.

  • ssml – SSML 입력 텍스트의 <mark> 요소를 설명합니다. 자세한 내용은 SSML 문서에서 스피치 생성을(를) 참조하세요.