

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 스피치 마크 요청
<a name="speechmarksconsole"></a>

콘솔 또는 `synthesize-speech` 명령을 사용하여 Amazon Polly의 스피치 마크를 요청할 수 있습니다. 그런 다음 메타데이터를 보거나 파일에 저장할 수 있습니다.

------
#### [ Console ]

**콘솔에서 스피치 마크를 생성하려면**

1. AWS Management Console에 로그인한 후 [https://console.aws.amazon.com/polly/](https://console.aws.amazon.com/polly/)에서 Amazon Polly 콘솔을 엽니다.

1. **텍스트 투 스피치** 탭을 선택합니다.

1. SSML을 사용하기 위해 **SSML**을 활성화합니다.

1. 텍스트를 입력란에 입력하거나 붙여 넣습니다.

1. **언어**에서 텍스트 언어를 선택합니다.

1. **음성**에서 사용하려는 음성을 선택합니다.

1. 텍스트 발음을 변경하려면 **추가 설정**을 확장하고 **발음 사용자 지정**을 켠 다음 **어휘 적용**에서 원하는 어휘를 선택합니다.

1. 스피치를 확인하려면 **듣기**를 선택합니다.

1. **스피치 파일 형식 설정**을 활성화합니다.
**참고**  
MP3, OGG, PCM 형식을 다운로드하면 스피치 마크가 생성되지 않습니다.

1. **파일 형식**에서 **스피치 마크**를 선택합니다.

1. **스피치 마크 유형**에서 생성할 스피치 마크 유형을 선택합니다. **SSML** 메타데이터를 선택하는 옵션은 **SSML**이 활성화된 상태에서만 사용할 수 있습니다. Amazon Polly에서 SSML을 사용하는 방법에 대한 자세한 내용은 [SSML 문서에서 스피치 생성](ssml.md)을 참조하세요.

1. **다운로드**를 선택합니다.

------
#### [ AWS CLI ]

입력 텍스트 외에 이 메타데이터를 반환하려면 다음 요소가 필요합니다.
+ `output-format`

  Amazon Polly에서는 스피치 마크를 반환할 때 JSON 형식만 지원합니다.

  ```
  --output-format json
  ```

  지원되지 않는 출력 형식을 사용하면 Amazon Polly에서 예외가 발생합니다.
+ `voice-id`

  메타데이터가 관련 오디오 스트림과 일치하는지 확인하려면 합성 스피치 오디오 스트림을 생성하는 데 사용되는 것과 동일한 음성을 지정하세요. 사용 가능한 음성은 동일한 스피치 속도를 아닙니다. 스피치를 생성하는 데 사용된 것과 다른 음성을 사용하는 경우 메타데이터가 오디오 스트림과 일치하지 않습니다.

  ```
  --voice-id Joanna
  ```
+ `speech-mark-types`

  원하는 스피치 마크 유형을 지정합니다. 스피치 마크 형식의 일부 또는 전부를 요청할 수 있지만 적어도 하나의 형식을 지정해야 합니다.

  ```
  --speech-mark-types='["sentence", "word", "viseme", "ssml"]'
  ```
+ `text-type`

  일반 텍스트는 Amazon Polly의 기본 입력 텍스트이므로 SSML 스피치 마크를 반환하려면 `text-type ssml`을 사용해야 합니다.
+ `outfile`

  메타데이터가 기록되는 출력 파일을 지정합니다.

  ```
  MaryLamb.txt 
  ```

다음은 Unix, Linux, macOS용 형식으로 지정된 AWS CLI 예제입니다. Windows의 경우 각 줄 끝에 있는 백슬래시(\$1) Unix 연속 문자를 캐럿(^)으로 바꿉니다. 입력 텍스트는 큰 따옴표(")로 감싸고 내부 태그에는 작은 따옴표(')를 사용합니다.

```
aws polly synthesize-speech \
  --output-format json \
  --voice-id Voice ID \
  --text 'Input text' \
  --speech-mark-types='["sentence", "word", "viseme"]' \
  outfile
```

------