실시간 스트림에서 PII 편집 또는 식별
스트리밍 트랜스크립션에서 개인 식별 정보(PII)를 편집하는 경우 Amazon Transcribe는 식별된 각 PII 인스턴스를 트랜스크립트의 [PII]로 대체합니다.
스트리밍 트랜스크립션에 사용할 수 있는 추가 옵션은 PII 식별입니다. PII 식별을 활성화하면 Amazon Transcribe는 Entities 개체 아래의 트랜스크립션 결과의 PII에 레이블을 지정합니다. 출력 샘플은 편집된 스트리밍 출력 예시 및 PII 식별 출력 예시를 참조하세요.
스트리밍 트랜스크립션을 사용하는 PII의 수정 및 식별은 지역 별로 영어 방언(스코틀랜드(en-AB), 호주(en-AU), 캐나다(en-CA), 영국(en-GB), 아일랜드(en-IE), 인도(en-IN), 뉴질랜드(en-NZ), 미국(en-US), 웨일스(en-WL) 및 남아프리카(en-ZA)), 스페인어 방언(미국(es-US), 스페인(es-ES), 프랑스어 방언: 프랑스(fr-FR), 캐나다(fr-CA)), 포르투갈어 방언(포르투갈(pt-PT), 브라질(pt-BR)), 이탈리아어 방언(이탈리아(it-IT)), 독일어 방언(독일(de-DE), 스위스(de-CH))로 제공됩니다.
스트리밍 작업에 대한 PII 식별 및 수정은 오디오 세그먼트의 완전한 트랜스크립션 시에만 수행됩니다.
| PII 유형 | 설명 |
|---|---|
ADDRESS |
실제 주소(예: 100 Main Street, Anytown, USA 또는 Suite #12, Building 123). 주소에는 거리, 건물, 위치, 도시, 주, 국가, 카운티, 우편번호, 구역, 지역 등의 정보가 포함될 수 있습니다. |
ALL |
이 테이블에 나열된 모든 PII 유형을 편집하거나 식별합니다. |
BANK_ACCOUNT_NUMBER |
미국 은행 계좌 번호. 일반적으로 10~12자리 길이이지만 Amazon Transcribe는 마지막 4자리만 있으면 은행 계좌 번호도 인식합니다. |
BANK_ROUTING |
미국 은행 계좌 라우팅 번호. 일반적으로 9자리 길이이지만 Amazon Transcribe는 마지막 4자리만 있으면 라우팅 번호도 인식합니다. |
CREDIT_DEBIT_CVV |
비자, 마스터카드, 디스커버 신용카드 및 직불카드에 있는 3자리 카드 인증 코드(CVV). 아메리칸 익스프레스 신용카드나 직불카드의 경우 4자리 숫자 코드입니다. |
CREDIT_DEBIT_EXPIRY |
신용카드 또는 직불카드 만료 날짜. 이 숫자는 보통 4자리 숫자이며, 월/년 또는 MM/YY 형식으로 지정됩니다. 예를 들어, Amazon Transcribe는 01/21, 01/2021 및 Jan 2021 등의 만료일을 인식할 수 있습니다. |
CREDIT_DEBIT_NUMBER |
신용카드 또는 직불카드 번호. 이러한 번호의 길이는 13~16자리로 다양하지만 Amazon Transcribe는 마지막 4자리만 있으면 신용카드 또는 직불카드 번호도 인식합니다. |
EMAIL |
이메일 주소(예: efua.owusu@email.com). |
NAME |
개인의 이름. 이 엔터티 유형에는 Mr., Mrs., Miss 또는 Dr.와 같은 직함은 포함되지 않습니다. Amazon Transcribe는 조직이나 주소의 일부인 이름에는 이 엔터티 유형을 적용하지 않습니다. 예를 들어 Amazon Transcribe는 John Doe Organization을 조직으로 인식하고 Jane Doe Street를 주소로 인식합니다. |
PHONE |
전화번호. 이 엔터티 유형에는 팩스 및 호출기 번호도 포함됩니다. |
PIN |
다른 사람이 자신의 은행 계좌 정보에 액세스할 수 있도록 하는 4자리 개인 식별 번호(PIN). |
SSN |
사회보장번호(SSN)는 미국 시민권자, 영주권자 및 임시 근로 거주자에게 발급되는 9자리 번호입니다. Amazon Transcribe는 마지막 4자리만 있으면 사회보장번호도 인식합니다. |
AGE |
개인의 연령(수량 및 시간 단위 포함). 예를 들어, Amazon Transcribe는 “저는 40세입니다”라는 문구에서 “40세”를 연령으로 인식합니다. |
DATE_TIME |
날짜에는 년, 월, 일, 요일 또는 시각이 포함될 수 있습니다. 예를 들어는 Amazon Transcribe는 "2020년 1월 19일" 또는 "오전 11시"를 날짜로 인식합니다. Amazon Transcribe는 부분 날짜, 날짜 범위 및 날짜 간격을 인식합니다. 또한 “1990년대”와 같은 십년 단위를 인식할 것입니다. |
LICENSE_PLATE |
차량 번호판은 차량이 등록된 주 또는 국가에서 발급합니다. 승용차의 형식은 일반적으로 대문자와 숫자로 구성된 5~8자리 숫자입니다. 형식은 발급한 주 또는 국가의 위치에 따라 다릅니다. |
PASSPORT_NUMBER |
개인의 여권에 할당된 고유 식별자입니다. 형식에는 일반적으로 문자와 숫자의 조합이 포함되며 국가별로 다릅니다. |
PASSWORD |
비밀번호로 사용되는 영숫자 문자열(예: “*very20special #pass *”). |
USERNAME |
계정을 식별하는 사용자 이름(예: 로그인 이름, 화면 이름, 닉네임 또는 핸들). |
VEHICLE_IDENTIFICATION_NUMBER |
차량 식별 번호(VIN)는 차량을 고유하게 식별합니다. VIN 콘텐츠와 형식은 ISO 3779 사양에 정의되어 있습니다. 각 국가별로 VIN에 대한 특정 코드와 형식을 가지고 있습니다. |
AWS Management 콘솔, WebSocket 또는 HTTP/2를 사용하여 스트리밍 트랜스크립션을 시작할 수 있습니다.
-
에 로그인합니다..AWS Management 콘솔
-
탐색 창에서 실시간 트랜스크립션을 선택합니다. 콘텐츠 제거 설정까지 아래로 스크롤하고 최소화된 경우 이 필드를 확장합니다.
-
PII 식별 및 수정을 켭니다.
-
식별만 또는 식별 및 수정을 선택한 다음, 트랜스크립트에서 식별하거나 수정하려는 PII 엔터티 유형을 선택합니다.
-
이제 스트림을 트랜스크립션할 준비가 되었습니다. 스트리밍 시작을 선택하고 말하기 시작합니다. 구술을 끝내려면 스트리밍 중지를 선택합니다.
이 예시에서는 WebSocket 스트림에서 PII 수정(또는 PII 식별)을 사용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. Amazon Transcribe로 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 WebSocket 스트림 설정을 참조하세요. 파라미터에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300&X-Amz-Security-Token=security-token&X-Amz-Signature=string&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US&media-encoding=flac&sample-rate=16000&pii-entity-types=NAME,ADDRESS&content-redaction-type=PII (or &content-identification-type=PII)
동일한 요청에서 content-identification-type 및 content-redaction-type 둘 다 사용할 수는 없습니다.
파라미터 정의는 API 참조에서 찾을 수 있으며, 모든 AWS API 작업에 공통적인 파라미터는 공통 파라미터 섹션에 나열되어 있습니다.
이 예시에서는 PII 식별 또는 PII 수정이 활성화된 HTTP/2 요청을 생성합니다. Amazon Transcribe로 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 HTTP/2 스트림 설정을 참조하세요. Amazon Transcribe 관련 파라미터 및 헤더에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.
POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscriptionContent-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:stringX-Amz-Date:20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=stringx-amzn-transcribe-language-code:en-USx-amzn-transcribe-media-encoding:flacx-amzn-transcribe-sample-rate:16000x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types:transfer-encoding: chunkedNAME,ADDRESS
동일한 요청에서 content-identification-type 및 content-redaction-type 둘 다 사용할 수는 없습니다.
파라미터 정의는 API 참조에서 찾을 수 있으며, 모든 AWS API 작업에 공통적인 파라미터는 공통 파라미터 섹션에 나열되어 있습니다.
참고
스트리밍에 대한 PII 수정은 다음 AWS 리전에서만 지원됨: 아시아 태평양(서울), 아시아 태평양(시드니), 아시아 태평양(도쿄), 캐나다(중부), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(런던), 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오레곤).