Redactar o identificar la PII en una transmisión en tiempo real
Al redactar la información de identificación personal (PII) de una transcripción en streaming, Amazon Transcribe reemplaza cada instancia identificada de PII por una de su transcripción. [PII]
Una opción adicional disponible para las transcripciones en streaming es la identificación de la PII. Al activar la identificación de la PII, Amazon Transcribe etiqueta la PII de los resultados de la transcripción debajo de un objeto. Entities Para ver un ejemplo de salida, consulte Ejemplo de salida de streaming redactada y. Ejemplo de salida de identificación de PII
La redacción e identificación de la PII con transcripciones en transmisión están disponibles en los siguientes dialectos del inglés: escocés (en-AB), australiano (en-AU), canadiense (en-CA), británico (en-GB), irlandés (en-IE), India (en-IN), Nueva Zelanda (en-NZ), Estados Unidos (en-US), Gales (en-WL) y Sudáfrica (en-ZA); dialectos del español: EE. UU. (es-US), España (es-ES); dialectos del francés: Francia (fr-FR), Canadá (fr-CA); dialectos del portugués: Portugal (pt-PT), Brasil (pt-BR); dialecto del italiano: Italia (it-IT); y dialectos del alemán: Alemania (de-DE), Suiza (de-CH).
La identificación y la redacción de la PII para los trabajos de streaming solo se realizan tras la transcripción completa de los segmentos de audio.
| Tipo de PII | Descripción |
|---|---|
ADDRESS |
Una dirección física, como, por ejemplo: 100 Main Street, Anytown, EE. UU. o Suite n.º 12, Building 123. Una dirección puede la calle, el edificio, la ubicación, la ciudad, el estado, el país, el condado, el código postal, el distrito y el barrio. |
ALL |
Redacte o identifique todos los tipos de PII que aparecen en esta tabla. |
BANK_ACCOUNT_NUMBER |
Número de cuenta bancaria en EE. UU. Suelen tener entre 10 y 12 dígitos, pero Amazon Transcribe también reconoce los números de las cuentas bancarias cuando sólo están presentes los últimos 4 dígitos. |
BANK_ROUTING |
número de ruta de la cuenta bancaria en EE. UU Suelen tener 9 dígitos, pero Amazon Transcribe también reconoce los números de las cuentas bancarias cuando sólo están presentes los últimos 4 dígitos. |
CREDIT_DEBIT_CVV |
Se trata de un código de verificación de tarjeta (CVV) de 3 dígitos que está presente en las tarjetas de crédito y débito VISA, MasterCard y Discover. En el caso de las tarjetas de crédito o débito American Express, el CVV es un código numérico de 4 dígitos. |
CREDIT_DEBIT_EXPIRY |
Fecha de caducidad de la tarjeta de crédito o débito Este número suele tener 4 dígitos y su formato es mes/año o MM/AA. Por ejemplo, Amazon Transcribe puede reconocer fechas de caducidad como 01/21, 01/2021 y enero de 2021. |
CREDIT_DEBIT_NUMBER |
Número de una tarjeta de crédito o débito. Estos números pueden tener una longitud de 13 a 16 dígitos, pero Amazon Transcribe también reconocen los números de las tarjetas de crédito o débito cuando sólo están presentes los últimos 4 dígitos. |
EMAIL |
Se trata de una dirección de correo electrónico, como efua.owusu@email.com. |
NAME |
El nombre de una persona. Este tipo de entidad no incluye tratramientos, como Sr., Sra., Srta. o Dr. Amazon Transcribe no aplica este tipo de entidad a los nombres que forman parte de organizaciones o direcciones. Por ejemplo, Amazon Transcribe reconoce a Organización John Doe como una organización y a calle Jane Doe como una dirección. |
PHONE |
número de teléfono Este tipo de entidad también incluye números de fax y buscapersonas. |
PIN |
Un número de identificación personal (PIN) de 4 dígitos que permite a una persona acceder a la información de su cuenta bancaria. |
SSN |
Un número de seguro social (SSN) es un número de 9 dígitos que se emite a los ciudadanos estadounidenses, los residentes permanentes y los residentes que trabajan temporalmente. Amazon Transcribetambién reconoce los números de seguro social cuando solo están presentes los últimos 4 dígitos. |
AGE |
La edad de una persona, incluidas la cantidad y la unidad de tiempo. Por ejemplo, en la frase “Tengo 40 años”, Amazon Transcribe reconoce “40 años” como una edad. |
DATE_TIME |
Una fecha puede incluir un año, un mes, un día, un día de la semana o una hora del día. Por ejemplo, Amazon Transcribe reconoce “19 de enero de 2020” o “11 a. m.” como fechas. Amazon Transcribe reconocerá fechas parciales, rangos de fechas e intervalos de fechas. También reconocerá décadas, como “la década de 1990”. |
LICENSE_PLATE |
La matrícula de un vehículo es emitida por el estado o el país donde está registrado el vehículo. El formato de matrículas de los vehículos de pasajeros suele ser de cinco a ocho dígitos y consta de letras mayúsculas y números. El formato varía según la ubicación del estado o país emisor. |
PASSPORT_NUMBER |
Un identificador único asignado al pasaporte de una persona. El formato suele incluir una combinación de letras y números y varía según el país. |
PASSWORD |
Se trata de una cadena alfanumérica que se utiliza como contraseña, como, por ejemplo: “*seña#20muyespecial*”. |
USERNAME |
Se trata de nombre de usuario que identifica una cuenta, como un nombre de inicio de sesión, un nombre de usuario, un apodo o un identificador. |
VEHICLE_IDENTIFICATION_NUMBER |
Un número de identificación de vehículo (VIN) identifica de manera única a un vehículo. El contenido y el formato del VIN se definen en la especificación ISO 3779. Cada país tiene códigos y formatos específicos para los VIN. |
Puede iniciar una transcripción en streaming mediante WebSocket o HTTP/2. Consola de administración de AWS
-
Inicie sesión en el Consola de administración de AWS
. -
En el panel de navegación, elija Transcripción en tiempo real. Desplácese hacia abajo hasta Configuración de eliminación de contenido y expanda este campo si está minimizado.
-
Activa la identificación y redacción de la PII.
-
Seleccione Solo identificación o Identificación y redacción y, a continuación, seleccione los tipos de entidades de PII que desea identificar o redactar en su transcripción.
-
Ahora tiene todo listo para transcribir su secuencia. Seleccione Comenzar streaming y comience a hablar. Para finalizar el dictado, selecciona Detener la transmisión.
En este ejemplo, se crea una URL prefirmada que utiliza la redacción de PII (o identificación de PII) en una transmisión de WebSocket. Se han añadido saltos de línea para facilitar la lectura. Para obtener más información acerca de cómo usar las secuencias de WebSocket con Amazon Transcribe, consulte Configurar una transmisión en WebSocket. Para obtener más información, consulte Parámetros SSM.
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300&X-Amz-Security-Token=security-token&X-Amz-Signature=string&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US&media-encoding=flac&sample-rate=16000&pii-entity-types=NAME,ADDRESS&content-redaction-type=PII (or &content-identification-type=PII)
No puede usar ambas content-identification-type y content-redaction-type en la misma solicitud.
Las definiciones de los parámetros se encuentran en la referencia de la API; los parámetros comunes a todas las operaciones de la AWS API se enumeran en la sección Parámetros comunes.
En este ejemplo, se crea una solicitud HTTP/2 con la identificación o la redacción de PII habilitadas. Para obtener más información acerca de cómo usar los flujos con Amazon Transcribe, consulte Configuración de una secuencia HTTP/2. Para obtener más información sobre los parámetros y encabezados específicos de cada uno, consulte. Amazon Transcribe StartStreamTranscription
POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscriptionContent-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:stringX-Amz-Date:20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=stringx-amzn-transcribe-language-code:en-USx-amzn-transcribe-media-encoding:flacx-amzn-transcribe-sample-rate:16000x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types:transfer-encoding: chunkedNAME,ADDRESS
No puede usar ambas content-identification-type y content-redaction-type en la misma solicitud.
Las definiciones de los parámetros se encuentran en la referencia de la API; los parámetros comunes a todas las operaciones de la AWS API se enumeran en la sección Parámetros comunes.
nota
La redacción de la PII para su transmisión solo se admite enRegiones de AWS: Asia-Pacífico (Seúl), Asia-Pacífico (Sídney), Asia-Pacífico (Tokio), Asia-Pacífico (Tokio), Asia-Pacífico (Centro), Asia-Pacífico (Fráncfort), Irlanda (Irlanda), Europa (Londres), Este de EE. UU. (Norte de Virginia), Asia-Pacífico (Norte de Virginia), Asia-Pacífico (Norte de Virginia), Asia-Pacífico (Norte de Virginia), Asia-Pacífico (Ohio) y Oeste (Oregón).