Redactar o identificar la PII en una transmisión en tiempo real - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Redactar o identificar la PII en una transmisión en tiempo real

Al redactar la información de identificación personal (PII) de una transcripción en streaming, Amazon Transcribe reemplaza cada instancia identificada de PII por una de su transcripción. [PII]

Una opción adicional disponible para las transcripciones en streaming es la identificación de la PII. Al activar la identificación de PII, Amazon Transcribe etiqueta la PII de los resultados de la transcripción debajo de un Entities objeto. Para ver un ejemplo de salida, consulte Ejemplo de salida de streaming redactada y. Ejemplo de salida de identificación de PII

La redacción e identificación de la PII con transcripciones en streaming están disponibles en los siguientes dialectos del inglés: escocés ()en-AB, Australia ()en-AU, Canadá (en-CA), británico ()en-GB, Irlanda (), India ()en-IE, en-IN Nueva Zelanda (), Estados Unidos ()en-NZ, Gales () y Sudáfrica en-US (); dialectos españoles: EE. UU. en-ZA (), España (); dialectos franceses: francés (es-US), Canadá es-ES (); dialectos portugueses: Portugal ()fr-FR, Brasil ()fr-CA; dialecto italiano: Italia en-WL pt-PT pt-BR (it-IT); y dialectos alemanes: Alemania (de-DE), Suiza (de-CH).

La identificación y la redacción de la PII para los trabajos de streaming solo se realizan tras la transcripción completa de los segmentos de audio.

Tipos de PII que se Amazon Transcribe pueden reconocer para las transcripciones de streaming
Tipo de PII Description (Descripción)
ADDRESS

Una dirección física, como, por ejemplo: 100 Main Street, Anytown, EE. UU. o Suite n.º 12, Building 123. Una dirección puede la calle, el edificio, la ubicación, la ciudad, el estado, el país, el condado, el código postal, el distrito y el barrio.

ALL

Redacte o identifique todos los tipos de PII que aparecen en esta tabla.

BANK_ACCOUNT_NUMBER

Número de cuenta bancaria en EE. UU. Suelen tener entre 10 y 12 dígitos, pero Amazon Transcribe también reconoce los números de las cuentas bancarias cuando sólo están presentes los últimos 4 dígitos.

BANK_ROUTING

número de ruta de la cuenta bancaria en EE. UU Suelen tener 9 dígitos, pero Amazon Transcribe también reconoce los números de las cuentas bancarias cuando sólo están presentes los últimos 4 dígitos.

CREDIT_DEBIT_CVV

Un código de verificación de tarjeta (CVV) de 3 dígitos que está presente en las tarjetas de crédito y débito VISA y Discover. MasterCard En el caso de las tarjetas de crédito o débito American Express, el CVV es un código numérico de 4 dígitos.

CREDIT_DEBIT_EXPIRY

Fecha de caducidad de la tarjeta de crédito o débito Este número suele tener 4 dígitos y su formato es MM/AA. month/year Por ejemplo, Amazon Transcribe puede reconocer fechas de caducidad como el 21/01/2021 y enero de 2021.

CREDIT_DEBIT_NUMBER

Número de una tarjeta de crédito o débito. Estos números pueden variar de 13 a 16 dígitos, pero Amazon Transcribe también reconocen los números de las tarjetas de crédito o débito cuando solo están presentes los últimos 4 dígitos.

EMAIL

Se trata de una dirección de correo electrónico, como efua.owusu@email.com.

NAME

El nombre de una persona. Este tipo de entidad no incluye cargos, como Sr., Sra., Srta. o Dr. No Amazon Transcribe aplica este tipo de entidad a los nombres que forman parte de organizaciones o direcciones. Por ejemplo, Amazon Transcribe reconoce a la Organización John Doe como una organización y a Jane Doe Street como una dirección.

PHONE

número de teléfono Este tipo de entidad también incluye números de fax y buscapersonas.

PIN

Un número de identificación personal (PIN) de 4 dígitos que permite a una persona acceder a la información de su cuenta bancaria.

SSN

Un número de seguro social (SSN) es un número de 9 dígitos que se emite a los ciudadanos estadounidenses, los residentes permanentes y los residentes que trabajan temporalmente. Amazon Transcribe también reconoce los números de seguro social cuando solo están presentes los últimos 4 dígitos.

AGE

La edad de una persona, incluidas la cantidad y la unidad de tiempo. Por ejemplo, en la frase «Tengo 40 años», Amazon Transcribe reconoce «40 años» como una edad.

DATE_TIME

Una fecha puede incluir un año, un mes, un día, un día de la semana o una hora del día. Por ejemplo, Amazon Transcribe reconoce como fechas «19 de enero de 2020» o «11 a. m.». Amazon Transcribe reconocerá fechas parciales, rangos de fechas e intervalos de fechas. También reconocerá décadas, como “la década de 1990”.

LICENSE_PLATE

La matrícula de un vehículo es emitida por el estado o el país donde está registrado el vehículo. El formato de matrículas de los vehículos de pasajeros suele ser de cinco a ocho dígitos y consta de letras mayúsculas y números. El formato varía según la ubicación del estado o país emisor.

PASSPORT_NUMBER

Un identificador único asignado al pasaporte de una persona. El formato suele incluir una combinación de letras y números y varía según el país.

PASSWORD

Se trata de una cadena alfanumérica que se utiliza como contraseña, como, por ejemplo: “*seña#20muyespecial*”.

USERNAME

Se trata de nombre de usuario que identifica una cuenta, como un nombre de inicio de sesión, un nombre de usuario, un apodo o un identificador.

VEHICLE_IDENTIFICATION_NUMBER

Un número de identificación de vehículo (VIN) identifica de manera única a un vehículo. El contenido y el formato del VIN se definen en la especificación ISO 3779. Cada país tiene códigos y formatos específicos para VINs.

Puedes iniciar una transcripción en streaming mediante AWS Management Console WebSocket, o HTTP/2.

  1. Inicie sesión en el AWS Management Console.

  2. En el panel de navegación, elija Transcripción en tiempo real. Desplácese hacia abajo hasta Configuración de eliminación de contenido y expanda este campo si está minimizado.

    Amazon Transcribe captura de pantalla de la consola: la página de «transcripción en tiempo real».
  3. Activa la identificación y redacción de la PII.

    Amazon Transcribe captura de pantalla de la consola: el panel ampliado de «configuración de eliminación de contenido».
  4. Seleccione Solo identificación o Identificación y redacción y, a continuación, seleccione los tipos de entidades de PII que desea identificar o redactar en su transcripción.

    Amazon Transcribe captura de pantalla de la consola: lista de tipos de PII que se pueden seleccionar.
  5. Ahora tiene todo preparado para transcribir la secuencia. Seleccione Comenzar streaming y comience a hablar. Para finalizar el dictado, seleccione Detener streaming.

En este ejemplo, se crea una URL prefirmada que utiliza la redacción de la PII (o la identificación de la PII) en una transmisión. WebSocket Se han añadido saltos de línea para facilitar la lectura. Para obtener más información sobre el uso de WebSocket transmisiones con, consulte. Amazon TranscribeConfigurar una WebSocket transmisión Para obtener más información, consulte Parámetros SSM.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

No puede usar ambas content-identification-type y content-redaction-type en la misma solicitud.

Las definiciones de los parámetros se encuentran en la referencia de la API; los parámetros comunes a todas las operaciones de la AWS API se enumeran en la sección Parámetros comunes.

En este ejemplo, se crea una solicitud HTTP/2 con la identificación o la redacción de PII habilitadas. Para obtener más información sobre el uso de la transmisión mediante HTTP/2 Amazon Transcribe, consulteConfiguración de una secuencia HTTP/2. Para obtener más información sobre los parámetros y encabezados específicos de Amazon Transcribe, consulte. StartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

No puede usar ambas content-identification-type y content-redaction-type en la misma solicitud.

Las definiciones de los parámetros se encuentran en la referencia de la API; los parámetros comunes a todas las operaciones de la AWS API se enumeran en la sección Parámetros comunes.

nota

La redacción de la PII para la transmisión solo se admite en los Regiones de AWS siguientes países: Asia Pacífico (Seúl), Asia Pacífico (Sídney), Asia Pacífico (Tokio), Canadá (Central), UE (Fráncfort), UE (Irlanda), UE (Londres), EE. UU. Este (Norte de Virginia), EE. UU. Este (Ohio) y EE. UU. Oeste (Oregón).