View a markdown version of this page

Creación de un vocabulario personalizado en formato de lista - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de un vocabulario personalizado en formato de lista

importante

Los vocabularios personalizados en formato de lista están en desuso, por lo que si va a crear un nuevo vocabulario personalizado, le recomendamos encarecidamente que utilice el formato de tabla.

Puede crear vocabularios personalizados a partir de listas utilizando los SDK Consola de administración de AWS, AWS CLI, o AWS .

  • Consola de administración de AWS: debe crear y cargar un archivo de texto que contenga su vocabulario personalizado. Puede utilizar entradas separadas por líneas o por comas. Ten en cuenta que la lista debe guardarse como un archivo de texto (*.txt). Se admiten ambos extremos LF y los finales de CRLF línea.

  • AWS CLI y los SDK de AWS : debe incluir su vocabulario personalizado como entradas separadas por comas en su llamada a la API utilizando la marca Phrases.

Si una entrada contiene varias palabras, debe separar cada palabra con guiones. Por ejemplo, escriba “Los Ángeles” como Los-Angeles y “Andorra la Vella” como Andorra-la-Vella.

Estos son algunos ejemplos de los dos formatos de lista válidos. Consulte Crear listas de vocabulario personalizadas para ver ejemplos específicos de cada método.

  • Comma-separated entradas:

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • Line-separated entradas:

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
importante

Sólo puede usar caracteres compatibles con su idioma. Consulte el conjunto de caracteres de su idioma para obtener más información.

La operación CreateMedicalVocabulary no admite listas de vocabulario personalizadas. Si va a crear un vocabulario médico personalizado, debe utilizar un formato de tabla; consulte Creación de un vocabulario personalizado con una tabla para obtener instrucciones.

Crear listas de vocabulario personalizadas

Para procesar una lista de vocabulario personalizada para usarla con ella Amazon Transcribe, consulta los siguientes ejemplos:

En este ejemplo, se utiliza el comando create-vocabulary con un archivo de vocabulario personalizado con formato de lista. Para obtener más información, consulte CreateVocabulary.

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

A continuación, se muestra otro ejemplo en el que se utiliza el comando create-vocabulary y el cuerpo de la solicitud que crea el vocabulario personalizado.

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

El archivo my-first-vocab-list.json contiene el siguiente cuerpo de la solicitud.

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

Cuando VocabularyState cambie de PENDING a READY, su vocabulario personalizado estará listo para usarse con una transcripción. Ejecute lo siguiente para consultar el estado actual de su vocabulario personalizado:

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

En este ejemplo, se utiliza AWS SDK para Python (Boto3) para crear un vocabulario personalizado a partir de una lista mediante el método create_vocabulary. Para obtener más información, consulte CreateVocabulary.

Para ver ejemplos adicionales sobre el uso de AWS los SDK, incluidos ejemplos de funciones específicas, escenarios y servicios cruzados, consulta el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDK

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
nota

Si creas un nuevo Amazon S3 depósito para tus archivos de vocabulario personalizados, asegúrate de que el IAM rol que realiza la CreateVocabularysolicitud tenga permisos para acceder a este depósito. Si el rol no tiene los permisos correctos, la solicitud fallará. Si lo desea, puede especificar un IAM rol en su solicitud incluyendo el DataAccessRoleArn parámetro. Para obtener más información sobre las IAM funciones y políticas de Amazon Transcribe, consulteAmazon Transcribe ejemplos de políticas basadas en identidades.