Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un vocabulario personalizado en formato de lista
importante
Los vocabularios personalizados en formato de lista están en desuso, por lo que si va a crear un nuevo vocabulario personalizado, le recomendamos encarecidamente que utilice el formato de tabla.
Puede crear vocabularios personalizados a partir de listas utilizando los SDK Consola de administración de AWS, AWS CLI, o AWS .
-
Consola de administración de AWS: debe crear y cargar un archivo de texto que contenga su vocabulario personalizado. Puede utilizar entradas separadas por líneas o por comas. Ten en cuenta que la lista debe guardarse como un archivo de texto (*.txt). Se admiten ambos extremos
LFy los finales deCRLFlínea. -
AWS CLI y los SDK de AWS : debe incluir su vocabulario personalizado como entradas separadas por comas en su llamada a la API utilizando la marca
Phrases.
Si una entrada contiene varias palabras, debe separar cada palabra con guiones. Por ejemplo, escriba “Los Ángeles” como Los-Angeles y “Andorra la Vella” como Andorra-la-Vella.
Estos son algunos ejemplos de los dos formatos de lista válidos. Consulte Crear listas de vocabulario personalizadas para ver ejemplos específicos de cada método.
-
Comma-separated entradas:
Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella -
Line-separated entradas:
Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
importante
Sólo puede usar caracteres compatibles con su idioma. Consulte el conjunto de caracteres de su idioma para obtener más información.
La operación CreateMedicalVocabulary no admite listas de vocabulario personalizadas. Si va a crear un vocabulario médico personalizado, debe utilizar un formato de tabla; consulte Creación de un vocabulario personalizado con una tabla para obtener instrucciones.
Crear listas de vocabulario personalizadas
Para procesar una lista de vocabulario personalizada para usarla con ella Amazon Transcribe, consulta los siguientes ejemplos:
En este ejemplo, se utiliza el comando create-vocabulary con un archivo de vocabulario personalizado con formato de lista. Para obtener más información, consulte CreateVocabulary.
aws transcribe create-vocabulary \ --vocabulary-namemy-first-vocabulary\ --language-codeen-US\ --phrases {CLI,Eva-Maria,ABCs}
A continuación, se muestra otro ejemplo en el que se utiliza el comando create-vocabulary y el cuerpo de la solicitud que crea el vocabulario personalizado.
aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json
El archivo my-first-vocab-list.json contiene el siguiente cuerpo de la solicitud.
{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }
Cuando VocabularyState cambie de PENDING a READY, su vocabulario personalizado estará listo para usarse con una transcripción. Ejecute lo siguiente para consultar el estado actual de su vocabulario personalizado:
aws transcribe get-vocabulary \ --vocabulary-namemy-first-vocabulary
En este ejemplo, se utiliza AWS SDK para Python (Boto3) para crear un vocabulario personalizado a partir de una lista mediante el método create_vocabularyCreateVocabulary.
Para ver ejemplos adicionales sobre el uso de AWS los SDK, incluidos ejemplos de funciones específicas, escenarios y servicios cruzados, consulta el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDK
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
nota
Si creas un nuevo Amazon S3 depósito para tus archivos de vocabulario personalizados, asegúrate de que el IAM rol que realiza la CreateVocabularysolicitud tenga permisos para acceder a este depósito. Si el rol no tiene los permisos correctos, la solicitud fallará. Si lo desea, puede especificar un IAM rol en su solicitud incluyendo el DataAccessRoleArn parámetro. Para obtener más información sobre las IAM funciones y políticas de Amazon Transcribe, consulteAmazon Transcribe ejemplos de políticas basadas en identidades.