View a markdown version of this page

Création d’un vocabulaire personnalisé à l’aide d’une liste - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d’un vocabulaire personnalisé à l’aide d’une liste

Important

Les vocabulaires personnalisés sous forme de listes sont obsolètes. Par conséquent, si vous créez un nouveau vocabulaire personnalisé, nous vous recommandons vivement d’utiliser le format de tableau.

Vous pouvez créer des vocabulaires personnalisés à partir de listes à l'aide du ou AWS Management Console AWS CLI AWS des SDK.

  • AWS Management Console : vous devez créer et télécharger un fichier texte contenant votre vocabulaire personnalisé. Vous pouvez utiliser des entrées séparées par des lignes ou des virgules. Notez que votre liste doit être enregistrée sous forme de fichier texte (*.txt). Les deux LF et les fins CRLF de ligne sont prises en charge.

  • AWS CLI et kits SDK AWS  : vous devez inclure votre vocabulaire personnalisé sous forme d’entrées séparées par des virgules dans votre appel d’API à l’aide de l’indicateur Phrases.

Si une entrée contient plusieurs mots, vous devez couper chaque mot par un trait d’union. Par exemple, vous incluez « Los Angeles » sous la forme Los-Angeles et « Andorre-la-Vieille » sous la forme Andorra-la-Vella.

Voici des exemples des deux formats de liste valides. Reportez-vous aux sections Création de listes de vocabulaires personnalisés pour des exemples spécifiques à la méthode.

  • Comma-separated entrées :

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • Line-separated entrées :

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
Important

Vous ne pouvez utiliser que des caractères pris en charge pour votre langue. Reportez-vous au jeu de caractères de votre langue pour plus de détails.

Les listes de vocabulaires personnalisés ne sont pas prises en charge par l’opération CreateMedicalVocabulary. Si vous créez un vocabulaire médical personnalisé, vous devez utiliser un format de tableau. Consultez la section Création d’un vocabulaire personnalisé à l’aide d’un tableau pour des instructions.

Création de listes de vocabulaires personnalisés

Pour traiter une liste de vocabulaire personnalisée à utiliser avec Amazon Transcribe, consultez les exemples suivants :

Cet exemple utilise la commande create-vocabulary avec un fichier de vocabulaire personnalisé sous forme de liste. Pour de plus amples informations, veuillez consulter CreateVocabulary.

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

Voici un autre exemple d’utilisation de la commande create-vocabulary et d’un corps de requête qui crée votre vocabulaire personnalisé.

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

Le fichier my-first-vocab-list.json contient le corps de requête suivant.

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

Lorsque VocabularyState passe de PENDING à READY, votre vocabulaire personnalisé est prêt à être utilisé avec une transcription. Pour afficher le statut actuel de votre vocabulaire personnalisé, exécutez :

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

Cet exemple utilise le AWS SDK pour Python (Boto3) pour créer un vocabulaire personnalisé à partir d'une liste à l'aide de la méthode create_vocabulary. Pour de plus amples informations, veuillez consulter CreateVocabulary.

Pour d'autres exemples d'utilisation AWS des SDK, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. Exemples de code pour Amazon Transcribe à l'aide de AWS Kits SDK

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Note

Si vous créez un nouveau Amazon S3 compartiment pour vos fichiers de vocabulaire personnalisés, assurez-vous que le IAM rôle à l'origine de la CreateVocabularydemande est autorisé à accéder à ce compartiment. Si le rôle ne dispose pas des autorisations appropriées, votre demande échoue. Vous pouvez éventuellement spécifier un IAM rôle dans votre demande en incluant le DataAccessRoleArn paramètre. Pour plus d'informations sur IAM les rôles et les politiques dans Amazon Transcribe, voirAmazon Transcribe exemples de politiques basées sur l'identité.