

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Amélioration de la précision de la transcription grâce à des vocabulaires personnalisés et des modèles de langue personnalisés
<a name="improving-accuracy"></a>

Si votre média contient des termes spécifiques à un domaine ou non standard, tels que des noms de marque, des acronymes, des termes techniques et du jargon, il est possible que ces termes ne Amazon Transcribe soient pas correctement capturés dans votre sortie de transcription.

Pour corriger les inexactitudes de transcription et personnaliser votre sortie en fonction de votre cas d’utilisation spécifique, vous pouvez créer [Vocabulaires personnalisés](custom-vocabulary.md) et [Modèles de langue personnalisés](custom-language-models.md).
+ [Vocabulaires personnalisés](custom-vocabulary.md) sont conçus pour optimiser et améliorer à la fois la reconnaissance et le formatage de mots spécifiques dans tous les contextes. Cela implique de fournir à Amazon Transcribe des mots et, éventuellement, des formulaires de prononciation et d’affichage.

  Si des termes spécifiques ne Amazon Transcribe sont pas correctement affichés dans vos transcriptions, vous pouvez créer un fichier de vocabulaire personnalisé qui indique Amazon Transcribe comment vous souhaitez que ces termes soient affichés. Cette approche par mot est la plus appropriée pour corriger des termes tels que les noms de marque et les acronymes.
+ Les [Modèles de langue personnalisés](custom-language-models.md) sont conçus pour capturer le contexte associé aux termes. Cela implique de Amazon Transcribe fournir un grand volume de données textuelles spécifiques à un domaine.

  Si les termes techniques ne Amazon Transcribe sont pas correctement affichés ou si vous utilisez un homophone incorrect dans vos transcriptions, vous pouvez créer un modèle de langage personnalisé qui enseigne le langage spécifique à Amazon Transcribe votre domaine. Par exemple, un modèle de langue personnalisé peut apprendre quand utiliser « floe » (banquise) et « flux » (flux de glace).

  Cette approche contextuelle est la plus appropriée pour transcrire de gros volumes de discours spécifiques à un domaine. Les modèles de langue personnalisés peuvent apporter des améliorations de précision significatives par rapport aux seuls vocabulaires personnalisés. Lorsque vous utilisez des transcriptions par lots, vous pouvez inclure à la fois un modèle de langue personnalisé et un vocabulaire personnalisé dans votre demande.

**Astuce**  
Pour obtenir une précision de transcription maximale, utilisez des vocabulaires personnalisés avec vos modèles de langue personnalisés.

Pour une présentation vidéo de la création et de l’utilisation de vocabulaires personnalisés, voir :

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/oBgSJ7bsP2U/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/oBgSJ7bsP2U)


Pour une présentation vidéo de la création et de l’utilisation de modèles de langue personnalisés, voir :

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/iTkJoIqRrPU/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/iTkJoIqRrPU)


**Approfondissez vos connaissances avec le blog AWS Machine Learning**  
Vocabulaires personnalisés :  
[Transcriptions en direct des courses de F1 à l'aide de Amazon Transcribe](https://aws.amazon.com/blogs/machine-learning/live-transcriptions-of-f1-races-using-amazon-transcribe/)
Modèles de langue personnalisés :  
[Création de modèles linguistiques personnalisés pour optimiser les performances speech-to-text Amazon Transcribe](https://aws.amazon.com/blogs/machine-learning/building-custom-language-models-to-supercharge-speech-to-text-performance-for-amazon-transcribe/)
[Amélioration de la précision de transcription des cours grâce à des modèles de langue personnalisés pour Amazon Transcribe](https://aws.amazon.com/blogs/machine-learning/transcribe-class-lectures-accurately-using-amazon-transcribe-with-custom-language-models/)

# Vocabulaires personnalisés
<a name="custom-vocabulary"></a>

Utilisez des vocabulaires personnalisés pour améliorer la précision de la transcription d’un ou de plusieurs mots spécifiques. Il s’agit généralement de termes spécifiques à un domaine, tels que des noms de marque et des acronymes, des noms propres et des mots qu’ Amazon Transcribe ne rend pas correctement.

Les vocabulaires personnalisés peuvent être utilisés avec toutes les langues prises en charge. Notez que seuls les caractères répertoriés dans le [jeu de caractères](charsets.md) de votre langue peuvent être utilisés dans un vocabulaire personnalisé.

**Important**  
Vous êtes responsable de l’intégrité de vos propres données lorsque vous les utilisez Amazon Transcribe. N’entrez pas d’informations confidentielles, personnelles (PII) ou protégées sur la santé (PHI) dans un vocabulaire personnalisé.

Considérations à prendre en compte lors de la création d’un vocabulaire personnalisé :
+ Vous pouvez avoir jusqu'à 100 fichiers de vocabulaire personnalisés par Compte AWS
+ La taille de chaque vocabulaire personnalisé est limitée à 50 Ko.
+ Si vous utilisez l’API pour créer votre vocabulaire personnalisé, votre fichier de vocabulaire doit être au format texte (\$1.txt). Si vous utilisez le AWS Management Console, votre fichier de vocabulaire peut être au format texte (\$1.txt) ou au format valeur séparée par des virgules (\$1.csv).
+ Chaque entrée d’un vocabulaire personnalisé ne peut pas dépasser 256 caractères.
+ Pour utiliser un vocabulaire personnalisé, celui-ci doit avoir été créé en même temps Région AWS que votre transcription.

**Astuce**  
Vous pouvez tester votre vocabulaire personnalisé à l'aide du AWS Management Console. Une fois que votre vocabulaire personnalisé est prêt à être utilisé, connectez-vous au AWS Management Console, sélectionnez **Transcription en temps réel**, faites défiler l'écran jusqu'à **Personnalisations**, activez **Vocabulaire personnalisé** et sélectionnez votre vocabulaire personnalisé dans la liste déroulante. Sélectionnez ensuite **Démarrer le streaming**. Prononcez quelques mots de votre vocabulaire personnalisé dans votre micro pour vérifier s’ils s’affichent correctement.

## Tableaux de vocabulaires personnalisés et listes de vocabulaires personnalisés
<a name="custom-vocabulary-tables-lists"></a>

**Important**  
Les vocabulaires personnalisés sous forme de liste sont obsolètes. Si vous créez un nouveau vocabulaire personnalisé, utilisez le [format de tableau](custom-vocabulary-create-table.md).

Les tableaux vous offrent davantage d’options et de contrôle sur l’entrée et la sortie des mots de votre vocabulaire personnalisé. Avec les tableaux, vous devez spécifier plusieurs catégories (Phrase and DisplayAs), ce qui vous permet d'affiner votre sortie.

Les listes ne comportent pas d’options supplémentaires. Vous pouvez donc uniquement saisir les entrées telles que vous souhaitez qu’elles apparaissent dans votre transcription, en remplaçant tous les espaces par des tirets.

Les AWS Management Console AWS CLI, et AWS SDKs tous utilisent des tables de vocabulaire personnalisées de la même manière ; les listes sont utilisées différemment pour chaque méthode et peuvent donc nécessiter un formatage supplémentaire pour une utilisation réussie entre les méthodes.

Pour plus d’informations, consultez [Création d’un vocabulaire personnalisé à l’aide d’un tableau](custom-vocabulary-create-table.md) et [Création d’un vocabulaire personnalisé à l’aide d’une liste](custom-vocabulary-create-list.md).

Pour aller un peu plus loin et apprendre à utiliser Amazon Augmented AI avec des vocabulaires personnalisés, consultez :

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/65eVesNiJzY/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/65eVesNiJzY)


**Opérations d’API spécifiques aux vocabulaires personnalisés**  
 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html) 

# Création d’un vocabulaire personnalisé à l’aide d’un tableau
<a name="custom-vocabulary-create-table"></a>

L’utilisation d’un tableau est la méthode préférée pour créer votre vocabulaire personnalisé. Les tables de vocabulaire doivent comporter quatre colonnes (Phrase, SoundsLike, IPA, and DisplayAs), qui peut être inclus dans n'importe quelle commande :


| Expression | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
|  Obligatoire. Chaque ligne de votre tableau doit contenir une entrée dans cette colonne. N’utilisez pas d’espaces dans cette colonne. Si votre entrée contient plusieurs mots, séparez-les par un trait d’union (-). Par exemple, **Andorra-la-Vella** ou **Los-Angeles**. Pour les acronymes, les lettres prononcées doivent être séparées par un point. Le point final doit également être prononcé. Si votre acronyme est au pluriel, vous devez utiliser un trait d’union entre l’acronyme et le « s ». Par exemple, « CLI » est **C.L.I.** (pas**C.L.I**) et « ABCs » est **A.B.C.-s** (pas**A.B.C-s**). Si votre expression est composée à la fois d’un mot et d’un acronyme, ces deux éléments doivent être séparés par un trait d’union. Par exemple, « DynamoDB » devient **Dynamo-D.B.**. N’incluez pas de chiffres dans cette colonne ; les chiffres doivent être épelés. Par exemple, « VX02Q » devient **V.X.-zero-two-Q.**.  |  `SoundsLike`n'est plus pris en charge pour le vocabulaire personnalisé. Veuillez laisser la colonne vide. Toutes les valeurs de cette colonne seront ignorées. Nous supprimerons le support de cette colonne à l'avenir.  |  `IPA`n'est plus pris en charge pour le vocabulaire personnalisé. Veuillez laisser la colonne vide. Toutes les valeurs de cette colonne seront ignorées. Nous supprimerons le support de cette colonne à l'avenir.  |  Facultatif. Les lignes de cette colonne peuvent être laissées vides. Vous pouvez utiliser des espaces dans cette colonne. Définit l’apparence que vous souhaitez donner à votre entrée dans votre sortie de transcription. Par exemple, **Andorra-la-Vella** dans la colonne `Phrase` devient **Andorra la Vella** dans la colonne `DisplayAs`. Si une ligne de cette colonne est vide, Amazon Transcribe utilise le contenu de la `Phrase` colonne pour déterminer le résultat. Vous pouvez inclure des chiffres (`0-9`) dans cette colonne.  | 

Points à prendre en compte lors de la création de votre tableau :
+ Votre tableau doit contenir les quatre en-têtes de colonne (Phrase, SoundsLike, IPA, and DisplayAs). La `Phrase` colonne doit contenir une entrée sur chaque ligne. La possibilité de fournir des entrées de prononciation via `IPA` et n'`SoundsLike`est plus prise en charge et vous pouvez laisser la colonne vide. Toutes les valeurs de ces colonnes seront ignorées.
+ Chaque colonne doit être délimitée par des tabulations ou des virgules (,) ; cela s’applique à chaque ligne de votre fichier de vocabulaire personnalisé. Si une ligne contient des colonnes vides, vous devez tout de même inclure un délimiteur (tabulation ou virgule) pour chaque colonne.
+ Les espaces ne sont autorisés que dans les colonnes `IPA` et `DisplayAs`. N’utilisez pas d’espaces pour séparer les colonnes.
+ `IPA`et ne `SoundsLike` sont plus pris en charge pour le vocabulaire personnalisé. Veuillez laisser la colonne vide. Toutes les valeurs de ces colonnes seront ignorées. Nous supprimerons le support de cette colonne à l'avenir.
+ La colonne `DisplayAs` prend en charge les symboles et les caractères spéciaux (par exemple, C\$1\$1). Toutes les autres colonnes prennent en charge les caractères répertoriés sur la page de [jeu de caractères](charsets.md) de votre langue.
+ Si vous souhaitez inclure des chiffres dans la colonne `Phrase`, vous devez les épeler. Les chiffres (`0-9`) ne sont pris en charge que dans la colonne `DisplayAs`.
+ Vous devez enregistrer votre tableau sous forme de fichier texte brut (\$1.txt) au format `LF`. Si vous utilisez un autre format, par exemple `CRLF`, votre vocabulaire personnalisé ne peut pas être traité.
+ Vous devez télécharger votre fichier de vocabulaire personnalisé dans un Amazon S3 bucket et le traiter à l'aide de celui-ci [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)avant de pouvoir l'inclure dans une demande de transcription. Reportez-vous à [Création de tableaux de vocabulaires personnalisés](#custom-vocabulary-create-table-examples) pour obtenir des instructions.

**Note**  
Saisissez des acronymes, ou d’autres termes dont les lettres doivent être prononcées individuellement, sous forme de lettres séparées par des points (**A.B.C.**). Pour saisir le pluriel d'un acronyme, tel que « ABCs », séparez le « s » de l'acronyme par un tiret ()**A.B.C.-s**. Vous pouvez utiliser des majuscules ou des minuscules pour saisir un acronyme. Les acronymes ne sont pas pris en charge dans toutes les langues ; consultez la section [Langues prises en charge et fonctionnalités spécifiques aux langues](supported-languages.md).

Voici un exemple de tableau de vocabulaire personnalisé (où **[TAB]** représente un caractère de tabulation) :

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
Los-Angeles[TAB][TAB][TAB]Los Angeles
Eva-Maria[TAB][TAB][TAB]
A.B.C.-s[TAB][TAB][TAB]ABCs
Amazon-dot-com[TAB][TAB][TAB]Amazon.com
C.L.I.[TAB][TAB][TAB]CLI
Andorra-la-Vella[TAB][TAB][TAB]Andorra la Vella
Dynamo-D.B.[TAB][TAB][TAB]DynamoDB
V.X.-zero-two[TAB][TAB][TAB]VX02
V.X.-zero-two-Q.[TAB][TAB][TAB]VX02Q
```

Pour plus de clarté visuelle, voici le même tableau avec des colonnes alignées. **N’ajoutez pas** d’espaces entre les colonnes de votre tableau de vocabulaire personnalisé ; votre tableau doit sembler mal aligné comme dans l’exemple précédent.

```
Phrase          [TAB]SoundsLike          [TAB]IPA                [TAB]DisplayAs  
Los-Angeles     [TAB]                    [TAB]                   [TAB]Los Angeles   
Eva-Maria       [TAB]                    [TAB]                   [TAB]
A.B.C.-s        [TAB]                    [TAB]                   [TAB]ABCs  
amazon-dot-com  [TAB]                    [TAB]                   [TAB]amazon.com
C.L.I.          [TAB]                    [TAB]                   [TAB]CLI   
Andorra-la-Vella[TAB]                    [TAB]                   [TAB]Andorra la Vella
Dynamo-D.B.     [TAB]                    [TAB]                   [TAB]DynamoDB
V.X.-zero-two   [TAB]                    [TAB]                   [TAB]VX02
V.X.-zero-two-Q.[TAB]                    [TAB]                   [TAB]VX02Q
```

## Création de tableaux de vocabulaires personnalisés
<a name="custom-vocabulary-create-table-examples"></a>

Pour traiter une table de vocabulaire personnalisée à utiliser avec Amazon Transcribe, consultez les exemples suivants :

### AWS Management Console
<a name="vocab-create-table-console"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le panneau de navigation, choisissez **Vocabulaire personnalisé**. La page **Vocabulaire personnalisé** s’ouvre. Elle vous permet de consulter les vocabulaires existants ou d’en créer un nouveau.

1. Sélectionnez **Créer du vocabulaire**.  
![\[Amazon Transcribe capture d'écran de la console : la page « vocabulaire personnalisé ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console.png)

   Vous accédez alors à la page **Créer du vocabulaire**. Entrez un nom pour votre nouveau vocabulaire personnalisé.

   Trois possibilités s’offrent à vous :

   1. Téléchargez un fichier txt ou csv depuis votre ordinateur.

      Vous pouvez créer votre vocabulaire personnalisé à partir de zéro ou télécharger un modèle pour vous aider à démarrer. Votre vocabulaire est ensuite renseigné automatiquement dans le volet **Afficher et modifier le vocabulaire**.  
![\[Amazon Transcribe capture d'écran de la console : la page « créer et importer du vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console-upload.png)

   1. Importez un fichier txt ou csv à partir d'un Amazon S3 emplacement.

      Vous pouvez créer votre vocabulaire personnalisé à partir de zéro ou télécharger un modèle pour vous aider à démarrer. Téléchargez votre fichier de vocabulaire terminé dans un compartiment Amazon S3 et spécifiez son URI dans votre demande. Votre vocabulaire est ensuite renseigné automatiquement dans le volet **Afficher et modifier le vocabulaire**.  
![\[Amazon Transcribe capture d'écran de la console : la page « créer et importer du vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console-s3.png)

   1. Créez manuellement votre vocabulaire dans la console.

      Accédez au volet **Afficher et modifier le vocabulaire** et sélectionnez **Ajouter 10 lignes**. Vous pouvez désormais saisir des termes manuellement.  
![\[Amazon Transcribe capture d'écran de la console : la page « créer et importer du vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console-manual.png)

1. Vous pouvez modifier votre vocabulaire dans le volet **Afficher et modifier le vocabulaire**. Pour apporter des modifications, cliquez sur l’entrée que vous souhaitez modifier.  
![\[Amazon Transcribe capture d'écran de la console : le volet « créer et modifier le vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-edit2.png)

   Si vous faites une erreur, vous recevez un message d’erreur détaillé afin que vous puissiez corriger tout problème avant de traiter votre vocabulaire. Notez que si vous ne corrigez pas toutes les erreurs avant de sélectionner **Créer du vocabulaire**, votre demande de vocabulaire échoue.  
![\[Amazon Transcribe capture d'écran de la console : le volet « créer et modifier le vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-edit3.png)

   Cochez la case (✓) pour enregistrer vos modifications ou cliquez sur le « X » pour les ignorer.

1. Vous pouvez également ajouter des balises à votre vocabulaire personnalisé. Une fois que vous avez rempli tous les champs et que vous êtes satisfait de votre vocabulaire, sélectionnez **Créer du vocabulaire** en bas de la page. Vous revenez alors à la page **Vocabulaire personnalisé** où vous pouvez voir le statut de votre vocabulaire personnalisé. Lorsque le statut passe de « En attente » à « Prêt », votre vocabulaire personnalisé peut être utilisé avec une transcription.  
![\[Amazon Transcribe capture d'écran de la console : vocabulaire personnalisé en attente pendant le traitement.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console-pending.png)

1. Si le statut passe à « Échec », sélectionnez le nom de votre vocabulaire personnalisé pour accéder à sa page d’informations.  
![\[Amazon Transcribe capture d'écran de la console : page « vocabulaire personnalisé » montrant un vocabulaire comme complet et un autre comme défaillant.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console-failed.png)

   En haut de cette page, une bannière **Raison de l’échec** fournit des informations sur la raison pour laquelle votre vocabulaire personnalisé a échoué. Corrigez l’erreur dans votre fichier texte, puis réessayez.  
![\[Amazon Transcribe capture d'écran de la console : la page d'informations du vocabulaire indique la raison de l'échec.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-create-console-failed2.png)

### AWS CLI
<a name="vocab-create-table-cli"></a>

Cet exemple utilise la commande [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) avec un fichier de vocabulaire personnalisé sous forme de tableau. Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Pour utiliser un vocabulaire personnalisé existant dans une tâche de transcription, `VocabularyName` définissez-le dans le [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html)champ lorsque vous appelez l'[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)opération ou, dans le AWS Management Console, choisissez le vocabulaire personnalisé dans la liste déroulante.

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US
```

Voici un autre exemple d’utilisation de la commande [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) et d’un corps de requête qui crée votre vocabulaire personnalisé.

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-table.json
```

Le fichier *my-first-vocab-table.json* contient le corps de requête suivant.

```
{
  "VocabularyName": "my-first-vocabulary",
  "VocabularyFileUri": "s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt",
  "LanguageCode": "en-US"
}
```

Lorsque `VocabularyState` passe de `PENDING` à `READY`, votre vocabulaire personnalisé est prêt à être utilisé avec une transcription. Pour afficher le statut actuel de votre vocabulaire personnalisé, exécutez :

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK pour Python (Boto3)
<a name="vocab-create-table-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour créer un vocabulaire personnalisé à partir d'un tableau à l'aide de la méthode [create\$1vocabulary](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary). Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Pour utiliser un vocabulaire personnalisé existant dans une tâche de transcription, `VocabularyName` définissez-le dans le [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html)champ lorsque vous appelez l'[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)opération ou, dans le AWS Management Console, choisissez le vocabulaire personnalisé dans la liste déroulante.

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**Note**  
Si vous créez un nouveau Amazon S3 compartiment pour vos fichiers de vocabulaire personnalisés, assurez-vous que le IAM rôle à l'origine de la [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)demande est autorisé à accéder à ce compartiment. Si le rôle ne dispose pas des autorisations appropriées, votre demande échoue. Vous pouvez éventuellement spécifier un IAM rôle dans votre demande en incluant le `DataAccessRoleArn` paramètre. Pour plus d'informations sur IAM les rôles et les politiques dans Amazon Transcribe, voir[Amazon Transcribe exemples de politiques basées sur l'identité](security_iam_id-based-policy-examples.md).

# Création d’un vocabulaire personnalisé à l’aide d’une liste
<a name="custom-vocabulary-create-list"></a>

**Important**  
Les vocabulaires personnalisés sous forme de listes sont obsolètes. Par conséquent, si vous créez un nouveau vocabulaire personnalisé, nous vous recommandons vivement d’utiliser le [format de tableau.](custom-vocabulary-create-table.md)

Vous pouvez créer des vocabulaires personnalisés à partir de listes en utilisant le AWS Management Console AWS CLI, ou. AWS SDKs
+ **AWS Management Console** : vous devez créer et télécharger un fichier texte contenant votre vocabulaire personnalisé. Vous pouvez utiliser des entrées séparées par des lignes ou des virgules. Notez que votre liste doit être enregistrée sous forme de fichier texte (\$1.txt) au format `LF`. Si vous utilisez un autre format, comme le format `CRLF`, votre vocabulaire personnalisé n’est pas accepté par Amazon Transcribe.
+ **AWS CLI**et **AWS SDKs**: Vous devez inclure votre vocabulaire personnalisé sous forme d'entrées séparées par des virgules dans votre appel d'API à l'aide de l'[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases)indicateur.

Si une entrée contient plusieurs mots, vous devez couper chaque mot par un trait d’union. Par exemple, vous incluez « Los Angeles » sous la forme **Los-Angeles** et « Andorre-la-Vieille » sous la forme **Andorra-la-Vella**.

Voici des exemples des deux formats de liste valides. Reportez-vous aux sections [Création de listes de vocabulaires personnalisés](#custom-vocabulary-create-list-examples) pour des exemples spécifiques à la méthode.
+ Entrées séparées par des virgules :

  ```
  Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  ```
+ Entrées séparées par des lignes :

  ```
  Los-Angeles
  CLI
  Eva-Maria
  ABCs
  Andorra-la-Vella
  ```

**Important**  
Vous ne pouvez utiliser que des caractères pris en charge pour votre langue. Reportez-vous au [jeu de caractères](charsets.md) de votre langue pour plus de détails.

Les listes de vocabulaires personnalisés ne sont pas prises en charge par l’opération [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html). Si vous créez un vocabulaire médical personnalisé, vous devez utiliser un format de tableau. Consultez la section [Création d’un vocabulaire personnalisé à l’aide d’un tableau](custom-vocabulary-create-table.md) pour des instructions.

## Création de listes de vocabulaires personnalisés
<a name="custom-vocabulary-create-list-examples"></a>

Pour traiter une liste de vocabulaire personnalisée à utiliser avec Amazon Transcribe, consultez les exemples suivants :

### AWS CLI
<a name="vocab-create-list-cli"></a>

Cet exemple utilise la commande [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) avec un fichier de vocabulaire personnalisé sous forme de liste. Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--language-code en-US \ 
--phrases {CLI,Eva-Maria,ABCs}
```

Voici un autre exemple d’utilisation de la commande [create-vocabulary](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html) et d’un corps de requête qui crée votre vocabulaire personnalisé.

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-list.json
```

Le fichier *my-first-vocab-list.json* contient le corps de requête suivant.

```
{
  "VocabularyName": "my-first-vocabulary",
  "LanguageCode": "en-US",
  "Phrases": [
        "CLI","Eva-Maria","ABCs"
  ]
}
```

Lorsque `VocabularyState` passe de `PENDING` à `READY`, votre vocabulaire personnalisé est prêt à être utilisé avec une transcription. Pour afficher le statut actuel de votre vocabulaire personnalisé, exécutez :

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK pour Python (Boto3)
<a name="vocab-create-list-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour créer un vocabulaire personnalisé à partir d'une liste à l'aide de la méthode [create\$1vocabulary](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary). Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    Phrases = [
        'CLI','Eva-Maria','ABCs'
    ]
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**Note**  
Si vous créez un nouveau Amazon S3 compartiment pour vos fichiers de vocabulaire personnalisés, assurez-vous que le IAM rôle à l'origine de la [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)demande est autorisé à accéder à ce compartiment. Si le rôle ne dispose pas des autorisations appropriées, votre demande échoue. Vous pouvez éventuellement spécifier un IAM rôle dans votre demande en incluant le `DataAccessRoleArn` paramètre. Pour plus d'informations sur IAM les rôles et les politiques dans Amazon Transcribe, voir[Amazon Transcribe exemples de politiques basées sur l'identité](security_iam_id-based-policy-examples.md).

# Utilisation d’un vocabulaire personnalisé
<a name="custom-vocabulary-using"></a>

Une fois votre vocabulaire personnalisé créé, vous pouvez l’inclure dans vos demandes de transcription. Reportez-vous aux sections suivantes pour des exemples.

La langue du vocabulaire personnalisé que vous incluez dans votre demande doit correspondre au code de langue que vous spécifiez pour votre fichier multimédia. Si les langues ne correspondent pas, votre vocabulaire personnalisé n’est pas appliqué à votre transcription et il n’y a aucun avertissement ni erreur.

## Utilisation d’un vocabulaire personnalisé dans une transcription par lots
<a name="custom-vocabulary-using-batch"></a>

Pour utiliser un vocabulaire personnalisé avec une transcription par lots, consultez les exemples suivants :

### AWS Management Console
<a name="vocab-using-console-batch"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Tâches de transcription**, puis sélectionnez **Créer une tâche** (en haut à droite). La page **Spécifier les détails de la tâche** s’ouvre.  
![\[Amazon Transcribe capture d'écran de la console : la page « Spécifier les détails de la tâche ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/console-batch-job-details-1.png)

   Donnez un nom à votre tâche et spécifiez votre média d’entrée. Incluez éventuellement d’autres champs, puis choisissez **Suivant**.

1. Au bas de la page **Configurer la tâche**, dans le volet **Personnalisation**, activez **Vocabulaire personnalisé**.  
![\[Amazon Transcribe capture d'écran de la console : la page « configurer le travail ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/console-batch-configure-job-vocab.png)

1. Sélectionnez votre vocabulaire personnalisé dans le menu déroulant.

   Sélectionnez **Créer une tâche** pour exécuter votre tâche de transcription. 

### AWS CLI
<a name="vocab-using-cli"></a>

Cet exemple utilise la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et le `Settings` paramètre avec le `VocabularyName` sous-paramètre. Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html).

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings VocabularyName=my-first-vocabulary
```

Voici un autre exemple d'utilisation de la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et d'un corps de requête qui inclut votre vocabulaire personnalisé pour cette tâche.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-vocabulary-job.json
```

Le fichier *my-first-vocabulary-job.json* contient le corps de requête suivant.

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "VocabularyName": "my-first-vocabulary"
   }
}
```

### AWS SDK pour Python (Boto3)
<a name="vocab-using-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour inclure un vocabulaire personnalisé en utilisant l'`Settings`argument de la méthode [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'VocabularyName': 'my-first-vocabulary' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## Utilisation d’un vocabulaire personnalisé dans une transcription en streaming
<a name="custom-vocabulary-using-stream"></a>

Pour utiliser un vocabulaire personnalisé avec une transcription en streaming, consultez les exemples suivants :

### AWS Management Console
<a name="vocab-using-console-stream"></a>

1. Connectez-vous au [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le panneau de navigation, choisissez **Transcription en temps réel**. Faites défiler jusqu’à **Personnalisations** et développez ce champ s’il est réduit.  
![\[Amazon Transcribe capture d'écran de la console : la page « transcription en temps réel ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/stream-main.png)

1. Activez **Vocabulaire personnalisé** et sélectionnez un vocabulaire personnalisé dans le menu déroulant.  
![\[Amazon Transcribe capture d'écran de la console : le volet « personnalisations » étendu.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-stream2.png)

   Incluez les autres paramètres que vous souhaitez appliquer à votre flux.

1. Vous êtes prêt à transcrire votre flux. Sélectionnez **Démarrer le streaming** et commencez à parler. Pour mettre fin à votre dictée, sélectionnez **Arrêter le streaming**.

### Flux HTTP/2
<a name="vocab-using-http2"></a>

Cet exemple crée une requête HTTP/2 qui inclut votre vocabulaire personnalisé. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultez[Configuration d’un flux HTTP/2](streaming-setting-up.md#streaming-http2). Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-vocabulary-name: my-first-vocabulary
transfer-encoding: chunked
```

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

### WebSocket flux
<a name="vocab-using-websocket"></a>

Cet exemple crée une URL présignée qui applique votre vocabulaire personnalisé à un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultez[Configuration d'un WebSocket stream](streaming-setting-up.md#streaming-websocket). Pour plus de détails sur les paramètres, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&vocabulary-name=my-first-vocabulary
```

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

# Modèles de langue personnalisés
<a name="custom-language-models"></a>

Les modèles de langue personnalisés sont conçus pour améliorer la précision de la transcription des discours spécifiques à un domaine. Cela inclut tout contenu autre que celui que vous entendriez dans les conversations normales de tous les jours. Par exemple, si vous transcrivez les débats d’une conférence scientifique, il est peu probable qu’une transcription standard reconnaisse la plupart des termes scientifiques utilisés par les intervenants. Dans ce cas, vous pouvez entraîner un modèle de langue personnalisé pour reconnaître les termes spécialisés utilisés dans votre discipline.

Contrairement aux vocabulaires personnalisés, qui améliorent la reconnaissance d’un mot en fournissant des indices (tels que des prononciations), les modèles de langue personnalisés apprennent le contexte associé à un mot donné. Cela inclut comment et quand un mot est utilisé, ainsi que la relation qu’un mot entretient avec d’autres mots. Par exemple, si vous entraînez votre modèle à l’aide de documents de recherche en climatologie, votre modèle apprendra peut-être que « banquise » est un mot plus probable que « flux de glace ».

Pour connaître les langues prises en charge pour les modèles de langue personnalisés, consultez la section [Langues prises en charge et fonctionnalités spécifiques aux langues](supported-languages.md). Notez que si vous incluez un modèle de langue personnalisé dans votre demande, vous ne pouvez pas activer l’identification de la langue (vous devez spécifier un code de langue).

**Opérations d’API spécifiques aux modèles de langue personnalisés**  
 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateLanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateLanguageModel.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteLanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteLanguageModel.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DescribeLanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DescribeLanguageModel.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListLanguageModels.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListLanguageModels.html) 

## Sources de données
<a name="custom-language-models-data-sources"></a>

Vous pouvez utiliser n’importe quel type de données texte pour entraîner votre modèle. Toutefois, plus le contenu de votre texte est proche de votre contenu audio, plus votre modèle est précis. Il est donc important de choisir des données texte qui utilisent les mêmes termes dans le même contexte que votre fichier audio.

Les meilleures données pour l’entraînement d’un modèle sont des transcriptions précises. Ces données sont considérées comme des données internes au domaine. Les données texte internes au domaine ont exactement les mêmes termes, utilisations et contextes que l’audio que vous souhaitez transcrire.

Si vous ne disposez pas de transcriptions précises, utilisez des articles de journaux, des rapports techniques, des livres blancs, des débats de conférence, des manuels d’instructions, des articles de presse, du contenu de sites Web et tout autre texte contenant les termes souhaités utilisés dans un contexte similaire à celui de votre audio. Ces données sont considérées comme des données relatives au domaine.

La création d’un modèle de langue personnalisé robuste peut nécessiter une quantité importante de données texte, qui doivent contenir les termes prononcés dans votre audio. Vous pouvez fournir jusqu' Amazon Transcribe à 2 Go de données texte pour entraîner votre modèle, c'est ce que l'on appelle les données d'**entraînement**. **Facultativement, lorsque vous n'avez pas (ou peu) de transcriptions internes au domaine, vous pouvez fournir jusqu' Amazon Transcribe à 200 Mo de données texte pour ajuster votre modèle. C'est ce que l'on appelle les données de réglage.**

## Données d’entraînement ou données de réglage
<a name="custom-language-models-training-tuning"></a>

L'objectif des données de formation est d'apprendre Amazon Transcribe à reconnaître de nouveaux termes et à connaître le contexte dans lequel ces termes sont utilisés. Pour créer un modèle robuste, Amazon Transcribe peut nécessiter un grand volume de données texte pertinentes. Il est fortement recommandé de fournir autant de données d’entraînement que possible, dans la limite de 2 Go.

Le but du réglage des données est d’aider à affiner et à optimiser les relations contextuelles apprises à partir de vos données d’entraînement. Les données de réglage ne sont pas nécessaires pour créer un modèle de langue personnalisé.

C’est à vous de décider de la meilleure façon de sélectionner les données d’entraînement et, éventuellement, les données de réglage. Chaque cas est unique et dépend du type et de la quantité de données dont vous disposez. Les données de réglage sont recommandées lorsque vous ne disposez pas de données d’entraînement internes au domaine.

Si vous choisissez d’inclure les deux types de données, ne superposez **pas** vos données d’entraînement et vos données de réglage ; elles doivent être uniques. Le chevauchement des données peut biaiser et fausser votre modèle de langue personnalisé, ce qui a un impact sur sa précision.

À titre indicatif, et dans la mesure du possible, nous vous recommandons d’utiliser du texte précis propre au domaine comme données d’entraînement. Voici quelques scénarios généraux, classés par ordre de préférence :
+ Si vous avez plus de 10 000 mots de texte de transcription précis dans le domaine, utilisez-les comme données d’apprentissage. Dans ce cas, il n’est pas nécessaire d’inclure des données de réglage. C’est le scénario idéal pour la formation d’un modèle de langue personnalisé.
+ Si vous disposez d’un texte de transcription précis dans le domaine contenant moins de 10 000 mots et que vous n’obtenez pas les résultats souhaités, pensez à compléter vos données d’entraînement par des textes écrits liés au domaine, tels que des rapports techniques. Dans ce cas, réservez une petite partie (10 à 25 %) de vos données de transcription internes au domaine pour les utiliser comme données de réglage.
+ Si vous n’avez aucun texte de transcription dans le domaine, téléchargez tout le texte lié à votre domaine sous forme de données d’entraînement. Dans ce cas, il est préférable d’utiliser un texte transcrit plutôt qu’un texte écrit. C’est le scénario le moins efficace pour l’entraînement d’un modèle de langue personnalisé.

Lorsque vous êtes prêt à créer votre modèle, consultez la section [Création d’un modèle de langue personnalisé](custom-language-models-create.md).

# Création d’un modèle de langue personnalisé
<a name="custom-language-models-create"></a>

Avant de créer votre modèle de langue personnalisé, vous devez effectuer les opérations suivantes  :
+ Préparez vos données. Les données doivent être enregistrées au format texte brut et ne peuvent contenir aucun caractère spécial.
+ Téléchargez vos données dans un Amazon S3 bucket. Il est recommandé de créer des dossiers distincts pour les données d’entraînement et de réglage.
+ Assurez-vous d' Amazon Transcribe avoir accès à votre Amazon S3 compartiment. Vous devez spécifier un IAM rôle doté d'autorisations d'accès pour utiliser vos données.

## Préparation de vos données
<a name="prepare-data"></a>

Vous pouvez compiler toutes vos données dans un seul fichier ou les enregistrer dans plusieurs fichiers. Notez que si vous choisissez d’inclure des données de réglage, elles doivent être enregistrées dans un fichier distinct de celui de vos données d’entraînement.

Peu importe le nombre de fichiers texte que vous utilisez pour vos données d’entraînement ou de réglage. Le téléchargement d’un fichier de 100 000 mots produit le même résultat que le téléchargement de 10 fichiers de 10 000 mots. Préparez vos données texte de la manière qui vous convient le mieux.

Assurez-vous que tous vos fichiers de données répondent aux critères suivants :
+ Ils sont tous rédigés dans la même langue que le modèle que vous souhaitez créer. Par exemple, si vous souhaitez créer un modèle de langue personnalisé qui transcrit le son en anglais américain (`en-US`), toutes vos données texte doivent être en anglais américain.
+ Ils sont au format texte brut avec encodage UTF-8.
+ Ils ne contiennent pas de caractères spéciaux ni de mise en forme, tels que des balises HTML.
+ Ils représentent un total combiné maximal de 2 Go pour les données d’entraînement et de 200 Mo pour les données de réglage.

Si l’un de ces critères n’est pas satisfait, votre modèle échoue.

## Téléchargement de vos données
<a name="upload-data"></a>

Avant de télécharger vos données, créez un nouveau dossier pour vos données d’entraînement. Si vous utilisez des données de réglage, créez un autre dossier distinct.

 URIs Pour vos seaux, cela pourrait ressembler à ceci :
+ `s3://amzn-s3-demo-bucket/my-model-training-data/`
+ `s3://amzn-s3-demo-bucket/my-model-tuning-data/`

Téléchargez vos données d’entraînement et de réglage dans les compartiments appropriés.

Vous pourrez ajouter des données supplémentaires à ces compartiments ultérieurement. Toutefois, si c’est le cas, vous devez recréer votre modèle avec les nouvelles données. Les modèles existants ne peuvent pas être mis à jour avec de nouvelles données.

## Autorisation d’accès à vos données
<a name="data-permissions"></a>

Pour créer un modèle de langage personnalisé, vous devez spécifier un IAM rôle autorisé à accéder à votre Amazon S3 bucket. Si vous ne possédez pas encore de rôle ayant accès au Amazon S3 compartiment dans lequel vous avez placé vos données d'entraînement, vous devez en créer un. Une fois que vous avez créé un rôle, vous pouvez attacher une politique pour lui accorder des autorisations. N’attachez pas de politique à un utilisateur.

Pour obtenir des exemples de politiques, consultez [Amazon Transcribe exemples de politiques basées sur l'identité](security_iam_id-based-policy-examples.md).

Pour savoir comment créer une nouvelle IAM identité, consultez [IAM Identités (utilisateurs, groupes d'utilisateurs et rôles)](https://docs.aws.amazon.com/IAM/latest/UserGuide/id.html).

Pour en savoir plus sur les politiques, consultez les sections suivantes :
+ [Stratégies et autorisations dans IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html)
+ [Création de stratégies IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create-console.html#access_policies_create-start)
+ [Gestion de l’accès pour les ressources AWS](https://docs.aws.amazon.com/IAM/latest/UserGuide/access)

## Création de votre modèle de langue personnalisé
<a name="create-custom-language-model"></a>

Lorsque vous créez votre modèle de langue personnalisé, vous devez choisir un modèle de base. Il existe deux options de modèle de base :
+ `NarrowBand` : utilisez cette option pour l’audio dont la fréquence d’échantillonnage est inférieure à 16 000 Hz. Ce type de modèle est généralement utilisé pour les conversations téléphoniques enregistrées à 8 000 Hz.
+ `WideBand` : utilisez cette option pour l’audio dont la fréquence d’échantillonnage est supérieure ou égale à 16 000 Hz.

Vous pouvez créer des modèles de langage personnalisés à l'aide du AWS Management Console AWS CLI, ou AWS SDKs. ; consultez les exemples suivants :

### AWS Management Console
<a name="model-create-console"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Modèle de langue personnalisé**. La page **Modèles de langue personnalisés** s’ouvre et vous permet de consulter les modèles de langue personnalisés existants ou d’en entraîner un nouveau.

1. Pour entraîner un nouveau modèle, sélectionnez **Entraîner un modèle**.  
![\[Amazon Transcribe capture d'écran de la console : la page « modèles linguistiques personnalisés ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/clm-create-console.png)

   Vous accédez alors à la page **Entraîner un modèle**. Ajoutez un nom, spécifiez la langue et choisissez le modèle de base que vous souhaitez pour votre modèle. Ajoutez ensuite le chemin pour votre entraînement et éventuellement vos données de réglage. Vous devez inclure un IAM rôle autorisé à accéder à vos données.  
![\[Amazon Transcribe capture d'écran de la console : la page « modèles de train ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/clm-train-console.png)

1. Une fois que vous avez rempli tous les champs, sélectionnez **Entraîner un modèle** en bas de la page.

### AWS CLI
<a name="model-create-cli"></a>

Cet exemple utilise la [create-language-model](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/create-language-model.html)commande. Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateLanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateLanguageModel.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageModel.html).

```
aws transcribe create-language-model \ 
--base-model-name NarrowBand \ 
--model-name my-first-language-model \ 
--input-data-config S3Uri=s3://amzn-s3-demo-bucket/my-clm-training-data/,TuningDataS3Uri=s3://amzn-s3-demo-bucket/my-clm-tuning-data/,DataAccessRoleArn=arn:aws:iam::111122223333:role/ExampleRole \
--language-code en-US
```

Voici un autre exemple d'utilisation de la [create-language-model](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et d'un corps de requête qui crée votre modèle de langage personnalisé.

```
aws transcribe create-language-model \
--cli-input-json file://filepath/my-first-language-model.json
```

Le fichier *my-first-language-model.json* contient le corps de requête suivant.

```
{
  "BaseModelName": "NarrowBand",
  "ModelName": "my-first-language-model",
  "InputDataConfig": {
         "S3Uri": "s3://amzn-s3-demo-bucket/my-clm-training-data/",
         "TuningDataS3Uri"="s3://amzn-s3-demo-bucket/my-clm-tuning-data/",
         "DataAccessRoleArn": "arn:aws:iam::111122223333:role/ExampleRole"
    },
  "LanguageCode": "en-US"  
}
```

### AWS SDK pour Python (Boto3)
<a name="model-create-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour créer un CLM à l'aide de la méthode [create\$1language\$1model](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_language_model). Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateLanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateLanguageModel.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageModel.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
model_name = 'my-first-language-model',
transcribe.create_language_model(
    LanguageCode = 'en-US', 
    BaseModelName = 'NarrowBand',
    ModelName = model_name,
    InputDataConfig = {
        'S3Uri':'s3://amzn-s3-demo-bucket/my-clm-training-data/',
        'TuningDataS3Uri':'s3://amzn-s3-demo-bucket/my-clm-tuning-data/',
        'DataAccessRoleArn':'arn:aws:iam::111122223333:role/ExampleRole'
    }
)

while True:
    status = transcribe.get_language_model(ModelName = model_name)
    if status['LanguageModel']['ModelStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## Mise à jour de votre modèle de langue personnalisé
<a name="update-custom-language-model"></a>

Amazon Transcribe met continuellement à jour les modèles de base disponibles pour les modèles linguistiques personnalisés. Pour bénéficier de ces mises à jour, nous vous recommandons d’entraîner de nouveaux modèles de langue personnalisés tous les 6 à 12 mois.

Pour savoir si votre modèle de langage personnalisé utilise le dernier modèle de base, exécutez une [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DescribeLanguageModel.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DescribeLanguageModel.html)demande à l'aide du SDK AWS CLI ou d'un AWS SDK, puis recherchez le `UpgradeAvailability` champ dans votre réponse.

Si `UpgradeAvailability` a la valeur `true`, votre modèle n’exécute pas la dernière version du modèle de base. Pour utiliser le dernier modèle de base dans un modèle de langue personnalisé, vous devez créer un nouveau modèle de langue personnalisé. Les modèles de langue personnalisés ne peuvent pas être mis à niveau.

# Utilisation d’un modèle de langue personnalisé
<a name="custom-language-models-using"></a>

Une fois que vous avez créé votre modèle de langue personnalisé, vous pouvez l’inclure dans vos demandes de transcription. Consultez les sections suivantes pour des exemples.

La langue du modèle que vous incluez dans votre demande doit correspondre au code de langue que vous spécifiez pour votre fichier multimédia. Si les langues ne correspondent pas, votre modèle de langue personnalisé n’est pas appliqué à votre transcription et il n’y a aucun avertissement ni erreur.

## Utilisation d’un modèle de langue personnalisé dans une transcription par lots
<a name="custom-language-models-using-batch"></a>

Pour utiliser un modèle de langue personnalisé avec une transcription par lots, consultez les exemples suivants :

### AWS Management Console
<a name="model-console-batch"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Tâches de transcription**, puis sélectionnez **Créer une tâche** (en haut à droite). La page **Spécifier les détails de la tâche** s’ouvre.

1. Dans le volet **Paramètres de la tâche**, sous **Type de modèle**, sélectionnez la case **Modèle de langue personnalisé**.  
![\[Amazon Transcribe capture d'écran de la console : la page « paramètres du travail ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/clm-console.png)

   Vous devez également sélectionner une langue d’entrée dans le menu déroulant.  
![\[Amazon Transcribe capture d'écran de la console : la page « paramètres du travail » affichant le menu déroulant des langues.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/clm-console-language.png)

1. Sous **Sélection du modèle personnalisé**, sélectionnez un modèle de langue personnalisé existant dans le menu déroulant ou **Créer nouveau**.

   Ajoutez l' Amazon S3 emplacement de votre fichier d'entrée dans le panneau **Données d'entrée**.

1. Sélectionnez **Suivant** pour accéder à des options de configuration supplémentaires.

   Sélectionnez **Créer une tâche** pour exécuter votre tâche de transcription.

### AWS CLI
<a name="model-using-cli"></a>

Cet exemple utilise la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et le `ModelSettings` paramètre avec le `VocabularyName` sous-paramètre. Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ModelSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ModelSettings.html).

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--model-settings LanguageModelName=my-first-language-model
```

Voici un autre exemple d'utilisation de la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et d'un corps de requête qui inclut votre modèle de langage personnalisé avec cette tâche.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-model-job.json
```

Le fichier *my-first-model-job.json* contient le corps de requête suivant.

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "ModelSettings": {
        "LanguageModelName": "my-first-language-model"
   }
}
```

### AWS SDK pour Python (Boto3)
<a name="model-using-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour inclure un modèle de langage personnalisé utilisant l'`ModelSettings`argument de la méthode [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ModelSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ModelSettings.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    ModelSettings = {
        'LanguageModelName': 'my-first-language-model' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## Utilisation d’un modèle de langue personnalisé dans une transcription en streaming
<a name="custom-language-models-using-stream"></a>

Pour utiliser un modèle de langue personnalisé avec une transcription en streaming, consultez les exemples suivants :

### AWS Management Console
<a name="model-console-stream"></a>

1. Connectez-vous au [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le panneau de navigation, choisissez **Transcription en temps réel**. Faites défiler jusqu’à **Personnalisations** et développez ce champ s’il est réduit.  
![\[Amazon Transcribe capture d'écran de la console : la page « transcription en temps réel ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/stream-main.png)

1. Activez **Modèle de langue personnalisé** et sélectionnez un modèle dans le menu déroulant.  
![\[Amazon Transcribe capture d'écran de la console : le panneau de « personnalisations » étendu.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/model-stream2.png)

   Incluez les autres paramètres que vous souhaitez appliquer à votre flux.

1. Vous êtes prêt à transcrire votre flux. Sélectionnez **Démarrer le streaming** et commencez à parler. Pour mettre fin à votre dictée, sélectionnez **Arrêter le streaming**.

### Flux HTTP/2
<a name="model-using-http2"></a>

Cet exemple crée une requête HTTP/2 qui inclut votre modèle de langue personnalisé. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultez[Configuration d’un flux HTTP/2](streaming-setting-up.md#streaming-http2). Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-language-model-name: my-first-language-model
transfer-encoding: chunked
```

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

### WebSocket flux
<a name="model-using-websocket"></a>

Cet exemple crée une URL présignée qui applique votre modèle de langage personnalisé à un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultez[Configuration d'un WebSocket stream](streaming-setting-up.md#streaming-websocket). Pour plus de détails sur les paramètres, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&language-model-name=my-first-language-model
```

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).