Add header



Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Étiquetage de texte avec Ground Truth
<a name="sms-label-text"></a>

Utilisez Ground Truth pour étiqueter du texte. Ground Truth prend en charge l’étiquetage du texte pour la reconnaissance d’entités nommées, la classification de texte à étiquette unique et la classification de texte à étiquettes multiples. Les rubriques suivantes vous permettront d’en savoir plus sur ces types de tâches intégrées, ainsi que sur les instructions destinées à vous aider à créer une tâche d’étiquetage à l’aide de ce type de tâche.

**Astuce**  
Pour en savoir plus sur les types de fichiers pris en charge et les quotas de données d’entrée, consultez [Données d’entrée](sms-data-input.md).

**Topics**
+ [

# Extraction d’informations textuelles en utilisant la reconnaissance des entités nommées
](sms-named-entity-recg.md)
+ [

# Catégorisation de texte à l’aide de la classification de texte (à étiquette unique)
](sms-text-classification.md)
+ [

# Catégorisation de texte à l’aide de la classification de texte (à plusieurs étiquettes)
](sms-text-classification-multilabel.md)

# Extraction d’informations textuelles en utilisant la reconnaissance des entités nommées
<a name="sms-named-entity-recg"></a>

Pour extraire des informations d'un texte non structuré et le classer dans des catégories prédéfinies, utilisez une tâche d'étiquetage Amazon SageMaker Ground Truth nommée Entity Recognition (NER). Traditionnellement, la reconnaissance NER consiste à filtrer les données textuelles pour localiser les expressions nominatives, appelées *entités nommées* et à catégoriser chacune avec une étiquette, telle que « personne », « organisation » ou « marque ». Vous pouvez élargir cette tâche pour étiqueter des étendues de texte plus longues et catégoriser ces séquences avec des étiquettes prédéfinies que vous spécifiez. Vous pouvez créer une tâche d'étiquetage par reconnaissance d'entités nommées à l'aide de la section Ground Truth de la console Amazon SageMaker AI ou de l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)opération.

Lorsqu’ils sont chargés d’une tâche d’étiquetage de reconnaissance d’entité nommée, les employés appliquent vos étiquettes à des mots ou expressions spécifiques au sein d’un bloc de texte plus grand. Ils choisissent une étiquette, puis l’appliquent à l’aide du curseur pour mettre en surbrillance la partie du texte à laquelle l’étiquette s’applique. L’outil de reconnaissance des entités nommées Ground Truth prend en charge les annotations qui se chevauchent, la sélection d’étiquettes en contexte et la sélection de plusieurs étiquettes pour une seule mise en évidence. En outre, les employés peuvent utiliser leurs claviers pour sélectionner rapidement des étiquettes.

**Important**  
Si vous créez manuellement un fichier manifeste source, utilisez `"source"` pour identifier le texte à étiqueter. Pour de plus amples informations, veuillez consulter [Données d’entrée](sms-data-input.md).

## Créer une tâche d’étiquetage de reconnaissance d’entité nommée (Console)
<a name="sms-creating-ner-console"></a>

Vous pouvez suivre les instructions [Création d’une tâche d’étiquetage (Console)](sms-create-labeling-job-console.md) pour savoir comment créer une tâche d'étiquetage de reconnaissance d'entités nommées dans la console SageMaker AI. À l’étape 10, choisissez **Texte** dans le menu déroulant **Catégorie de tâche** puis choisissez **Reconnaissance d’entité nommée ** comme type de tâche. 

Ground Truth fournit une interface utilisateur employé similaire à la suivante pour l’étiquetage des tâches. Lorsque vous créez la tâche d’étiquetage avec la console, vous spécifiez des instructions pour aider les collaborateurs à terminer la tâche et des étiquettes parmi lesquelles ceux-ci peuvent faire leur choix. 

![\[Gif montrant comment créer une tâche d'étiquetage de reconnaissance d'entités nommées dans la console SageMaker AI.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/sms/gifs/nertool.gif)


## Créer une tâche d’étiquetage de reconnaissance d’entité nommée (API)
<a name="sms-creating-ner-api"></a>

Pour créer une tâche d'étiquetage par reconnaissance d'entités nommées, à l'aide de l'opération SageMaker API`CreateLabelingJob`. Cette API définit cette opération pour tous AWS SDKs. Pour consulter la liste des langues spécifiques prises SDKs en charge pour cette opération, consultez la section **Voir aussi** de. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)

Suivez les instructions présentées dans [Création d’une tâche d’étiquetage (API)](sms-create-labeling-job-api.md) et procédez comme suit pour configurer votre demande :
+ Les fonctions Lambda de pré-annotation pour ce type de tâche se terminent par `PRE-NamedEntityRecognition`. Pour trouver l'ARN Lambda préalable à l'annotation pour votre région [PreHumanTaskLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_HumanTaskConfig.html#SageMaker-Type-HumanTaskConfig-PreHumanTaskLambdaArn), consultez. 
+ Les fonctions Lambda de consolidation des annotations pour ce type de tâche se terminent par `ACS-NamedEntityRecognition`. Pour trouver l'ARN Lambda de consolidation des annotations pour votre région, consultez. [AnnotationConsolidationLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_AnnotationConsolidationConfig.html#SageMaker-Type-AnnotationConsolidationConfig-AnnotationConsolidationLambdaArn) 
+ Vous devez fournir l’ARN suivant pour `[HumanTaskUiArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UiConfig.html#sagemaker-Type-UiConfig-HumanTaskUiArn)` :

  ```
  arn:aws:sagemaker:aws-region:394669845002:human-task-ui/NamedEntityRecognition
  ```

  Remplacez `aws-region` par la région AWS que vous utilisez pour créer la tâche d’étiquetage. Par exemple, utilisez `us-west-1` si vous créez une tâche d’étiquetage dans la région USA Ouest (Californie du Nord). 
+ Fournissez des instructions de travail dans le fichier de configuration de catégorie d’étiquettes à l’aide du paramètre `instructions`. Vous pouvez utiliser une chaîne ou un langage de balisage HTML dans les champs `shortInstruction` et `fullInstruction`. Pour en savoir plus, consultez [Fournir des instructions aux employés dans un fichier de configuration de catégorie d’étiquette](#worker-instructions-ner).

  ```
  "instructions": {"shortInstruction":"<h1>Add header</h1><p>Add Instructions</p>", "fullInstruction":"<p>Add additional instructions.</p>"}
  ```

Voici un exemple de [requête du kit SDK AWS Python (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_labeling_job) pour créer une tâche d’étiquetage dans la région USA Est (Virginie du Nord). Tous les paramètres en rouge doivent être remplacés par vos spécifications et ressources. 

```
response = client.create_labeling_job(
    LabelingJobName='example-ner-labeling-job',
    LabelAttributeName='label',
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json'
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent',
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': 's3://bucket/path/file-to-store-output-data',
        'KmsKeyId': 'string'
    },
    RoleArn='arn:aws:iam::*:role/*',
    LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json',
    StoppingConditions={
        'MaxHumanLabeledObjectCount': 123,
        'MaxPercentageOfInputDatasetLabeled': 123
    },
    HumanTaskConfig={
        'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*',
        'UiConfig': {
            'HumanTaskUiArn': 'arn:aws:sagemaker:us-east-1:394669845002:human-task-ui/NamedEntityRecognition'
        },
        'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-NamedEntityRecognition',
        'TaskKeywords': [
            'Named entity Recognition',
        ],
        'TaskTitle': 'Named entity Recognition task',
        'TaskDescription': 'Apply the labels provided to specific words or phrases within the larger text block.',
        'NumberOfHumanWorkersPerDataObject': 1,
        'TaskTimeLimitInSeconds': 28800,
        'TaskAvailabilityLifetimeInSeconds': 864000,
        'MaxConcurrentTaskCount': 1000,
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-NamedEntityRecognition'
        },
    Tags=[
        {
            'Key': 'string',
            'Value': 'string'
        },
    ]
)
```

### Fournir des instructions aux employés dans un fichier de configuration de catégorie d’étiquette
<a name="worker-instructions-ner"></a>

Vous devez fournir des instructions aux employés dans le fichier de configuration de catégorie d’étiquette que vous identifiez avec le paramètre `LabelCategoryConfigS3Uri` dans `CreateLabelingJob`. Vous pouvez utiliser ces instructions pour fournir des détails sur la tâche que vous souhaitez que les employés effectuent et les aider à utiliser l’outil efficacement.

Fournissez des instructions courtes et longues en utilisant `shortInstruction` et `fullInstruction` dans le paramètre `instructions`, respectivement. Pour en savoir plus sur ces types d’instruction, consultez [Création de pages d’instructions](sms-creating-instruction-pages.md).

Voici un exemple de fichier de configuration de catégorie d’étiquettes avec des instructions pouvant être utilisées pour une tâche d’étiquetage de reconnaissance des entités nommées.

```
{
  "document-version": "2018-11-28",
  "labels": [
    {
      "label": "label1",
      "shortDisplayName": "L1"
    },
    {
      "label": "label2",
      "shortDisplayName": "L2"
    },
    {
      "label": "label3",
      "shortDisplayName": "L3"
    },
    {
      "label": "label4",
      "shortDisplayName": "L4"
    },
    {
      "label": "label5",
      "shortDisplayName": "L5"
    }
  ],
  "instructions": {
    "shortInstruction": "<p>Enter description of the labels that workers have 
                        to choose from</p><br><p>Add examples to help workers understand the label</p>",
    "fullInstruction": "<ol>
                        <li><strong>Read</strong> the text carefully.</li>
                        <li><strong>Highlight</strong> words, phrases, or sections of the text.</li>
                        <li><strong>Choose</strong> the label that best matches what you have highlighted.</li>
                        <li>To <strong>change</strong> a label, choose highlighted text and select a new label.</li>
                        <li>To <strong>remove</strong> a label from highlighted text, choose the X next to the 
                        abbreviated label name on the highlighted text.</li>
                        <li>You can select all of a previously highlighted text, but not a portion of it.</li>
                        </ol>"
  }
}
```

## Données de sortie de reconnaissance d’entité nommée
<a name="sms-ner-output-data"></a>

Une fois que vous avez créé une tâche d’étiquetage de reconnaissance des entités nommées, vos données de sortie seront situées dans le compartiment Amazon S3 spécifié dans le paramètre `S3OutputPath` lorsque vous utilisez l’API ou dans le champ **Output dataset location (Emplacement du jeu de données de sortie)** de la section **Job overview (Présentation de la tâche)** de la console. 

Pour en savoir plus sur le fichier manifeste de sortie généré par Ground Truth et sur la structure de fichier que ce dernier utilise pour stocker vos données de sortie, consultez [Étiquetage des données de sortie des tâches](sms-data-output.md). 

# Catégorisation de texte à l’aide de la classification de texte (à étiquette unique)
<a name="sms-text-classification"></a>

Pour catégoriser les articles et le texte en catégories prédéfinies, utilisez la classification de texte. Par exemple, vous pouvez utiliser la classification de texte pour identifier le sentiment exprimé dans une révision ou l’émotion sous-jacente à une section de texte. Utilisez la classification de texte Amazon SageMaker Ground Truth pour que les employés trient le texte dans les catégories que vous définissez. Vous créez une tâche d'étiquetage de classification de texte à l'aide de la section Ground Truth de la console Amazon SageMaker AI ou de l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)opération. 

**Important**  
Si vous créez manuellement un fichier manifeste source, utilisez `"source"` pour identifier le texte à étiqueter. Pour de plus amples informations, veuillez consulter [Données d’entrée](sms-data-input.md).

## Créer une tâche d’étiquetage de classification de texte (Console)
<a name="sms-creating-text-classification-console"></a>

Vous pouvez suivre les instructions [Création d’une tâche d’étiquetage (Console)](sms-create-labeling-job-console.md) pour savoir comment créer une tâche d'étiquetage de classification de texte dans la console SageMaker AI. À l’étape 10, choisissez **Texte** dans le menu déroulant **Catégorie de tâches** et choisissez **Classification de texte (une étiquette)** comme type de tâche. 

Ground Truth fournit une interface utilisateur employé similaire à la suivante pour l’étiquetage des tâches. Lorsque vous créez la tâche d’étiquetage avec la console, vous spécifiez des instructions pour aider les collaborateurs à terminer la tâche et des étiquettes parmi lesquelles ceux-ci peuvent faire leur choix. 

![\[Gif montrant comment créer une tâche d'étiquetage de classification de texte dans la console SageMaker AI.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/sms/gifs/single-label-text.gif)


## Créer une tâche d’étiquetage de classification de texte (API)
<a name="sms-creating-text-classification-api"></a>

Pour créer une tâche d'étiquetage de classification de texte, utilisez l'opération SageMaker API`CreateLabelingJob`. Cette API définit cette opération pour tous AWS SDKs. Pour consulter la liste des langues spécifiques prises SDKs en charge pour cette opération, consultez la section **Voir aussi** de. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)

Suivez les instructions présentées dans [Création d’une tâche d’étiquetage (API)](sms-create-labeling-job-api.md) et procédez comme suit pour configurer votre demande : 
+ Les fonctions Lambda de pré-annotation pour ce type de tâche se terminent par `PRE-TextMultiClass`. Pour trouver l'ARN Lambda préalable à l'annotation pour votre région [PreHumanTaskLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_HumanTaskConfig.html#SageMaker-Type-HumanTaskConfig-PreHumanTaskLambdaArn), consultez. 
+ Les fonctions Lambda de consolidation des annotations pour ce type de tâche se terminent par `ACS-TextMultiClass`. Pour trouver l'ARN Lambda de consolidation des annotations pour votre région, consultez. [AnnotationConsolidationLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_AnnotationConsolidationConfig.html#SageMaker-Type-AnnotationConsolidationConfig-AnnotationConsolidationLambdaArn) 

Voici un exemple de [requête du kit SDK AWS Python (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_labeling_job) pour créer une tâche d’étiquetage dans la région USA Est (Virginie du Nord). Tous les paramètres en rouge doivent être remplacés par vos spécifications et ressources. 

```
response = client.create_labeling_job(
    LabelingJobName='example-text-classification-labeling-job,
    LabelAttributeName='label',
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json'
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent',
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': 's3://bucket/path/file-to-store-output-data',
        'KmsKeyId': 'string'
    },
    RoleArn='arn:aws:iam::*:role/*,
    LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json',
    StoppingConditions={
        'MaxHumanLabeledObjectCount': 123,
        'MaxPercentageOfInputDatasetLabeled': 123
    },
    HumanTaskConfig={
        'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*',
        'UiConfig': {
            'UiTemplateS3Uri': 's3://bucket/path/worker-task-template.html'
        },
        'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-TextMultiClass,
        'TaskKeywords': [
            Text classification',
        ],
        'TaskTitle': Text classification task',
        'TaskDescription': 'Carefully read and classify this text using the categories provided.',
        'NumberOfHumanWorkersPerDataObject': 123,
        'TaskTimeLimitInSeconds': 123,
        'TaskAvailabilityLifetimeInSeconds': 123,
        'MaxConcurrentTaskCount': 123,
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-TextMultiClass'
        },
    Tags=[
        {
            'Key': 'string',
            'Value': 'string'
        },
    ]
)
```

### Fournir un modèle pour les tâches d’étiquetage de classification de texte
<a name="worker-template-text-classification"></a>

Si vous créez une tâche d’étiquetage à l’aide de l’API, vous devez fournir un modèle de tâche d’employé dans `UiTemplateS3Uri`. Copiez et modifiez le modèle suivant. Modifiez uniquement [https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-quick-instructions](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-quick-instructions), [https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-full-instructions](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-full-instructions), et `header`. 

Téléchargez ce modèle vers S3 et fournissez l’URI S3 pour ce fichier dans `UiTemplateS3Uri`.

```
<script src="https://assets.crowd.aws/crowd-html-elements.js"></script>
<crowd-form>
  <crowd-classifier
    name="crowd-classifier"
    categories="{{ task.input.labels | to_json | escape }}"
    header="classify text"
  >
    <classification-target style="white-space: pre-wrap">
      {{ task.input.taskObject }}
    </classification-target>
    <full-instructions header="Classifier instructions">
      <ol><li><strong>Read</strong> the text carefully.</li>
      <li><strong>Read</strong> the examples to understand more about the options.</li>
      <li><strong>Choose</strong> the appropriate labels that best suit the text.</li></ol>
    </full-instructions>
    <short-instructions>
      <p>Enter description of the labels that workers have to choose from</p>
      <p><br></p><p><br></p><p>Add examples to help workers understand the label</p>
      <p><br></p><p><br></p><p><br></p><p><br></p><p><br></p>
    </short-instructions>
  </crowd-classifier>
  </crowd-form>
```

## Données de sortie de classification de texte
<a name="sms-text-classification-output-data"></a>

Une fois que vous avez créé une tâche d’étiquetage de classification de texte, vos données de sortie seront situées dans le compartiment Amazon S3 spécifié dans le paramètre `S3OutputPath` lorsque vous utilisez l’API ou dans le champ **Output dataset location (Emplacement du jeu de données de sortie)** de la section **Job overview (Présentation de la tâche)** de la console. 

Pour en savoir plus sur le fichier manifeste de sortie généré par Ground Truth et sur la structure de fichier que ce dernier utilise pour stocker vos données de sortie, consultez [Étiquetage des données de sortie des tâches](sms-data-output.md). 

Pour accéder à un exemple de fichier manifeste en sortie pour la tâche d’étiquetage de classification de texte, consultez [Sortie de la tâche de classification](sms-data-output.md#sms-output-class).

# Catégorisation de texte à l’aide de la classification de texte (à plusieurs étiquettes)
<a name="sms-text-classification-multilabel"></a>

Pour classer les articles et le texte en plusieurs catégories prédéfinies, utilisez le type de tâche de classification de texte à plusieurs étiquettes. Par exemple, vous pouvez utiliser ce type de tâche pour identifier plusieurs émotions véhiculées dans un texte. Les sections suivantes fournissent des informations sur la création d’une tâche de classification de texte à plusieurs étiquettes à partir de la console et de l’API.

Lorsque vous travaillez sur une tâche de classification de texte à plusieurs étiquettes, les collaborateurs doivent choisir toutes les étiquettes applicables, et doivent en choisir au moins une. Lorsque vous créez une tâche à l’aide de ce type de tâche, vous pouvez fournir jusqu’à 50 catégories d’étiquettes. 

Amazon SageMaker Ground Truth ne fournit pas de catégorie « aucun » lorsqu'aucune des étiquettes ne s'applique. Pour fournir cette option aux collaborateurs, incluez une étiquette similaire à « aucune » ou « autre » lorsque vous créez une tâche de classification de texte à plusieurs étiquettes. 

Pour imposer aux collaborateurs de choisir une seule étiquette pour chaque sélection de document ou de texte, utilisez le type de tâche [Catégorisation de texte à l’aide de la classification de texte (à étiquette unique)](sms-text-classification.md). 

**Important**  
Si vous créez manuellement un fichier manifeste source, utilisez `"source"` pour identifier le texte à étiqueter. Pour de plus amples informations, veuillez consulter [Données d’entrée](sms-data-input.md).

## Création d’une tâche d’étiquetage de classification de texte à plusieurs étiquettes (console)
<a name="sms-creating-multilabel-text-classification-console"></a>

Vous pouvez suivre les instructions [Création d’une tâche d’étiquetage (Console)](sms-create-labeling-job-console.md) pour apprendre à créer une tâche d'étiquetage de classification de texte à étiquettes multiples dans la console Amazon SageMaker AI. À l’étape 10, choisissez **Texte** dans le menu déroulant **Catégorie de tâches**, puis **Classification du texte (plusieurs étiquettes)** comme type de tâche. 

Ground Truth fournit une interface utilisateur employé similaire à la suivante pour l’étiquetage des tâches. Lorsque vous créez la tâche d’étiquetage avec la console, vous spécifiez des instructions pour aider les collaborateurs à terminer la tâche et des étiquettes parmi lesquelles ceux-ci peuvent faire leur choix. 

![\[Gif montrant comment créer une tâche d'étiquetage de classification de texte multi-étiquettes dans la console Amazon SageMaker AI.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/sms/gifs/multi-label-text.gif)


## Création d’une tâche d’étiquetage de classification de texte à plusieurs étiquettes (API)
<a name="sms-creating-multilabel-text-classification-api"></a>

Pour créer une tâche d'étiquetage de classification de texte à étiquettes multiples, utilisez l'opération SageMaker `CreateLabelingJob` API. Cette API définit cette opération pour tous AWS SDKs. Pour consulter la liste des langues spécifiques prises SDKs en charge pour cette opération, consultez la section **Voir aussi** de. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)

Suivez les instructions présentées dans [Création d’une tâche d’étiquetage (API)](sms-create-labeling-job-api.md) et procédez comme suit pour configurer votre demande : 
+ Les fonctions Lambda de pré-annotation pour ce type de tâche se terminent par `PRE-TextMultiClassMultiLabel`. Pour trouver l'ARN Lambda préalable à l'annotation pour votre région [PreHumanTaskLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_HumanTaskConfig.html#SageMaker-Type-HumanTaskConfig-PreHumanTaskLambdaArn), consultez. 
+ Les fonctions Lambda de consolidation des annotations pour ce type de tâche se terminent par `ACS-TextMultiClassMultiLabel`. Pour trouver l'ARN Lambda de consolidation des annotations pour votre région, consultez. [AnnotationConsolidationLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_AnnotationConsolidationConfig.html#SageMaker-Type-AnnotationConsolidationConfig-AnnotationConsolidationLambdaArn) 

Voici un exemple de [requête du kit SDK AWS Python (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_labeling_job) pour créer une tâche d’étiquetage dans la région USA Est (Virginie du Nord). Tous les paramètres en rouge doivent être remplacés par vos spécifications et ressources. 

```
response = client.create_labeling_job(
    LabelingJobName='example-multi-label-text-classification-labeling-job,
    LabelAttributeName='label',
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json'
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent',
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': 's3://bucket/path/file-to-store-output-data',
        'KmsKeyId': 'string'
    },
    RoleArn='arn:aws:iam::*:role/*,
    LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json',
    StoppingConditions={
        'MaxHumanLabeledObjectCount': 123,
        'MaxPercentageOfInputDatasetLabeled': 123
    },
    HumanTaskConfig={
        'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*',
        'UiConfig': {
            'UiTemplateS3Uri': 's3://bucket/path/custom-worker-task-template.html'
        },
        'PreHumanTaskLambdaArn': 'arn:aws:lambda::function:PRE-TextMultiClassMultiLabel,
        'TaskKeywords': [
            'Text Classification',
        ],
        'TaskTitle': 'Multi-label text classification task',
        'TaskDescription': 'Select all labels that apply to the text shown',
        'NumberOfHumanWorkersPerDataObject': 123,
        'TaskTimeLimitInSeconds': 123,
        'TaskAvailabilityLifetimeInSeconds': 123,
        'MaxConcurrentTaskCount': 123,
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-TextMultiClassMultiLabel'
        },
    Tags=[
        {
            'Key': 'string',
            'Value': 'string'
        },
    ]
)
```

### Création d’un modèle personnalisé pour la classification de texte à plusieurs étiquettes
<a name="custom-template-multi-label-text-classification"></a>

Si vous créez une tâche d’étiquetage à l’aide de l’API, vous devez fournir un modèle de tâche d’employé dans `UiTemplateS3Uri`. Copiez et modifiez le modèle suivant. Modifiez uniquement [https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-quick-instructions](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-quick-instructions), [https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-full-instructions](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-full-instructions), et `header`. 

Téléchargez ce modèle vers S3 et fournissez l’URI S3 pour ce fichier dans `UiTemplateS3Uri`.

```
<script src="https://assets.crowd.aws/crowd-html-elements.js"></script>
<crowd-form>
  <crowd-classifier-multi-select
    name="crowd-classifier-multi-select"
    categories="{{ task.input.labels | to_json | escape }}"
    header="Please identify all classes in the below text"
  >
    <classification-target style="white-space: pre-wrap">
      {{ task.input.taskObject }}
    </classification-target>
    <full-instructions header="Classifier instructions">
      <ol><li><strong>Read</strong> the text carefully.</li>
      <li><strong>Read</strong> the examples to understand more about the options.</li>
      <li><strong>Choose</strong> the appropriate labels that best suit the text.</li></ol>
    </full-instructions>
    <short-instructions>
      <p>Enter description of the labels that workers have to choose from</p>
      <p><br></p>
      <p><br></p><p>Add examples to help workers understand the label</p>
      <p><br></p><p><br></p><p><br></p><p><br></p><p><br></p>
    </short-instructions>
  </crowd-classifier-multi-select>
  </crowd-form>
```

Pour savoir comment créer un modèle personnalisé, consultez [Flux de travail d’étiquetage personnalisés](sms-custom-templates.md). 

## Données de sortie de classification de texte à plusieurs étiquettes
<a name="sms-text-classification-multi-select-output-data"></a>

Une fois que vous avez créé une tâche d’étiquetage de classification de texte à plusieurs étiquettes, vos données de sortie seront situées dans le compartiment Amazon S3 spécifié dans le paramètre `S3OutputPath` lorsque vous utilisez l’API ou dans le champ **Output dataset location (Emplacement du jeu de données de sortie)** de la section **Job overview (Présentation de la tâche)** de la console. 

Pour en savoir plus sur le fichier manifeste de sortie généré par Ground Truth et sur la structure de fichier que ce dernier utilise pour stocker vos données de sortie, consultez [Étiquetage des données de sortie des tâches](sms-data-output.md). 

Pour accéder à un exemple de fichiers manifestes en sortie pour la tâche d’étiquetage de classification de texte à plusieurs étiquettes, consultez [Sortie d’une tâche de classification à plusieurs étiquettes](sms-data-output.md#sms-output-multi-label-classification).