

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Effectuer des prédictions pour les données de document
<a name="canvas-ready-to-use-predict-document"></a>

Les procédures suivantes expliquent comment effectuer des prédictions uniques ou par lots pour les jeux de données de document. Chaque Ready-to-use modèle prend en charge à la fois les **prédictions simples** et les **prédictions par lots** pour votre ensemble de données. Une **prédiction unique** est lorsque vous n'avez besoin d'effectuer qu'une seule prédiction. Par exemple, vous avez une image dont vous souhaitez extraire du texte ou un paragraphe de texte dont vous souhaitez détecter la langue dominante. Une **prédiction par lots** est lorsque vous souhaitez effectuer des prédictions pour un jeu de données complet. Par exemple, vous pouvez disposer d’un fichier CSV d’avis clients pour lequel vous souhaitez analyser le sentiment des clients, ou vous pouvez avoir des fichiers images dans lesquels vous souhaitez détecter des objets.

Vous pouvez utiliser ces procédures pour les types de Ready-to-use modèles suivants : analyse des dépenses, analyse des documents d'identité et analyse des documents.

**Note**  
Pour les requêtes sur les documents, seules les prédictions uniques sont actuellement prises en charge.

## Prédictions uniques
<a name="canvas-ready-to-use-predict-document-single"></a>

Pour effectuer une prédiction unique pour les Ready-to-use modèles qui acceptent des données de document, procédez comme suit :

1. Dans le volet de navigation de gauche de l'application Canvas, sélectionnez **R eady-to-use models**.

1. Sur la page **Ready-to-use des modèles**, choisissez le Ready-to-use modèle correspondant à votre cas d'utilisation. Pour les données de document, il doit s'agir de l'un des modèles suivants : **Analyse des dépenses**, **Analyse des documents d'identité** ou **Analyse de documents**.

1. Sur la page **Exécuter les prédictions** pour le Ready-to-use modèle que vous avez choisi, sélectionnez **Prédiction unique**.

1. Si votre Ready-to-use modèle est une analyse de documents d'identité ou une analyse de documents, effectuez les actions suivantes. Si vous effectuez une analyse des dépenses ou des requêtes sur des documents, ignorez cette étape et passez à l'étape 5 ou à l'étape 6, respectivement.

   1. Choisissez **Charger un document**.

   1. Vous êtes invité à charger un fichier PDF, JPG ou PNG à partir de votre ordinateur local. Sélectionnez le document à partir de vos fichiers locaux. Les résultats de la prédiction sont générés.

1. Si votre Ready-to-use modèle est une analyse des dépenses, procédez comme suit :

   1. Choisissez **Charger une facture ou un reçu**.

   1. Vous êtes invité à charger un fichier PDF, JPG, PNG ou TIFF à partir de votre ordinateur local. Sélectionnez le document à partir de vos fichiers locaux. Les résultats de la prédiction sont générés.

1. Si votre Ready-to-use modèle est basé sur des requêtes de documents, procédez comme suit :

   1. Choisissez **Charger un document**.

   1. Vous êtes invité à charger un fichier PDF à partir de votre ordinateur local. Sélectionnez le document à partir de vos fichiers locaux. Votre PDF doit comporter entre 1 et 100 pages.
**Note**  
Si vous résidez dans les régions Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) ou Europe (Francfort), la taille maximale du PDF pour les requêtes sur les documents est de 20 pages.

   1. Dans le volet droit, entrez des requêtes pour rechercher des informations dans le document. Le nombre de caractères que peut contenir une requête unique est compris entre 1 et 200. Vous pouvez ajouter jusqu'à 15 requêtes à la fois.

   1. Choisissez **Soumettre des requêtes**. Les résultats sont générés avec les réponses à vos requêtes. Vous êtes facturé une fois pour chaque requête que vous soumettez.

Dans le volet droit **Résultats de prédiction**, vous recevez une analyse de votre document.

Les informations suivantes décrivent les résultats pour chaque type de solution :
+ Pour l'analyse des dépenses, les résultats sont classés dans **Champs récapitulatifs**, qui incluent des champs tels que le total indiqué sur un reçu, et dans **Champs d'éléments de ligne**, qui incluent des champs tels que les articles individuels indiqués sur un reçu. Les champs identifiés sont mis en évidence sur l'image du document dans la sortie.
+ Pour l'analyse des documents d'identité, la sortie indique les champs identifiés par le Ready-to-use modèle, tels que le prénom et le nom de famille, l'adresse ou la date de naissance. Les champs identifiés sont mis en évidence sur l'image du document dans la sortie.
+ Pour l'analyse de documents, les résultats sont classés dans **Texte brut**, **Formulaires**, **Tableaux** et **Signatures**. **Texte brut** inclut l'ensemble du texte extrait, tandis que **Formulaires**, **Tableaux** et **Signatures** incluent uniquement les informations indiquées sur le formulaire appartenant à ces catégories. Par exemple, **Tableaux** inclut uniquement les informations extraites des tableaux du document. Les champs identifiés sont mis en évidence sur l'image du document dans la sortie.
+ Pour les requêtes sur les documents, Canvas renvoie des réponses à chacune de vos requêtes. Vous pouvez ouvrir le menu déroulant des requêtes pour afficher un résultat, ainsi qu'un score de confiance pour la prédiction. Si Canvas trouve plusieurs réponses dans le document, il se peut que vous obteniez plusieurs résultats pour chaque requête.

La capture d'écran suivante illustre les résultats d'une prédiction unique utilisant la solution d'analyse de documents.

![Capture d'écran des résultats d'une seule prédiction avec le Ready-to-use modèle d'analyse de documents.](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/studio/canvas/canvas-ready-to-use/ai-solutions-document-analysis.png)


## Des prédictions par lots
<a name="canvas-ready-to-use-predict-document-batch"></a>

Pour effectuer des prédictions par lots pour les Ready-to-use modèles qui acceptent des données de document, procédez comme suit :

1. Dans le volet de navigation de gauche de l'application Canvas, sélectionnez **R eady-to-use models**.

1. Sur la page **Ready-to-use des modèles**, choisissez le Ready-to-use modèle correspondant à votre cas d'utilisation. Pour les données d'image, il doit s'agir de l'un des modèles suivants : **Analyse des dépenses**, **Analyse des documents d'identité** ou **Analyse de documents**.

1. Sur la page **Exécuter les prédictions** pour le Ready-to-use modèle que vous avez choisi, sélectionnez **Prédiction par lots**.

1. Choisissez **Sélectionner un jeu de données** si vous avez déjà importé votre jeu de données. Si ce n'est pas le cas, choisissez **Importer un nouveau jeu de données**. Vous êtes ensuite dirigé vers le flux de travail d'importation de données.

1. Dans la liste des jeux de données disponibles, sélectionnez votre jeu de données et choisissez **Générer des prédictions**. Si votre cas d'utilisation est l'analyse de documents, passez à l'étape 6.

1. (Facultatif) Si votre cas d'utilisation est l'analyse de documents, une autre boîte de dialogue nommée **Sélectionner les fonctionnalités à inclure dans la prédiction par lots** apparaît. Vous pouvez sélectionner **Formulaires**, **Tableaux** et **Signatures** pour regrouper les résultats par fonctionnalités. Choisissez ensuite **Générer des prédictions**.

Une fois la tâche de prédiction terminée, sur la page **Exécuter les prédictions**, vous pouvez voir un jeu de données en sortie répertorié sous **Prédictions**. Ce jeu de données contient vos résultats, et si vous sélectionnez l'icône **Plus d'options** (![](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)), vous pouvez choisir **Afficher les résultats de prédiction** pour prévisualiser l'analyse de vos données de document.

Les informations suivantes décrivent les résultats pour chaque type de solution :
+ Pour l'analyse des dépenses, les résultats sont classés dans **Champs récapitulatifs**, qui incluent des champs tels que le total indiqué sur un reçu, et dans **Champs d'éléments de ligne**, qui incluent des champs tels que les articles individuels indiqués sur un reçu. Les champs identifiés sont mis en évidence sur l'image du document dans la sortie.
+ Pour l'analyse des documents d'identité, la sortie indique les champs identifiés par le Ready-to-use modèle, tels que le prénom et le nom de famille, l'adresse ou la date de naissance. Les champs identifiés sont mis en évidence sur l'image du document dans la sortie.
+ Pour l'analyse de documents, les résultats sont classés dans **Texte brut**, **Formulaires**, **Tableaux** et **Signatures**. **Texte brut** inclut l'ensemble du texte extrait, tandis que **Formulaires**, **Tableaux** et **Signatures** incluent uniquement les informations indiquées sur le formulaire appartenant à ces catégories. Par exemple, **Tableaux** inclut uniquement les informations extraites des tableaux du document. Les champs identifiés sont mis en évidence sur l'image du document dans la sortie.

Après avoir prévisualisé vos résultats, vous pouvez choisir **Télécharger la prédiction** et télécharger les résultats sous forme de fichier ZIP.