Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Documents
La sortie standard pour les documents vous permet de définir la granularité de la réponse qui vous intéresse ainsi que d’établir le format de sortie et le format du texte dans la sortie. Voici certaines des sorties que vous pouvez activer :
Note
BDA peut traiter les fichiers DOCX. Pour traiter les fichiers DOCX, ils sont convertis en. PDFs Autrement dit, le mappage des numéros de page ne fonctionne pas pour les fichiers DOCX. Les images des fichiers convertis PDFs seront téléchargées dans votre compartiment de sortie si l'option JSON+ et la granularité de la page sont sélectionnées.
Granularité des réponses
La granularité des réponses détermine le type de réponse que vous souhaitez recevoir lors de l'extraction du texte du document. Chaque niveau de granularité vous donne de plus en plus de réponses séparées, la page fournissant tout le texte extrait ensemble et le mot fournissant chaque mot sous forme de réponse distincte. Voici les niveaux de granularité disponibles :
-
Granularité au niveau de la page : ce niveau de granularité est activé par défaut. La granularité au niveau de la page fournit à chaque page du document le format de sortie de texte de votre choix. Si vous traitez un fichier PDF, l’activation de ce niveau de granularité permet de détecter et renvoyer les liens hypertexte intégrés.
-
Granularité au niveau de l’élément (disposition) : ce niveau de granularité est activé par défaut. Fournit le texte du document dans le format de sortie de votre choix, séparé en différents éléments. Ces éléments peuvent être des figures, des tableaux ou des paragraphes. Ils sont renvoyés dans un ordre de lecture logique basé sur la structure du document. Si vous traitez un fichier PDF, l’activation de ce niveau de granularité permet de détecter et renvoyer les liens hypertexte intégrés.
-
Granularité au niveau du mot : fournit des informations sur des mots individuels sans recourir à une analyse contextuelle plus large. Indique chaque mot et son emplacement sur la page.
Paramètres de sortie
Les paramètres de sortie déterminent la manière dont les résultats téléchargés sont structurés. Ce paramètre est exclusif à la console. Voici les options pour les paramètres de sortie :
-
JSON : structure de sortie par défaut pour l’analyse des documents. Fournit un fichier de sortie JSON contenant les informations de vos paramètres de configuration.
-
InvokeDataAutomationAsyncAPI asynchrone : la sortie JSON pour l'API asynchrone est S3 uniquement.
-
InvokeDataAutomationAPI de synchronisation : la sortie JSON peut être définie sur S3 ou en ligne en tirant parti
outputconfigurationde. Si S3 est sélectionné, le JSON de sortie est transmis à S3 uniquement (pas en ligne). Si S3 n'est pas fourni, la sortie de l'API Sync prend uniquement en charge le JSON en ligne.
-
-
JSON+Files — Disponible uniquement pour l'API asynchrone. InvokeDataAutomationAsync L'utilisation de ce paramètre génère à la fois une sortie JSON et des fichiers correspondant à différentes sorties. Par exemple, ce paramètre vous fournit un fichier texte pour l’extraction globale du texte, un fichier Markdown pour le texte avec balisage structurel et des fichiers CSV pour chaque tableau présent dans le texte. Les figures situées dans un document sont enregistrées ainsi que les figures recadrées et les images rectifiées. De plus, si vous traitez un fichier DOCX et que cette option est sélectionnée, le PDF converti de votre fichier DOCX se trouve dans le dossier de sortie. Ces sorties se trouvent dans
standard_output/dans votre dossier de sortie.logical_doc_id/assets/
Note
-
L'API de synchronisation ne génère aucun fichier supplémentaire au-delà du JSON. Le JSON de sortie contient uniquement le format de texte sélectionné dans le cadre du format de texte de sortie standard. L'API de synchronisation ne produira pas de recadrage de figures ni d'images rectifiées.
-
DocX n'est pas pris en charge par l'API Sync.
Format du texte
Le format du texte détermine les différents types de textes fournis au moyen de diverses opérations d’extraction. Vous pouvez sélectionner l’une des options suivantes pour le format de votre texte.
-
Texte brut : ce paramètre fournit une sortie textuelle uniquement sans qu’aucun élément de formatage ni autre élément de balisage ne soit noté.
-
Texte avec balisage : paramètre de sortie par défaut pour la sortie standard. Fournit du texte avec des éléments de balisage intégrés.
-
Texte avec HTML : fournit du texte avec des éléments HTML intégrés dans la réponse.
-
CSV : fournit une sortie structurée au format CSV pour les tableaux du document. Cela ne donne une réponse que pour les tableaux, et non pour les autres éléments du document.
Cadres de délimitation et champs génératifs
Pour les documents, deux options de réponse modifient leur sortie en fonction de la granularité sélectionnée. Il s’agit de Cadres de délimitation et Champs génératifs. La sélection de l’option Cadres de délimitation fournit un aperçu visuel de l’élément ou du mot sur lequel vous cliquez dans la liste déroulante des réponses de la console. Ainsi, vous pouvez retrouver plus facilement des éléments spécifiques de votre réponse. Les cadres de délimitation sont renvoyés dans votre code JSON sous forme de coordonnées des quatre coins du cadre.
Lorsque vous sélectionnez l’option Champs génératifs, un résumé du document est généré, à la fois dans une version de 10 mots et dans une autre de 250 mots. Ensuite, si vous sélectionnez des éléments sous forme de granularité de réponse, vous générez une légende descriptive de chaque figure détectée dans le document. Les chiffres incluent des éléments tels que des tableaux, des graphiques et des images.
Code JSON de métadonnées de format de fichier supplémentaires
Lorsque vous recevez vos fichiers supplémentaires à l'aide de l'indicateur de formats de fichiers supplémentaires, vous obtenez un fichier JSON pour toutes les images rectifiées extraites. BDA rectifie les images pivotées en faisant pivoter l’image à un angle de 90 degrés à l’aide d’une homographie. Voici un exemple du code JSON :
"asset_metadata": { "rectified_image": "s3://bucket/prefix.png", "rectified_image_width_pixels": 1700, "rectified_image_height_pixels": 2200, "corners": [ [ 0.006980135689736235, -0.061692718505859376 ], [ 1.10847711439684, 0.00673927116394043 ], [ 0.994479346419327, 1.050548828125 ], [ -0.11249661383904497, 0.9942819010416667 ] ] }
Les coins représentent les coins détectés d’une image, permettant de former une homographie du document. Cette homographie permet de faire pivoter l’image tout en conservant ses autres propriétés.