Opzioni di analisi per la tua fonte di dati - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Opzioni di analisi per la tua fonte di dati

L'analisi si riferisce alla comprensione e all'estrazione del contenuto dai dati grezzi. Amazon Bedrock Knowledge Bases offre le seguenti opzioni per l'analisi della fonte di dati durante l'ingestione:

  • Parser predefinito di Amazon Bedrock: analizza solo il testo nei file di testo, inclusi i file.txt, .md, .html, .doc/.docx, .xls/.xlsx e.pdf. Questo parser non comporta costi di utilizzo.

    Nota

    Poiché il parser predefinito restituisce solo testo, ti consigliamo di utilizzare Amazon Bedrock Data Automation o un modello di base come parser anziché il parser predefinito se i tuoi documenti includono figure, grafici, tabelle o immagini. Amazon Bedrock Data Automation e i modelli Foundation possono estrarre questi elementi dai documenti e restituirli come output.

  • Amazon Bedrock Knowledge Bases offre i seguenti parser per analizzare dati multimodali, tra cui figure, grafici e tabelle in file.pdf, oltre ai file di immagine.jpeg e.png. Questi parser possono anche estrarre queste figure, grafici, tabelle e immagini e archiviarli come file in una destinazione S3 specificata durante la creazione della knowledge base. Durante il recupero della knowledge base, questi file possono essere restituiti nella risposta o nell'attribuzione del codice sorgente.

    • Amazon Bedrock Data Automation: un servizio completamente gestito che elabora in modo efficace i dati multimodali, senza la necessità di fornire ulteriori richieste. Il costo di questo parser dipende dal numero di pagine del documento o dal numero di immagini da elaborare. Per ulteriori informazioni su questo servizio, consulta Amazon Bedrock Data Automation.

    • Modelli di base: elabora dati multimodali utilizzando un modello di base. Questo parser offre la possibilità di personalizzare il prompt predefinito utilizzato per l'estrazione dei dati. Il costo di questo parser dipende dal numero di token di input e output elaborati dal modello di base. Per un elenco di modelli che supportano l'analisi dei dati delle Amazon Bedrock Knowledge Bases, consulta. Modelli e regioni supportati per l'analisi

Importante

Se scegli Amazon Bedrock Data Automation o Foundation Models come parser, il metodo scelto verrà utilizzato per analizzare tutti i file.pdf nella tua origine dati, anche se i file.pdf contengono solo testo. Il parser predefinito non verrà utilizzato per analizzare questi file.pdf. Sul tuo account sono previsti costi per l'utilizzo di Amazon Bedrock Data Automation o del modello di base per l'analisi di questi file.

Quando scegli come analizzare i tuoi dati, considera quanto segue:

  • Che i dati siano puramente testuali o che contengano dati multimodali, come immagini, grafici e diagrammi, è necessario che la Knowledge Base sia in grado di interrogare.

  • Se si desidera la possibilità di personalizzare il prompt utilizzato per istruire il modello su come analizzare i dati.

  • Il costo del parser. Amazon Bedrock Data Automation utilizza prezzi per pagina, mentre i parser del modello di base addebitano i costi in base ai token di input e output. Per maggiori informazioni, consulta Prezzi di Amazon Bedrock.

  • Il limite di dimensione del file. Quando si utilizzano modelli di base come parser, la dimensione del file non deve essere superiore a 100 MB.

Per informazioni su come configurare il modo in cui viene analizzata la knowledge base, consulta la configurazione della connessione per la fonte di dati in. Connect una fonte di dati alla tua knowledge base