Fügen Sie Metadaten in eine Datenquelle ein, um die Wissensdatenbankabfrage zu verbessern - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Fügen Sie Metadaten in eine Datenquelle ein, um die Wissensdatenbankabfrage zu verbessern

Wenn Sie CSV-Dateien (durch Kommas getrennte Werte) aufnehmen, können Sie festlegen, dass die Wissensdatenbank bestimmte Spalten als Inhaltsfelder und nicht als Metadatenfelder behandelt. Anstatt potenziell Hunderte oder Tausende von content/metadata Dateipaaren zu haben, können Sie jetzt eine einzige CSV-Datei und eine entsprechende metadata.json-Datei verwenden, die der Wissensdatenbank Hinweise gibt, wie jede Spalte in Ihrer CSV-Datei zu behandeln ist.

Es gibt Grenzwerte für Dokumentmetadaten fields/attributes pro Block. Siehe Kontingente für Wissensdatenbanken

Bevor Sie eine CSV-Datei aufnehmen, stellen Sie Folgendes sicher:

  • Ihre CSV-Datei hat das Format RFC418 0 und ist UTF-8-codiert.

  • Die erste Zeile Ihrer CSV-Datei enthält Header-Informationen.

  • Die in Ihrer Datei metadata.json bereitgestellten Metadatenfelder sind in Ihrer CSV-Datei als Spalten vorhanden.

  • Sie geben eine Datei filename.csv.metadata.json mit dem folgenden Format an:

    { "metadataAttributes": { "${attribute1}": "${value1}", "${attribute2}": "${value2}", ... }, "documentStructureConfiguration": { "type": "RECORD_BASED_STRUCTURE_METADATA", "recordBasedStructureMetadata": { "contentFields": [ { "fieldName": "string" } ], "metadataFieldsSpecification": { "fieldsToInclude": [ { "fieldName": "string" } ], "fieldsToExclude": [ { "fieldName": "string" } ] } } } }

Die CSV-Datei wird zeilenweise analysiert, und die Chunking-Strategie und die Vektoreinbettung werden auf das Inhaltsfeld angewendet. Die Amazon Bedrock Knowledge Bases unterstützen derzeit ein Inhaltsfeld. Das Inhaltsfeld ist in Abschnitte aufgeteilt, und die Metadatenfelder (Spalten), die jedem Abschnitt zugeordnet sind, werden als Zeichenkettenwerte behandelt.

Nehmen wir zum Beispiel an, es gibt eine CSV-Datei mit einer Spalte „Beschreibung“ und einer Spalte „Creation_Date“. Das Beschreibungsfeld ist das Inhaltsfeld und das Erstellungsdatum ist ein zugeordnetes Metadatenfeld. Der Beschreibungstext wird in Abschnitte aufgeteilt und für jede Zeile in der CSV-Datei in Vektoreinbettungen umgewandelt. Der Wert für das Erstellungsdatum wird als Zeichenkettendarstellung des Datums behandelt und jedem Abschnitt für die Beschreibung zugeordnet.

Wenn keine inclusion/exclusion Felder angegeben werden, werden alle Spalten außer der Inhaltsspalte als Metadatenspalten behandelt. Wenn nur Inklusionsfelder angegeben werden, werden nur die bereitgestellten Spalten als Metadaten behandelt. Wenn nur Ausschlussfelder angegeben werden, werden alle Spalten mit Ausnahme der Ausschlussspalten als Metadaten behandelt. Wenn Sie sowohl fieldName in als auch fieldsToInclude dasselbe angebenfieldsToExclude, löst Amazon Bedrock eine Validierungsausnahme aus. Wenn es einen Konflikt zwischen Inklusion und Exklusion gibt, führt dies zu einem Fehlschlag.

Leere Zeilen in einer CSV-Datei werden ignoriert oder übersprungen.