View a markdown version of this page

Neue Vokabeleinheiten hinzufügen - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Neue Vokabeleinheiten hinzufügen

Mithilfe der InvokeDataAutomationLibraryIngestionJobAPI können Sie Ihrer Bibliothek Vokabeln hinzufügen. Sie können Vokabeln über eine S3-Manifestdatei oder eine Inline-Payload bereitstellen.

Wichtig

UPSERT-Operationen verwenden eine Ersetzung im Clobber-Stil auf Entitätsebene, was bedeutet, dass die gesamte Entität ersetzt wird, anstatt sie mit vorhandenem Inhalt zusammenzuführen.

Option 1: Verwenden der S3-Manifestdatei

Schritt 1: Erstellen Sie eine JSONL-Manifestdatei

Beispiel: vocabulary-manifest.json

{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Anforderungen an die Manifestdatei:

  • Dateiformat: JSONL (JSON-Zeilen)

  • Entität JSON:

    • entityId (erforderlich): Eindeutiger Bezeichner (max. 128 Zeichen)

    • Beschreibung (optional): Beschreibung der EntityID

    • Sprache (erforderlich): ISO-Sprachcode (Unterstützte Sprachen)

    • Phrasen (erforderlich): Array von Textobjekten. Jedes Objekt enthält:

      • Text (erforderlich): Einzelnes Wort oder Satz

      • displayAsText(optional): Verwenden Sie diese Option, um das tatsächliche Wort im Transkript zu ersetzen (HINWEIS: Groß- und Kleinschreibung beachten)

Schritt 2: Laden Sie das Manifest auf S3 hoch

aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Schritt 3: Starten Sie den Aufnahmejob

Verwenden Sie den InvokeDataAutomationLibraryIngestionJob, um einen Job zur Vokabelaufnahme zu starten.

AWS-CLI-Beispiel:

Anforderung

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Antwort:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

Beispiel für eine AWS-Konsole:

  1. Navigieren Sie zur Seite „Bibliotheksdetails“

  2. Wählen Sie „Benutzerdefinierte Vokabelliste hinzufügen“

  3. Wählen Sie „Manifest hochladen/auswählen“

  4. Wählen Sie aus, ob Sie die Manifestdatei direkt oder von einem S3-Speicherort hochladen möchten

Option 2: Inline Payload verwenden

Diese Option kann für schnelle Updates mit bis zu 100 Phrasen verwendet werden.

Verwenden Sie den InvokeDataAutomationLibraryIngestionJob, um einen Job zum Erfassen von Vokabeln zu starten.

AWS-CLI-Beispiel:

Anforderung

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Antwort:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

Beispiel für eine AWS-Konsole:

  1. Navigieren Sie zur Seite „Bibliotheksdetails“

  2. Wählen Sie „Benutzerdefinierte Vokabelliste hinzufügen“

  3. Wähle „Manuell hinzufügen“