Option 1: Verwenden der S3-Manifestdatei Option 2: Inline Payload verwenden

Neue Vokabeleinheiten hinzufügen

Mithilfe der InvokeDataAutomationLibraryIngestionJobAPI können Sie Ihrer Bibliothek Vokabeln hinzufügen. Sie können Vokabeln über eine S3-Manifestdatei oder eine Inline-Payload bereitstellen.

Wichtig

UPSERT-Operationen verwenden eine Ersetzung im Clobber-Stil auf Entitätsebene, was bedeutet, dass die gesamte Entität ersetzt wird, anstatt sie mit vorhandenem Inhalt zusammenzuführen.

Option 1: Verwenden der S3-Manifestdatei

Schritt 1: Erstellen Sie eine JSONL-Manifestdatei

Beispiel: vocabulary-manifest.json


{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"}
{"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Anforderungen an die Manifestdatei:

Dateiformat: JSONL (JSON-Zeilen)
Entität JSON:
- entityId (erforderlich): Eindeutiger Bezeichner (max. 128 Zeichen)
- Beschreibung (optional): Beschreibung der EntityID
- Sprache (erforderlich): ISO-Sprachcode (Unterstützte Sprachen)
- Phrasen (erforderlich): Array von Textobjekten. Jedes Objekt enthält:
  - Text (erforderlich): Einzelnes Wort oder Satz
  - displayAsText(optional): Verwenden Sie diese Option, um das tatsächliche Wort im Transkript zu ersetzen (HINWEIS: Groß- und Kleinschreibung beachten)

Schritt 2: Laden Sie das Manifest auf S3 hoch


aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Schritt 3: Starten Sie den Aufnahmejob

Verwenden Sie den InvokeDataAutomationLibraryIngestionJob, um einen Job zur Vokabelaufnahme zu starten.

AWS-CLI-Beispiel:

Anforderung


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \
    --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Antwort:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Beispiel für eine AWS-Konsole:

Navigieren Sie zur Seite „Bibliotheksdetails“
Wählen Sie „Benutzerdefinierte Vokabelliste hinzufügen“
Wählen Sie „Manifest hochladen/auswählen“
Wählen Sie aus, ob Sie die Manifestdatei direkt oder von einem S3-Speicherort hochladen möchten

Option 2: Inline Payload verwenden

Diese Option kann für schnelle Updates mit bis zu 100 Phrasen verwendet werden.

Verwenden Sie den InvokeDataAutomationLibraryIngestionJob, um einen Job zum Erfassen von Vokabeln zu starten.

AWS-CLI-Beispiel:

Anforderung


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \
    --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Antwort:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Beispiel für eine AWS-Konsole:

Navigieren Sie zur Seite „Bibliotheksdetails“
Wählen Sie „Benutzerdefinierte Vokabelliste hinzufügen“
Wähle „Manuell hinzufügen“

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Verwaltung benutzerdefinierter Vokabularentitäten

Vokabelentitäten aktualisieren