Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden der automatischen Optimierung in der Konsole
Sie können die Amazon OpenSearch Service-Konsole verwenden, um Vector-Ingestion-Jobs zu erstellen, deren Fortschritt zu überwachen, Optimierungsempfehlungen einzusehen und Indizes auf der Grundlage dieser Empfehlungen zu erstellen.
Voraussetzungen
Bevor Sie die automatische Optimierung in der Konsole verwenden können, müssen Sie über Folgendes verfügen:
-
Ein aktives AWS Konto mit Zugriff auf die OpenSearch Konsole.
-
Eine bestehende OpenSearch serverlose Sammlung vom Typ Vektorsuche oder eine verwaltete OpenSearch Domain.
-
IAM-Berechtigungen für die folgenden Aktionen:
opensearch:SubmitAutoOptimizeJobopensearch:GetAutoOptimizeJobopensearch:DeleteAutoOptimizeJobopensearch:CancelAutoOptimizeJobopensearch:ListAutoOptimizeJobs
Anmerkung
Dies sind identitätsbasierte Richtlinien. AWS unterstützt keine ressourcenbasierten Richtlinien für die automatische Optimierung von Ressourcen.
-
Konfigurieren Sie Ihre Verbundbenutzersitzung so, dass die Anmeldedaten mindestens 1 Stunde ablaufen. Bei sehr großen Datensätzen oder großen Datenmengen sollten Sie erwägen, die Ablaufdauer auf bis zu 3 Stunden zu erhöhen.
Einen Job zur Vektoraufnahme erstellen
Ein Vektor-Ingestion-Job analysiert Ihre Vektordaten und gibt Optimierungsempfehlungen für die Indexkonfiguration.
Um einen Vektor-Ingestion-Job zu erstellen
-
Melden Sie sich bei der Amazon OpenSearch Service-Konsole unter an AWS-Managementkonsole
. -
Wählen Sie im Navigationsbereich die Option Auto-Optimize aus.
-
Wählen Sie „Vektor-Ingestion-Job erstellen“.
-
Geben Sie unter Auftragsdetails einen Namen für Ihren Vector-Ingestion-Job ein. Dieser Name hilft Ihnen, den Job in der Konsole zu identifizieren.
-
Konfigurieren Sie unter Datenquelle Folgendes:
-
Geben Sie für Amazon S3 S3-URI die Amazon S3 S3-URI des Ordners ein, der Ihre Parquet-Dateien enthält. Die URI muss auf den umschließenden Ordner verweisen, nicht auf einzelne Dateien. Wenn sich Ihre Parquet-Datei beispielsweise unter befindet
s3://my-bucket/my-folder/file1.parquet, geben Sie eins3://my-bucket/my-folder/. -
Wählen Sie für Region die AWS Region aus, in der sich Ihr Amazon S3 S3-Bucket befindet. Die Region muss mit dem Bucket-Standort übereinstimmen.
-
-
Wählen Sie unter OpenSearch Domain eine bestehende Domain oder Sammlung aus, oder wählen Sie Create new, um eine zu erstellen.
Anmerkung
Sie können entweder eine OpenSearch verwaltete Domain oder eine OpenSearch serverlose serverlose Sammlung angeben.
-
Geben Sie unter Datenquellenberechtigungen die IAM-Rolle an, die über Berechtigungen für den Zugriff auf Ihren Amazon S3 S3-Bucket und Ihre OpenSearch Domain oder Sammlung verfügt. Die Rolle muss je nach Ihrer Domain- oder Sammlungskonfiguration über die erforderlichen Berechtigungen verfügen:
-
Bei OpenSearch Domänen mit einer Domänenzugriffsrichtlinie gewähren Sie der Rolle Zugriff über diese Richtlinie.
-
Fügen Sie für OpenSearch Domänen mit detaillierter Zugriffskontrolle die Rolle als Backend-Rolle hinzu.
-
Fügen Sie für OpenSearch serverlose Sammlungen die Rolle zur Datenzugriffsrichtlinie hinzu.
-
-
Wählen Sie Weiter aus.
-
Geben Sie unter Index konfigurieren Folgendes an:
-
Geben Sie als Feldname den Spaltennamen aus Ihrem Parquet-Datensatz ein, der die Vektordaten enthält.
-
Wählen Sie als Raumtyp die Entfernungsmetrik aus, die zur Berechnung der Entfernung zwischen Vektoren verwendet wird:
l2 — Euklidischer Abstand
Cosinesimil - Kosinus-Ähnlichkeit
inneres Produkt - Inneres Produkt
-
Geben Sie für Dimension die Anzahl der Fließkommawerte in jedem Vektor ein.
-
-
Konfigurieren Sie unter Leistungsanforderungen Folgendes:
-
Geben Sie für Recall die gewünschte Suchqualität als Dezimalwert zwischen 0 und 1 an. Höhere Erinnerungswerte führen zu relevanteren Ergebnissen. Beispiel:
0,95 gibt an, dass im Durchschnitt 19 der 20 Dokumentvektoren zurückgegeben werden, die einem Abfragevektor tatsächlich am nächsten sind
0,9 steht für 9 von 10
0,8 steht für 8 von 10
-
Wählen Sie für die Anforderungen an die Suchlatenz Ihre Latenztoleranz aus. Niedrige Anforderungen ermöglichen mehr Kosteneinsparungen durch Komprimierungsmethoden, die den Speicherbedarf verringern.
-
-
Wählen Sie Weiter aus.
-
Überprüfen Sie Ihre Konfiguration und wählen Sie Create.
Der Job beginnt mit der Verarbeitung. Sie können den Fortschritt in der Tabelle Vector Ingestion Jobs überwachen.
Überwachung von Optimierungsaufträgen
Sie können den Status Ihrer Vektor-Ingestion-Jobs auf der Landingpage zur automatischen Optimierung überwachen.
Um Optimierungsaufträge zu überwachen
-
Melden Sie sich zu https://console.aws.amazon.com/aos/Hause
bei der Amazon OpenSearch Service-Konsole an. -
Wählen Sie im Navigationsbereich die Option Automatische Optimierung aus.
-
In der Tabelle Vector Ingestion-Jobs werden alle Jobs mit ihrem aktuellen Status angezeigt. Aktualisieren Sie die Seite, um die aktualisierten Statusinformationen zu sehen.
Anmerkung
Es gibt keinen automatischen Aktualisierungs- oder Benachrichtigungsmechanismus. Sie müssen die Konsole manuell aktualisieren, um zu sehen, wann ein Job abgeschlossen ist.
Grundlegendes zu den Statusstatus von Jobs
Jobs zur automatischen Optimierung können die folgenden Statuswerte haben:
- Ausstehend
-
Der Job befindet sich in der Warteschlange und wartet darauf, gestartet zu werden.
- In Ausführung
-
Bei der automatischen Optimierung werden Ihre Daten aktiv analysiert und Empfehlungen generiert.
- Completed
-
Der Job zur automatischen Optimierung wurde erfolgreich abgeschlossen. Alle Analysen, Bewertungen und Empfehlungen sind vollständig und können eingesehen werden.
- Fehlgeschlagen
-
Bei dem Job ist ein Fehler aufgetreten. Sehen Sie sich die Fehlerdetails auf der Seite mit den Auftragsdetails an, um die Ursache zu ermitteln.
- Aktiv
-
Im angehängten Cluster wurde ein Index erstellt und Daten wurden aufgenommen.
Die Auftragsdauer hängt hauptsächlich von der Datensatzgröße und der aktuellen Dienstauslastung ab. Typische Aufträge werden innerhalb von 15 Minuten bis mehreren Stunden abgeschlossen.
Anzeigen von Auftragsdetails
Sie können detaillierte Informationen zu einem bestimmten Optimierungsjob anzeigen, einschließlich seiner Konfiguration und seines Status.
Um Jobdetails anzuzeigen
-
Melden Sie sich zu https://console.aws.amazon.com/aos/Hause
bei der Amazon OpenSearch Service-Konsole an. -
Wählen Sie im Navigationsbereich die Option Auto-Optimize aus.
-
Wählen Sie in der Tabelle Vector Ingestion Jobs den Jobnamen aus.
-
Auf der Seite mit den Auftragsdetails werden die folgenden Informationen angezeigt:
Name und Status der Job
Datenquellenkonfiguration (Amazon S3 S3-URI und Region)
OpenSearch Domäne oder Sammlung
Indexkonfiguration (Feldname, Raumtyp, Dimension)
Leistungsanforderungen (Rückruf und Latenz)
Fehlermeldungen (falls der Job fehlgeschlagen ist)
Ergebnisse anzeigen und verstehen
Nachdem ein Job erfolgreich abgeschlossen wurde, können Sie sich die Optimierungsempfehlungen ansehen.
Um die Optimierungsergebnisse einzusehen
-
Melden Sie sich zu https://console.aws.amazon.com/aos/Hause
bei der Amazon OpenSearch Service-Konsole an. -
Wählen Sie im Navigationsbereich die Option Auto-Optimize aus.
-
Wählen Sie in der Tabelle Vector Ingestion-Jobs einen Job mit dem Status Abgeschlossen aus.
-
Auf der Ergebnisseite werden die folgenden Abschnitte angezeigt:
-
Ergebnisübersicht — Zeigt den geschätzten Wert für die Suchqualität im Vergleich zu Ihren Anforderungen und den Speicherbedarf für den Index im Vergleich zur am häufigsten empfohlenen Konfiguration an.
-
Empfehlungen — Listet bis zu drei Optimierungsempfehlungen auf, wobei die beste Empfehlung für Ihre Konfiguration am besten geeignet ist. Jede Empfehlung beinhaltet:
Konfigurationsparameter indizieren
Konfigurationsparameter suchen
Erwartete Leistungskennzahlen
Schätzungen des Speicherbedarfs
Anmerkung
Die Empfehlungen sind zwar nach der besten Übereinstimmung sortiert, Sie können jedoch jede Empfehlung auswählen, die besser zu Ihrem spezifischen Anwendungsfall passt. Versuche automatisch zu optimieren, die deinen ausgewählten Erinnerungskriterien am ehesten entsprechen.
-
Aus Empfehlungen einen Index erstellen
Nachdem Sie die Optimierungsempfehlungen gelesen haben, können Sie entweder manuell einen Index mit der empfohlenen Konfiguration oder automatisch einen Index mit der ausgewählten Empfehlung erstellen.
Um einen Index automatisch zu erstellen
-
Melden Sie sich zu https://console.aws.amazon.com/aos/Hause
bei der Amazon OpenSearch Service-Konsole an. -
Wählen Sie im Navigationsbereich die Option Auto-Optimize aus.
-
Wählen Sie in der Tabelle Vector Ingestion-Jobs einen Job mit dem Status Abgeschlossen aus.
-
Lesen Sie die Empfehlungen und wählen Sie die aus, die Sie verwenden möchten.
-
Wählen Sie Index erstellen.
-
Das System erstellt anhand der ausgewählten Empfehlung automatisch einen Index in Ihrem Cluster und nimmt die Vektordaten aus Ihrem Parquet-Datensatz auf.
Um einen Index manuell zu erstellen
-
Melden Sie sich zu https://console.aws.amazon.com/aos/Hause
bei der Amazon OpenSearch Service-Konsole an. -
Wählen Sie im Navigationsbereich die Option Auto-Optimize aus.
-
Wählen Sie in der Tabelle Vector Ingestion-Jobs einen Job mit dem Status Abgeschlossen aus.
-
Lesen Sie die Empfehlungen und notieren Sie sich die Indexkonfiguration und die Suchkonfigurationsparameter für die von Ihnen gewählte Empfehlung.
-
Verwenden Sie die OpenSearch API oder die Konsole, um manuell einen Index mit den empfohlenen Parametern zu erstellen.