GPU-Beschleunigung für die Vektorindizierung - OpenSearch Amazon-Dienst

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

GPU-Beschleunigung für die Vektorindizierung

Mit GPU-Beschleunigung können Sie große Vektordatenbanken schneller und effizienter erstellen. Sie können diese Funktion für neue oder bestehende OpenSearch Domains und OpenSearch serverlose Sammlungen aktivieren. Diese Funktion verwendet GPU-Beschleunigung, um den Zeitaufwand für die Indizierung von Daten in Vektorindizes zu reduzieren.

Mit der GPU-Beschleunigung können Sie die Geschwindigkeit der Vektorindizierung um das bis zu 10-fache erhöhen, und das bei einem Viertel der Indexierungskosten.

Voraussetzungen

Die GPU-Beschleunigung wird für OpenSearch Domains, auf denen Version oder höher ausgeführt wird, und für serverlose Sammlungen unterstützt. OpenSearch 3.1 OpenSearch Weitere Informationen finden Sie unterUpgrade von Amazon OpenSearch Service-Domains, und. UpdateDomainConfigUpdateCollection APIs

Funktionsweise

Vektorindizes erfordern erhebliche Rechenressourcen, um Datenstrukturen wie Hierarchical Navigable Small Worlds (HNSW) -Diagramme zu erstellen. Wenn Sie die GPU-Beschleunigung für Ihre Domain oder Sammlung aktivieren, OpenSearch werden automatisch Möglichkeiten zur Beschleunigung Ihrer Indexerstellungen erkannt und die Index-Builds auf GPU-Instanzen ausgelagert. OpenSearch Der Service verwaltet die GPU-Instanzen in Ihrem Namen und weist sie bei Bedarf Ihrer Domain oder Sammlung zu. Das bedeutet, dass Sie nicht die Auslastung verwalten und auch nicht für Leerlaufzeiten zahlen müssen.

Mit Compute Units (OCU) — Vector Acceleration zahlen Sie nur für nutzbringende Verarbeitung. Jede Vector Acceleration OCU ist eine Kombination aus etwa 8 GiB CPU-Speicher, 2 V CPUs und 6 GiB GPU-Speicher. Weitere Informationen finden Sie unter Preise für GPU-Beschleunigung.

Informationen zum Aktivieren der GPU-Beschleunigung für Ihre Domain oder Sammlung finden Sie unterGPU-Beschleunigung aktivieren.

Preise für GPU-Beschleunigung

AWS berechnet Ihnen Gebühren, wenn Möglichkeiten zur Beschleunigung der Indexerstellung Ihrer Domain oder Sammlung OpenSearch erkannt werden. Jede Vector Acceleration OCU ist eine Kombination aus etwa 8 GiB CPU-Speicher, 2 V CPUs und 6 GiB GPU-Speicher.

AWS berechnet OCU mit Granularität der zweiten Ebene. In Ihrem Kontoauszug finden Sie einen Eintrag für die Berechnung in OCU-Stunden.

Wenn Sie beispielsweise GPU-Beschleunigung für eine Stunde verwenden, um einen Index zu erstellen und dabei 2 vCPU und 1 GiB GPU-Speicher verwenden, wird Ihnen 1 OCU in Rechnung gestellt. Wenn Sie 9 GiB CPU-Speicher verwenden und gleichzeitig die GPU-Beschleunigung verwenden, werden Ihnen 2 OCU in Rechnung gestellt.

OpenSearch Serverless fügt je nach Rechenleistung und Speicherplatz, die zur Unterstützung Ihrer Sammlungen benötigt werden, OCUs in Schritten von 1 OCU weitere hinzu. Sie können eine maximale Anzahl von OCUs für Ihr Konto konfigurieren, um die Kosten zu kontrollieren.

Anmerkung

Die Anzahl der zu einem beliebigen Zeitpunkt OCUs bereitgestellten Dateien kann variieren und ist nicht exakt. Im Laufe der Zeit wird der Algorithmus, den OpenSearch und OpenSearch Serverless verwendet, weiter verbessert, um die Systemnutzung besser zu minimieren.

Vollständige Preisinformationen finden Sie unter Amazon OpenSearch Service Pricing.

GPU-Beschleunigung und Schreiboperationen

Die GPU-Beschleunigung wird aktiviert, wenn OpenSearch die Vektoraufnahmerate (MB/s) innerhalb eines bestimmten Bereichs liegt. Bei OpenSearch Domänen haben Sie die Flexibilität, diesen Bereich über und zu konfigurieren. index.knn.remote_index_build.size.min index.knn.remote_index_build.size.max Wenn beispielsweise der untere Bereich standardmäßig 50 MB beträgt, löst das Schreiben von 15.000 Vektoren mit voller Genauigkeit und 768 Dimensionen zwischen den Aktualisierungsintervallen standardmäßig die GPU-Beschleunigung aus.

Daten werden mit den folgenden API-Operationen geschrieben:

Die GPU-Beschleunigung ist sowohl bei automatischen als auch bei manuellen Segmentzusammenführungen aktiviert.

Unterstützte Indexkonfigurationen

Die Faiss-Engine unterstützt GPU-Beschleunigung.

Die folgenden Konfigurationen unterstützen keine GPU-Beschleunigung:

Best Practices

Folgen Sie diesen bewährten Methoden, um die Vorteile der GPU-Beschleunigung für Ihre Workloads bei der Vektorsuche zu maximieren:

  • Erhöhen Sie die Anzahl der Index-Clients — Erhöhen Sie die Anzahl der Index-Clients, in die Daten aufgenommen werden, um alle Vorteile GPUs bei der Indexerstellung optimal nutzen zu können. OpenSearch Dies ermöglicht eine bessere Parallelisierung und Nutzung der GPU-Ressourcen.

  • Ungefähren Schwellenwert anpassen — Ändern Sie die index.knn.advanced.approximate_threshold Einstellung, um sicherzustellen, dass kein kleinerer Segmentindex erstellt wird. Dadurch wird die Gesamtgeschwindigkeit der Aufnahme verbessert. Ein Wert von 10.000 ist ein guter Ausgangspunkt. Für Sammlungen müssen Sie explizit einen Wert für diese Einstellung angeben.

  • Shard-Größe optimieren — Versuchen Sie, Shards mit mindestens 1 Million Dokumenten zu erstellen. Bei Shards mit weniger als dieser Anzahl von Dokumenten kann es sein, dass die GPU-Beschleunigung insgesamt keinen Nutzen bringt.