Bewährte Methoden für S3 Vectors - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bewährte Methoden für S3 Vectors

Amazon S3 Vectors bietet einen speziell entwickelten, kostenoptimierten Vektorspeicher für die Verwendung durch KI-fähige Anwendungen und die semantische Suche Ihrer in Amazon S3 gespeicherten Inhalte. S3 Vectors wurde entwickelt, um Elastizität und Haltbarkeit auf S3-Niveau für die Speicherung von Vektordatensätzen mit einer Abfrageleistung von weniger als einer Sekunde für kalte Abfragen und bis zu 100 Millisekunden für warme Abfragen zu bieten. S3 Vectors ist ideal für Anwendungen, die Vektorindizes erstellen und erweitern müssen. Mit S3 Vectors können Sie spezielle API-Operationen verwenden, um Vektordaten zu speichern, darauf zuzugreifen und Ähnlichkeitsabfragen für Vektordaten durchzuführen, ohne eine Infrastruktur bereitstellen zu müssen. Weitere Informationen finden Sie unter Arbeiten mit S3-Vektoren und Vektor-Buckets.

Um den maximalen Nutzen aus S3 Vectors zu ziehen, empfehlen wir Ihnen, die folgenden bewährten Verfahren anzuwenden.

Vektoren einfügen und löschen

Ihre Anwendung kann bis zu eintausend DeleteVectorsAnfragen pro Sekunde pro Vektorindex verarbeiten PutVectorsoder bis zu zweitausendfünfhundert Vektoren pro Sekunde pro Vektorindex einfügen oder löschen — je nachdem, welcher Grenzwert zuerst erreicht wird. Wenn Sie die Anforderungsraten überschreiten, wird möglicherweise eine 429 TooManyRequestsException-Fehlermeldung angezeigt.

Um die Kosten zu optimieren, empfehlen wir, Vektoren in großen Batches einzufügen und zu löschen, bis zu einer maximalen Batchgröße von 500 Vektoren pro API-Anfrage. Wenn Ihr Workload kleinere Batches erfordert, können Sie gleichzeitige Anfragen bis zum Limit von 1.000 Anfragen pro Sekunde senden. Um einen maximalen Durchsatz von 2.500 Vektoren pro Sekunde zu erreichen, können Sie 5 Batches pro Sekunde mit jeweils 500 Vektoren oder 1.000 Batches pro Sekunde mit durchschnittlich jeweils 2,5 Vektoren senden.

Zugreifen auf und Abfragen von Vektoren in einem S3-Vektorindex

Ihre Anwendung kann Hunderte von QueryVectorsGetVectors, oder ListVectorsAnfragen pro Sekunde pro S3-Vektorindex erreichen. Wenn Sie die Anforderungsraten überschreiten, wird möglicherweise eine 429 TooManyRequestsException-Fehlermeldung angezeigt. Wir empfehlen Ihnen, einen Wiederholungsmechanismus zu verwenden und Ihre Anwendung so zu konfigurieren, dass weniger Anfragen gesendet werden.

Skalierung über Vektorindizes hinweg

Um die Abfrageleistung pro Vektorindex zu verbessern, sollten Sie erwägen, Ihre Anwendung so zu konfigurieren, dass Vektoren nach Möglichkeit auf mehrere Vektorindizes aufgeteilt werden. Wenn Sie beispielsweise Multi-Tenant-Workloads haben und Ihre Anwendung jeden Mandanten unabhängig abfragt, sollten Sie erwägen, die Vektoren jedes Mandanten in einem separaten Vektorindex zu speichern. Weitere Informationen finden Sie unter Vektor-Indizes.

Implementierung von Mehrmandantenfähigkeit mit separaten Vektorindizes

Sie können eine Mehrmandantenfähigkeit erreichen, indem Sie Ihre Vektordaten mit einem einzigen Vektorindex für jeden Mandanten organisieren. Sie können IAM- und Bucket-Richtlinien verwenden, um den Zugriff jedes Mandanten nur auf seinen bestimmten Vektorindex zu beschränken. Dieser Ansatz trägt zur Aufrechterhaltung der Datenisolierung bei und vereinfacht die Verwaltung, da keine separaten Buckets für jeden Mandanten erstellt werden müssen. Weitere Informationen finden Sie unter Identity and Access Management in Amazon S3 Vectors.

Konfiguration von nicht filterbaren Metadatenfeldern für Vektorindizes

Wenn Sie einen Vektorindex erstellen, konfigurieren Sie Metadatenfelder, die nicht gefiltert werden müssen, als nicht filterbare Metadatenschlüssel. Speichern Sie beispielsweise Textblöcke für Vektoreinbettungen als nicht filterbare Metadatenfelder, wenn Sie sie nur als Referenz benötigen. Weitere Informationen finden Sie unter Nicht filterbare Metadaten.