Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Arbeiten mit S3-Vektoren und Vektor-Buckets
Anmerkung
Amazon S3 Vectors befindet sich in der Vorschauversion für Amazon Simple Storage Service und kann sich ändern.
Was ist Amazon S3 Vectors?
Amazon S3 Vectors bietet speziell entwickelten, kostenoptimierten Vektorspeicher für Ihre semantischen Such- und KI-Anwendungen. Mit der Elastizität und Haltbarkeit auf Amazon S3 S3-Niveau für die Speicherung von Vektordatensätzen mit einer Abfrageleistung von weniger als einer Sekunde ist S3 Vectors ideal für Anwendungen, die Vektorindizes erstellen und erweitern müssen. Sie erhalten einen speziellen Satz von API-Operationen zum Speichern, Zugreifen und Ausführen von Ähnlichkeitsabfragen für Vektordaten, ohne eine Infrastruktur bereitstellen zu müssen. S3 Vectors besteht aus mehreren Schlüsselkomponenten, die zusammenarbeiten:
-
Vektor-Buckets — Ein neuer Bucket-Typ, der speziell zum Speichern und Abfragen von Vektoren entwickelt wurde.
-
Vektorindizes — In einem Vektor-Bucket können Sie Ihre Vektordaten in Vektorindizes organisieren. Sie führen Ähnlichkeitsabfragen für Ihre Vektordaten innerhalb von Vektorindizes durch.
-
Vektoren — Sie speichern Vektoren in Ihrem Vektorindex. Für Ähnlichkeitssuche und KI-Anwendungen werden Vektoren als Vektoreinbettungen erstellt. Dabei handelt es sich um numerische Repräsentationen, die semantische Beziehungen zwischen Inhalten (wie Text, Bildern oder Audio) beibehalten, sodass ähnliche Elemente näher beieinander positioniert werden. S3-Vektoren können Ähnlichkeitssuchen durchführen, die auf semantischer Bedeutung und nicht auf exakter Übereinstimmung basieren, indem sie vergleichen, wie nahe Vektoren mathematisch beieinander liegen. Wenn Sie Vektordaten zu einem Vektorindex hinzufügen, können Sie auch Metadaten für future Filterabfragen anhängen, die auf einer Reihe von Bedingungen basieren (z. B. Zeitstempel, Kategorien und Benutzereinstellungen).
Schreibvorgänge in S3-Vektoren sind äußerst konsistent, was bedeutet, dass Sie sofort auf die zuletzt hinzugefügten Daten zugreifen können. Wenn Sie Vektoren im Laufe der Zeit schreiben, aktualisieren und löschen, optimiert S3 Vectors automatisch die Vektordaten, um das bestmögliche Preis-Leistungs-Verhältnis für die Vektorspeicherung zu erzielen, auch wenn die Datensätze skalieren und sich weiterentwickeln. Sie können den Zugriff auf Ihre Vektordaten mit den bestehenden Zugriffskontrollmechanismen von Amazon S3 kontrollieren, einschließlich Bucket- und IAM-Richtlinien. Weitere Informationen zu Vektorindex-Limits pro Bucket und Vektorlimits pro Index finden Sie unterBegrenzungen und Einschränkungen.
Anwendungsfälle: Ähnlichkeitssuchen in großen Datensätzen
Ähnlichkeitssuchen ermöglichen es Ihnen, Elemente zu finden, die aufgrund ihrer Vektordarstellungen konzeptionell miteinander verwandt sind, und nicht anhand exakter Stichwortübereinstimmungen. Diese Suchanfragen identifizieren Inhalte mit ähnlichen Bedeutungen oder Merkmalen, auch wenn sich die genauen Wörter oder visuellen Elemente unterscheiden.
Zu den häufigsten Anwendungsfällen für die Ähnlichkeitssuche mit S3 Vectors gehören:
-
Medizinische Bildgebung — Finden Sie Ähnlichkeiten in Millionen von medizinischen Bildern, um die Diagnose und Behandlungsplanung zu erleichtern
-
Urheberrechtsverletzung — Identifizieren Sie potenziell abgeleitete Inhalte in großen Medienbibliotheken
-
Bilddeduplizierung — Erkennen und entfernen Sie doppelte oder fast doppelte Bilder aus großen Bildsammlungen
-
Verständnis von Videos — Suchen Sie nach bestimmten Szenen oder Inhalten innerhalb von Video-Assets
-
Suche nach Unternehmensdokumenten — Ermöglichen Sie die semantische Suche in allen Unternehmensdokumenten, um relevante Informationen anhand ihrer Bedeutung zu finden
-
Personalisierung — Geben Sie maßgeschneiderte Empfehlungen ab, indem Sie ähnliche Artikel finden
Sie sollten S3 Vectors verwenden, wenn Sie kostengünstige Vektorsuche und agentische KI-Anwendungen mit Suchzeiten von weniger als einer Sekunde erstellen möchten. Mit Vektor-Buckets zahlen Sie nur für das, was Sie tatsächlich nutzen, und Sie könnten Kosten für das Hochladen, Speichern und Abfragen von Vektoreinbettungen sparen. Weitere Informationen zu Preisen finden Sie unter Amazon-S3-Preise
Funktionen von S3 Vectors
Speziell entwickelter Speicher für Vektoren
S3 Vectors ist der erste speziell entwickelte Objektspeicher in der Cloud zum Speichern und Abfragen von Vektoren. Vector Buckets wurden entwickelt, um eine kostengünstige, elastische und langlebige Speicherung von Vektordaten bereitzustellen.
Vektoreinbettungen verändern die Art und Weise, wie Kunden ihre unstrukturierten Daten verwenden und abrufen, angefangen bei der Erkennung von Ähnlichkeiten zwischen medizinischen Bildern über das Auffinden von Anomalien in Tausenden von Stunden Videomaterial bis hin zur Navigation durch große Codebasen und der Identifizierung der relevantesten Rechtsprechung für eine bestimmte Rechtssache. Diese neuen Anwendungen werden mit Einbettungsmodellen kombiniert, um die semantische Bedeutung von Daten (z. B. Text, Bilder, Video, Code) als numerische Vektoreinbettungen zu kodieren.
In einem Vektor-Bucket organisieren Sie Ihre Vektordaten in Vektorindizes, ohne Infrastruktur bereitstellen zu müssen. Wenn Sie Vektoren im Laufe der Zeit schreiben, aktualisieren und löschen, optimiert S3 Vectors automatisch die Vektordaten, um das bestmögliche Preis-Leistungs-Verhältnis für Vektorspeicher zu erzielen, auch wenn die Datensätze skalieren und sich weiterentwickeln. Weitere Informationen zu Vektorindexgrenzwerten pro Bereich und Vektorgrenzwerten pro Index finden Sie unterBegrenzungen und Einschränkungen.
Führen Sie Ähnlichkeitsabfragen durch
Mit S3 Vectors können Sie effiziente Ähnlichkeitsabfragen durchführen, um die Vektoren zu finden, die einem Abfragevektor am ähnlichsten sind, mit Antwortzeiten von weniger als einer Sekunde. S3 Vectors ist ideal für Workloads, bei denen Abfragen weniger häufig sind.
Filterung von Metadaten
Sie können Metadaten (z. B. Jahr, Autor, Genre und Ort) als Schlüssel-Wert-Paare an Ihre Vektoren anhängen. Standardmäßig sind alle Metadaten filterbar, sofern Sie sie nicht ausdrücklich als nicht filterbar angeben. Sie können filterbare Metadaten verwenden, um Ihre Abfrageergebnisse nach bestimmten Attributen zu filtern und so die Relevanz Ihrer Abfragen zu erhöhen. Vektorindizes unterstützen Metadaten vom Typ „Zeichenfolge“, „Zahl“, „Boolean“ und „Liste“. Weitere Informationen zu Größenbeschränkungen für Metadaten pro Vektor und zu Größenbeschränkungen für filterbare Metadaten pro Vektor finden Sie unter. Begrenzungen und Einschränkungen
Zugriffsverwaltung und Sicherheit
Sie können den Zugriff auf Ressourcen in Vektor-Buckets mit IAM- und Service Control-Richtlinien in AWS Organizations verwalten. S3 Vectors verwendet einen anderen Service-Namespace als Amazon S3: den s3vectors
Namespace. Daher können Sie Richtlinien speziell für den S3 Vectors-Service und seine Ressourcen entwerfen. Sie können Richtlinien entwerfen, um Zugriff auf einzelne Vektorindizes, alle Vektorindizes innerhalb eines Vektor-Buckets oder alle Vektor-Buckets in einem Konto zu gewähren. Alle Amazon S3 Block Public Access-Einstellungen sind für Vector-Buckets immer aktiviert und können nicht deaktiviert werden.
Integration mit Diensten AWS
S3 Vectors lässt sich in andere AWS Dienste integrieren, um Ihre Vektorverarbeitungsfunktionen zu verbessern:
-
Amazon OpenSearch Service
— Optimieren Sie die Kosten für Vektorspeicher und nutzen Sie gleichzeitig weiterhin OpenSearch API-Operationen. Dies ist ideal für Workloads, die erweiterte Suchfunktionen wie Hybridsuche, Aggregationen, erweiterte Filterung und facettierte Suche benötigen. Sie können auch einen Snapshot eines S3-Vektorindexes nach Amazon OpenSearch Serverless exportieren, um eine Vektorsuche mit hoher QPS und niedriger Latenz zu ermöglichen. -
Amazon Bedrock Knowledge Bases
— Wählen Sie einen Vektorindex in S3 Vectors als Ihren Vektorspeicher aus, um Speicherkosten für Retrieval Augmented Generation (RAG) -Anwendungen zu sparen. -
Amazon Bedrock in SageMaker Unified Studio
— Entwickeln und testen Sie Wissensdatenbanken mit S3 Vectors als Vektorspeicher.