Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Überblick über Vektoren
Vektoren sind numerische Darstellungen, die Maschinen helfen, Daten zu verstehen und zu verarbeiten. In der generativen KI dienen sie zwei Hauptzwecken:
-
Darstellung latenter Räume, die Datenstrukturen in komprimierter Form erfassen
-
Erstellen von Einbettungen für Daten wie Wörter, Sätze und Bilder
Einbettungsmodelle wie Word2Vec
-
Lernen Sie anhand des Kontextes, Wörter als Vektoren darzustellen.
-
Platzieren Sie ähnliche Wörter im Vektorraum näher beieinander.
-
Ermöglichen Sie Maschinen, Daten in einem kontinuierlichen Raum zu verarbeiten.
Das folgende Diagramm bietet einen allgemeinen Überblick über den Einbettungsprozess:
-
Ein Amazon Simple Storage Service (Amazon S3) -Bucket enthält Dateien, die Datenquellen sind, aus denen das System Informationen liest und verarbeitet. Der S3-Bucket wird während der Amazon Bedrock-Wissensdatenbankkonfiguration angegeben, die auch die Synchronisierung von Daten mit der Wissensdatenbank beinhaltet.
-
Das Einbettungsmodell konvertiert die Rohdaten aus den Objektdateien im S3-Bucket in Vektoreinbettungen. Beispielsweise wird Object1 in einen Vektor [0.6, 0.7,...] umgewandelt, der seinen Inhalt in einem mehrdimensionalen Raum darstellt.

Worteinbettungen sind für die Verarbeitung natürlicher Sprache (NLP) von entscheidender Bedeutung, da sie Folgendes bewirken:
-
Erfassen Sie semantische Beziehungen zwischen Wörtern.
-
Ermöglichen Sie die Generierung von kontextrelevantem Text.
-
Sorgen Sie dafür, dass große Sprachmodelle (LLMs) menschenähnliche Antworten erzeugen.