翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ベクトルの概要
ベクトルは、マシンがデータを理解して処理するのに役立つ数値表現です。生成 AI では、2 つの主要な目的があります。
-
データ構造を圧縮形式でキャプチャする潜在スペースを表す
-
単語、文、画像などのデータの埋め込みの作成
Word2Vec
-
コンテキストから学び、単語をベクトルとして表現する
-
ベクトル空間に同様の単語を近づける
-
マシンが連続スペース内のデータを処理できるようにする
次の図は、埋め込みプロセスの概要を示しています。
-
Amazon Simple Storage Service (Amazon S3) バケットには、システムが情報を読み取って処理するデータソースであるファイルが含まれています。Amazon S3 バケットは、Amazon Bedrock ナレッジベース設定中に指定されます。これには、ナレッジベースとのデータの同期も含まれます。
-
埋め込みモデルは、Amazon S3 バケット内のオブジェクトファイルからの raw データをベクトル埋め込みに変換します。たとえば、
Object1は多次元空間内のコンテンツ[0.6, 0.7, ...]を表すベクトルに変換されます。
自然言語処理 (NLP) では、以下を行うため、単語埋め込みが不可欠です。
-
単語間のセマンティック関係をキャプチャする
-
コンテキストに関連するテキストの生成を有効にする
-
大規模言語モデル (LLMs) を強化して人間のようなレスポンスを生成する