

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ベクトルの概要
<a name="vectors"></a>

*ベクトル*は、マシンがデータを理解して処理するのに役立つ数値表現です。生成 AI では、2 つの主要な目的があります。
+ データ構造を圧縮形式でキャプチャする潜在スペースを表す
+ 単語、文、画像などのデータの埋め込みの作成

[Word2Vec](https://aws.amazon.com/what-is/embeddings-in-machine-learning/)、[GloVe](https://github.com/stanfordnlp/GloVe)、[Amazon Titan Text Embeddings](https://docs.aws.amazon.com/bedrock/latest/userguide/titan-embedding-models.html) などの埋め込みモデルは、*埋め込み*と呼ばれるプロセスを通じてデータをベクトルに変換します。これらの埋め込みモデルでは、以下を実行できます。
+ コンテキストから学び、単語をベクトルとして表現する
+ ベクトル空間に同様の単語を近づける
+ マシンが連続スペース内のデータを処理できるようにする

次の図は、埋め込みプロセスの概要を示しています。

1. [Amazon Simple Storage Service (Amazon S3) ](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html)バケットには、システムが情報を読み取って処理するデータソースであるファイルが含まれています。Amazon S3 バケットは[、Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html) ナレッジベース設定中に指定されます。これには、[ナレッジベースとのデータの同期](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-data-source-sync-ingest.html)も含まれます。

1. 埋め込みモデルは、Amazon S3 バケット内のオブジェクトファイルからの raw データをベクトル埋め込みに変換します。たとえば、 `Object1`は多次元空間内のコンテンツ`[0.6, 0.7, ...]`を表すベクトルに変換されます。

![埋め込みモデルは、Amazon S3 バケット内のオブジェクトをベクトル埋め込みに変換します。](http://docs.aws.amazon.com/ja_jp/prescriptive-guidance/latest/choosing-an-aws-vector-database-for-rag-use-cases/images/vector-databases.png)


自然言語処理 (NLP) では、以下を行うため、単語埋め込みが不可欠です。
+ 単語間のセマンティック関係をキャプチャする
+ コンテキストに関連するテキストの生成を有効にする
+ 大規模言語モデル (LLMs) を強化して人間のようなレスポンスを生成する