View a markdown version of this page

ベクトルの概要 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ベクトルの概要

ベクトルは、マシンがデータを理解して処理するのに役立つ数値表現です。生成 AI では、2 つの主要な目的があります。

  • データ構造を圧縮形式でキャプチャする潜在スペースを表す

  • 単語、文、画像などのデータの埋め込みの作成

Word2VecGloVeAmazon Titan Text Embeddings などの埋め込みモデルは、埋め込みと呼ばれるプロセスを通じてデータをベクトルに変換します。これらの埋め込みモデルでは、以下を実行できます。

  • コンテキストから学び、単語をベクトルとして表現する

  • ベクトル空間に同様の単語を近づける

  • マシンが連続スペース内のデータを処理できるようにする

次の図は、埋め込みプロセスの概要を示しています。

  1. Amazon Simple Storage Service (Amazon S3) バケットには、システムが情報を読み取って処理するデータソースであるファイルが含まれています。Amazon S3 バケットは、Amazon Bedrock ナレッジベース設定中に指定されます。これには、ナレッジベースとのデータの同期も含まれます。

  2. 埋め込みモデルは、Amazon S3 バケット内のオブジェクトファイルからの raw データをベクトル埋め込みに変換します。たとえば、 Object1は多次元空間内のコンテンツ[0.6, 0.7, ...]を表すベクトルに変換されます。

埋め込みモデルは、Amazon S3 バケット内のオブジェクトをベクトル埋め込みに変換します。

自然言語処理 (NLP) では、以下を行うため、単語埋め込みが不可欠です。

  • 単語間のセマンティック関係をキャプチャする

  • コンテキストに関連するテキストの生成を有効にする

  • 大規模言語モデル (LLMs) を強化して人間のようなレスポンスを生成する