リアルタイムベクトル埋め込みブループリントを有効にする前の注意事項
Managed Service for Apache Flink アプリケーションは、入力ストリーム内の非構造化テキストまたは JSON データのみをサポートします。
2 つの入力処理モードがサポートされています。
入力データが非構造化テキストの場合、テキストメッセージ全体が埋め込まれます。ベクトル DB には、元のテキストと生成された埋め込みが含まれます。
入力データが JSON 形式の場合、アプリケーションでは、埋め込みプロセスに使用する JSON オブジェクト値内で 1 つ以上のキーを設定および指定できます。キーが複数ある場合、すべてのキーは一緒にベクトル化され、ベクトル DB でインデックスが作成されます。ベクトル DB には、元のメッセージと生成された埋め込みが含まれます。
埋め込み生成: アプリケーションは、Bedrock が提供するすべてのテキスト埋め込みモデルをサポートしています。
ベクトル DB ストアで保持する: アプリケーションは、埋め込みデータを保持するための送信先として、お客様のアカウント内の既存の OpenSearch クラスター (プロビジョニング済みまたはサーバーレス) を使用します。Opensearch Serverless を使用してベクトルインデックスを作成する場合は、常にベクトルフィールド名{ph3}を使用しますembedded_data。
MSF ブループリントと同様に、リアルタイムベクトル埋め込みブループリントに関連付けられたコードを実行するインフラストラクチャを管理することが期待されます。
MSF ブループリントと同様に、MSF アプリケーションが作成されると、コンソールまたは CLI を使用してAWSアカウントで排他的に起動する必要があります。 AWS は MSF アプリケーションを起動しません。アプリケーションを実行するには、 StartApplication API を (CLI またはコンソールを介して) 呼び出す必要があります。
データのクロスアカウント移動: アプリケーションでは、異なるAWSアカウントに存在する入力ストリームとベクトル送信先の間でデータを移動することはできません。