抽出用のブループリントの作成

BDA を使用すると、ブループリントの作成時にドキュメントから抽出する特定のデータフィールドを定義できます。これは、検索する情報とその情報を解釈する方法について BDA をガイドする一連の指示として機能します。

最初に、employee_id や product_name など、抽出が必要な各フィールドのプロパティを作成できます。フィールドごとに、説明、データ型、推論タイプを指定する必要があります。

抽出するフィールドを定義するには、次のパラメータを指定する必要があります。

フィールド名: フィールドが表す内容についての人間が読み取れる説明を入力します。この説明は、フィールドのコンテキストと目的を理解して、データを正確に抽出するのに役立ちます。
指示: フィールドが表す内容についての自然言語での説明を入力します。この説明は、フィールドのコンテキストと目的を理解して、データを正確に抽出するのに役立ちます。
タイプ: フィールドの値のデータ型を指定します。BDA では、以下のデータ型がサポートされています。
- 文字列: テキストベースの値の場合
- 数値: 数値の場合
- ブール値: true/false 値の場合
- 配列: 同じタイプの複数の値を持つことができるフィールドの場合 (文字列の配列や数値の配列など)
推論タイプ: フィールドの値の抽出を処理する方法を BDA に指示します。サポートされている推論タイプは次のとおりです。
- 明示: BDA は、ドキュメントから直接値を抽出します。
- 推論: BDA は、ドキュメントに存在する情報に基づいて値を推測します。

すべてのパラメータを含むフィールド定義の例を次に示します。

この例では、以下のようになっています：

各フィールドにこれらのパラメータを指定することで、ドキュメントから目的のデータを正確に抽出して解釈するために必要な情報を BDA に提供します。

フィールド	手順	抽出タイプ	タイプ
ApplicantsName	申請者のフルネーム	明示的	string
DateOfBirth	従業員の生年月日	明示的	string
セールス	総収益または売上	明示的	数値
Statement_starting_balance	期首残高	明示的	数値