データオンボーディング

1. 用語集

データエージェント – データ統合タスクの自動化に役立つ AI を活用したアシスタント
ソースフロー – ソースシステムからにデータをインポートするプロセス
データセット – のソースデータの構造化表現
S3 バケット – ソースデータファイルを含む Amazon S3 ストレージの場所
送信先 (変換) フロー – ソースデータ形式を正規データモデル (CDM) AWS 形式に変換するプロセス
CDM – が使用する標準化されたデータ構造である正規データモデル
データマッピング – ソースデータから CDM 構造にフィールドを一致させるプロセス

2. 目的

このガイドでは、データオンボーディングタスクの自動化と問題のトラブルシューティングに役立つ AI を活用したアシスタントである Data Agent を使用して、サプライチェーンデータをにオンボーディングするstep-by-stepについて説明します。

3. のデータオンボーディングとは

データオンボーディングは、既存のサプライチェーンデータをに統合するプロセスです。がデータを計画と予測に使用するには、の標準化されたデータ構造である正規データモデル (CDM) 内の構造化形式である必要があります。データオンボーディングは、フィールドを CDM エンティティにマッピングし、データ型と形式を変換し、データ品質を検証することで、ソースデータをこの形式に変換します。これにより、はソースデータに基づいて正確な予測と推奨事項を生成できます。

プロセス

データオンボーディングには次の 5 つのフェーズがあります。

準備: システムからソースデータを収集する (「」を参照前提条件)
アップロード: サプライチェーンデータを CSV ファイルとしてアップロードする
マップ: ソースデータセットを CDM 送信先データセットに、ソースフィールドを CDM エンティティに一致させる (たとえば、「item_number」フィールドを CDM の「product_id」にマッピングする)
検証: 品質チェックを実行し、データ問題を解決する

このプロセスを通じて、のデータエージェントは AI を活用したアシスタントデータオンボーディングアシスタントとして機能します。画面の左側に保持され、自然言語を使用して操作することで、次のようなデータオンボーディングタスクを自動化できます。

スキーマを検出: アップロードされたデータを自動的にスキャンして構造と関係を特定します
送信source-to-destinationマッピングを生成する: ソースデータを分析し、データに最適な CDM 送信先テーブルを提案します
SQL 変換クエリを作成する: ソースフィールドを CDM 送信先フィールドにマッピングする SQL を自動的に生成します
マッピングの理論的根拠を提供する: 重複するデータに基づいて特定のマッピングが提案された理由について説明します。
問題のトラブルシューティング: マッピングまたはデータロードが失敗した理由を特定し、特定の修正を推奨します
質問への回答: 概念を説明し、マッピングを明確にし、プロセス全体でガイダンスを提供します

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ユーザー割り当て

データの接続