翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データオンボーディング
1. 用語集
-
データエージェント – データ統合タスクの自動化に役立つ AI を活用したアシスタント
-
ソースフロー – ソースシステムから にデータをインポートするプロセス
-
データセット – のソースデータの構造化表現
-
S3 バケット – ソースデータファイルを含む Amazon S3 ストレージの場所
-
送信先 (変換) フロー – ソースデータ形式を正規データモデル (CDM) AWS 形式に変換するプロセス
-
CDM – が使用する標準化されたデータ構造である正規データモデル
-
データマッピング – ソースデータから CDM 構造にフィールドを一致させるプロセス
2. 目的
このガイドでは、データオンボーディングタスクの自動化と問題のトラブルシューティングに役立つ AI を活用したアシスタントである Data Agent を使用して、サプライチェーンデータを にオンボーディングするstep-by-stepについて説明します。
3. のデータオンボーディングとは
データオンボーディングは、既存のサプライチェーンデータを に統合するプロセスです。がデータを計画と予測に使用するには、 の標準化されたデータ構造である正規データモデル (CDM) 内の構造化形式である必要があります。データオンボーディングは、フィールドを CDM エンティティにマッピングし、データ型と形式を変換し、データ品質を検証することで、ソースデータをこの形式に変換します。これにより、 はソースデータに基づいて正確な予測と推奨事項を生成できます。
プロセス
データオンボーディングには次の 5 つのフェーズがあります。
-
準備: システムからソースデータを収集する (「」を参照前提条件)
-
アップロード: サプライチェーンデータを CSV ファイルとしてアップロードする
-
マップ: ソースデータセットを CDM 送信先データセットに、ソースフィールドを CDM エンティティに一致させる (たとえば、「item_number」フィールドを CDM の「product_id」にマッピングする)
-
検証: 品質チェックを実行し、データ問題を解決する
このプロセスを通じて、 のデータエージェントは AI を活用したアシスタントデータオンボーディングアシスタントとして機能します。画面の左側に保持され、自然言語を使用して操作することで、次のようなデータオンボーディングタスクを自動化できます。
-
スキーマを検出: アップロードされたデータを自動的にスキャンして構造と関係を特定します
-
送信source-to-destinationマッピングを生成する: ソースデータを分析し、データに最適な CDM 送信先テーブルを提案します
-
SQL 変換クエリを作成する: ソースフィールドを CDM 送信先フィールドにマッピングする SQL を自動的に生成します
-
マッピングの理論的根拠を提供する: 重複するデータに基づいて特定のマッピングが提案された理由について説明します。
-
問題のトラブルシューティング: マッピングまたはデータロードが失敗した理由を特定し、特定の修正を推奨します
-
質問への回答: 概念を説明し、マッピングを明確にし、プロセス全体でガイダンスを提供します