翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データの品質チェック
データ品質は、データクリーニングプロセスに不可欠であるものの、見過ごされがちな部分です。次の図は、データ品質チェックがデータエンジニアリングの自動化とアクセスコントロールのライフサイクルにどのように適合するかを示しています。
次の表は、ユースケースに基づくさまざまなデータ品質ソリューションの概要を示しています。
ユースケース |
解決策 |
例 |
列レベルまたはテーブルレベルの品質条件を追加するためのノーコードソリューション |
すべての列値が 1~12 の間であるか、テーブルまたは列が空かどうかを確認します |
|
列レベルまたはテーブルレベルの品質条件を追加するために AWS Glue ジョブまたはノーコードソリューション (プレビュー) に追加されたカスタムコード |
列 |
|
カスタムチェック |
AWS Lambda |
A 列の値が B 列と C 列の対応する値よりも常に大きいか、または |
メトリクスレポート、制約の検証、制約の提案を含む高度なソリューション |
列メトリクス |