翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
取り込み動作の変更
新しいデータ準備エクスペリエンスでは、SPICE 取り込み中のデータ品質の問題の処理方法に重要な変更が導入されました。この変更は、データセットのデータの完全性と透明性に大きな影響を与えます。
レガシーエクスペリエンスでは、データ型の不整合 (誤った日付形式や同様の問題など) が発生した場合、問題のあるセルを含む行全体が取り込み中にスキップされます。このアプローチにより、最終データセットの行が少なくなり、データ品質の問題が不明瞭になる可能性があります。
新しいエクスペリエンスでは、データの不整合に対してより詳細なアプローチを取ります。問題のあるセルが発生すると、行全体を保持しながら、不整合な値のみが null 値に変換されます。この保存により、他の列の関連データが分析のために引き続きアクセスできるようになります。
データセットの品質への影響
新しいエクスペリエンスで作成されたデータセットには、ソースデータに不整合が含まれている場合、通常、レガシーのデータセットよりも多くの行が含まれます。この拡張アプローチには、いくつかの利点があります。
-
すべての行を保持することでデータの完全性を改善
-
データ品質の問題を特定する際の透明性の向上
-
修復のための問題のある値の可視性の向上
-
影響を受けていない列での関連データの保存
この変更により、アナリストは問題のある行をデータセットからサイレントに省略するのではなく、データ品質の問題をより効果的に特定して対処できます。