本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
擷取行為變更
新的資料準備體驗在 SPICE 擷取期間處理資料品質問題的方式上引入了重要的變更。此變更會大幅影響資料集中的資料完整性和透明度。
在舊版體驗中,遇到資料類型不一致 (例如日期格式不正確或類似問題) 時,會在擷取期間略過包含有問題儲存格的整列。此方法會導致最終資料集中的資料列減少,進而可能遮蔽資料品質問題。
新的體驗會針對資料不一致採取更精細的方法。遇到有問題的儲存格時,只有不一致的值會轉換為 null 值,同時保留整個資料列。此保留可確保其他資料欄中的相關資料仍可供分析使用。
對資料集品質的影響
當來源資料包含不一致時,在新體驗中建立的資料集通常會包含比其傳統對等資料更多的資料列。此增強型方法提供數種優點:
-
透過保留所有資料列來改善資料完整性
-
識別資料品質問題的透明度更高
-
更好的修復問題值可見性
-
在不受影響的資料欄中保留相關資料
此變更可讓分析師更有效地識別和解決資料品質問題,而不是從資料集無提示地省略有問題的資料列。