驗證使用 Snowball Edge 裝置傳輸的資料 - AWS Snowball 邊緣 開發人員指南

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

驗證使用 Snowball Edge 裝置傳輸的資料

接下來,您將找到如何 AWS Snowball 邊緣 驗證資料傳輸的資訊,以及您可以採取的手動步驟,以協助確保任務期間和之後的資料完整性。

當您使用 Amazon S3 介面將檔案從本機資料來源複製到 Snowball Edge 時,會建立多個檢查總和。這些檢查總和會用來在傳輸資料時自動驗證資料。

整體而言,系統會為每個檔案 (或為一部分的大型檔案) 建立這些檢查總和。對於 Snowball Edge,當您針對裝置上的儲存貯體執行下列 AWS CLI 命令時,即可看見這些檢查總和。檢查總和用於在整個傳輸過程中驗證資料的完整性,並協助確保正確複製您的資料。

aws s3api list-objects --bucket bucket-name --endpoint http://ip:8080 --profile edge-profile

當這些檢查總和不相符時,相關聯的資料不會匯入 Amazon S3。

本機檔案庫存和 Snowball Edge 資料周遊

使用 Amazon S3 轉接器或 CLI 時,建立複製到 Snowball Edge 的檔案的本機清查。本機庫存的內容可用來與本機儲存體或伺服器上的內容進行比較。

例如

aws s3 cp folder/ s3://bucket --recursive > inventory.txt

Snowball Edge 資料驗證錯誤的常見原因

發生驗證錯誤時,對應的資料 (檔案或大型檔案的一部分) 不會寫入目的地。以下是驗證錯誤的常見原因:

  • 嘗試複製符號連結。

  • 嘗試複製正在主動修改的檔案。嘗試的檢查總和驗證失敗,並標記為失敗的傳輸。

  • 嘗試複製大小大於 5 TB 的檔案。

  • 嘗試複製大於 2 GiB 的組件大小。

  • 嘗試將檔案複製到已處於完整資料儲存容量的 Snowball Edge 裝置。

  • 嘗試將檔案複製到未遵循 Amazon S3 物件金鑰命名準則的 Snowball Edge 裝置。

當這些驗證錯誤中的任何一個發生時,都會記錄。您可以採取步驟來手動識別哪些檔案未通過驗證及其原因。如需相關資訊,請參閱在匯入 Amazon S3 之後,手動驗證來自 Snowball Edge 裝置的資料

在匯入 Amazon S3 之後,手動驗證來自 Snowball Edge 裝置的資料

匯入任務完成後,您有幾個選項可手動驗證 Amazon S3 中的資料,如下所述。

檢查任務完成報告和相關聯的日誌

每當資料匯入或匯出至 Amazon S3 時,您都會取得可下載的 PDF 任務報告。若為匯入任務,此報告會在匯入程序結束時變成可用。如需詳細資訊,請參閱取得資料傳輸任務完成報告和日誌

S3 清查

如果您在多個任務中將大量資料傳輸到 Amazon S3,則瀏覽每個任務完成報告可能不會有效地利用時間。反之,您可以取得一或多個 Amazon S3 儲存貯體中所有物件的清查。Amazon S3 清查提供逗號分隔值 (CSV) 檔案,每天或每週顯示您的物件及其對應的中繼資料。此檔案涵蓋 Amazon S3 儲存貯體或共用字首的物件 (亦即名稱開頭為常見字串的物件)。

當您擁有已匯入資料的 Amazon S3 儲存貯體庫存時,您可以輕鬆地將其與您在來源資料位置上傳輸的檔案進行比較。如此一來,您就可以快速識別未傳輸的檔案。

使用 Amazon S3 同步命令

如果您的工作站可以連線至網際網路,您可以執行 AWS CLI 命令 ,對所有傳輸的檔案進行最終驗證aws s3 sync。此命令會同步目錄和 S3 字首。此命令會以遞迴的方式將新的和更新的檔案從來源目錄複製到目的地。如需詳細資訊,請參閱《 AWS CLI 命令參考》中的同步

重要

如果您指定本機儲存體做為此命令的目的地,請確定您有同步檔案的備份。這些檔案會被指定 Amazon S3 來源中的內容覆寫。