

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用資料分割加速遷移
<a name="datasync-large-migration-data-partitioning"></a>

使用大型遷移時，建議您使用多個 DataSync 任務來分割資料集。跨多個任務 （以及可能的客服人員） 分割來源資料可讓您平行處理傳輸並減少遷移時間軸。

分割也可協助您保持在 DataSync [配額](datasync-limits.md)內，並簡化任務的監控和偵錯。

下圖顯示如何使用多個 DataSync 任務和代理程式從相同的來源儲存位置傳輸資料。在此案例中，每個任務都著重於來源位置中的特定資料夾。如需這些方法的詳細資訊和範例，請參閱[如何使用向外 AWS DataSync 擴展架構加速資料傳輸](https://aws.amazon.com/blogs/storage/how-to-accelerate-your-data-transfers-with-aws-datasync-scale-out-architectures/)。

![圖表顯示使用 DataSync 分割來源資料以協助加速大型遷移的一種方法。](http://docs.aws.amazon.com/zh_tw/datasync/latest/userguide/images/datasync-partition-by-folder.png)


## 依資料夾或字首分割資料集
<a name="configure-task-by-folder"></a>

建立 DataSync 來源位置時，您可以指定 DataSync 讀取來源的資料夾、目錄或字首。例如，如果您要將檔案共享遷移至頂層目錄，您可以建立多個指定不同目錄路徑的位置。然後，您可以在遷移期間使用這些位置來執行多個 DataSync 任務。

## 使用篩選條件分割資料集
<a name="configure-task-with-filters"></a>

您可以套用[篩選條件](filtering.md)，以在傳輸中包含或排除來源位置中的資料。在大型遷移的情況下，篩選條件可協助您將任務範圍限定在資料集的特定部分。

例如，如果您要遷移依年份整理的封存資料，您可以建立包含篩選條件，以符合特定年份或多年。您也可以在每次執行任務時修改篩選條件，以符合不同的年份。

## 使用資訊清單分割資料集
<a name="configure-task-with-manifest"></a>

[資訊](transferring-with-manifest.md)清單是您希望 DataSync 傳輸的檔案或物件清單。透過資訊清單，DataSync 不需要讀取來源位置中的所有內容，即可判斷要傳輸的內容。

您可以從來源儲存體的庫存或透過事件驅動的方法建立資訊清單 （例如，請參閱[AWS DataSync 實作數億個物件](https://aws.amazon.com/blogs/storage/implementing-aws-datasync-with-hundreds-of-millions-of-objects/))。您也可以在每次啟動任務時使用不同的資訊清單，讓您使用相同的任務傳輸不同的資料集。