データ転送のタスクモードの選択
AWS DataSync タスクは、次のいずれかのモードで実行できます。
-
拡張モード – 基本モードよりも高いパフォーマンスでオブジェクトを事実上無制限に転送します。拡張モードタスクは、データの一覧表示、準備、転送、検証を並行して行うことで、データ転送プロセスを最適化します。拡張モードは現在、Amazon S3 の場所間の転送、エージェントなしでの Azure Blob と Amazon S3 間の転送、エージェントなしでの他のクラウドと Amazon S3 間の転送に使用できます。
-
基本モード – AWS ストレージと他のサポートされているすべての DataSync の場所間でファイルまたはオブジェクトを転送します。基本モードタスクは、データセット内のファイル、オブジェクト、ディレクトリの数に対するクォータの対象となります。基本モードはデータの準備、転送、検証を順に実行するため、ほとんどのワークロードで拡張モードよりも速度は遅くなります。
タスクモードの違いを理解する
次の情報は、使用するタスクモードを決定するのに役立ちます。
| 機能 | 拡張モードの動作 | 基本モードの動作 |
|---|---|---|
| パフォーマンス | DataSync は、データの一覧表示、準備、転送、検証を並行して実行します。ほとんどのワークロード (大規模なオブジェクトの転送など) で基本モードよりも高いパフォーマンスを発揮します | DataSync は、データの準備、転送、検証を順に実行します。ほとんどのワークロードで、拡張モードよりもパフォーマンスが低くなります |
| DataSync がタスク実行ごとに操作できるデータセット内の項目の数 |
事実上無制限のオブジェクト数 |
クォータが適用される |
|
基本モードよりも多くのカウンターとメトリクス (DataSync が送信元の場所で検出したオブジェクトの数や、各タスクの実行中に準備されるオブジェクトの数など) |
拡張モードよりも少ないカウンターとメトリクス |
|
| 構造化ログ (JSON 形式) | 非構造化ログ | |
| 現在、Amazon S3 ロケーション間の転送、エージェントなしでの Azure Blob と Amazon S3 間の転送、エージェントなしで他のクラウドと Amazon S3 間の転送に使用可能。 |
DataSync がサポートするすべての場所間の転送に使用可能 |
|
| DataSync は転送されたデータのみを検証します | DataSync はデフォルトですべてのデータを検証します | |
| 帯域幅制限 | 該当しない | サポート |
| コスト | 詳細については、「AWS DataSync の料金 |
詳細については、「AWS DataSync の料金 |
| サポートされていないオブジェクトタグの障害の処理 | オブジェクトのタグ付けをサポートしていない場所とのクラウドストレージ転送の場合、ObjectTags オプションが指定されていないか、PRESERVE に設定されている場合、タスクの実行は即座に失敗します。 |
オブジェクトのタグ付けをサポートしていない場所とのクラウドストレージ転送の場合、タスクの実行は正常に実行されますが、ObjectTags オプションが指定されていない場合、または PRESERVE に設定されている場合、タグ付けされたオブジェクトのオブジェクトごとの障害が報告されます。 |
タスクモードの選択
拡張モードは、Amazon S3 の場所間の転送、エージェントなしでの Azure Blob と Amazon S3 間の転送、エージェントなしでの他のクラウドと Amazon S3 間の転送にのみ選択できます。それ以外の場合は、基本モードを使用する必要があります。例えば、オンプレミスの NFS の場所から S3 の場所への転送には、基本モードが必要です。
タスクのオプションとパフォーマンスは、選択したタスクモードによって異なる場合があります。タスクを作成すると、タスクモードを変更することはできません。
- 必要なアクセス許可
-
拡張モードタスクを作成するには、DataSync を使用している IAM ロールに
iam:CreateServiceLinkedRoleアクセス許可が必要です。DataSync ユーザーのアクセス許可については、AWSDataSyncFullAccess の使用を検討してください。これは、ユーザーに DataSync へのフルアクセスとその依存関係への最小限のアクセスを付与する AWS マネージドポリシーです。
https://console.aws.amazon.com/datasync/
で AWS DataSync コンソールを開きます。 左側のナビゲーションペインで [データ転送] を展開し、[タスク]、[タスクの作成] の順に選択します。
-
タスクのソースと送信先の場所を設定します。
詳細については、AWS DataSync のデータはどこに転送できますか?を参照してください。
-
タスクモードでは、以下のいずれかのオプションを選択します。
-
= 強化された
-
ベーシック
詳細については、「タスクモードの違いを理解する」を参照してください。
-
-
[設定の構成] ページにいる間、別のタスクオプションを選択するか、デフォルト設定を使用してください。
オプションは以下のとおりです。
-
ファイルメタデータを処理し、データ整合性を検証する方法を設定します。
-
タスクレポートまたは Amazon CloudWatch Logs を使用して転送をモニタリングします。
終了したら、[次へ] を選択します。
-
タスク構成を確認し、[Create task] を選択します。
-
AWS CLI 設定で、データ転送を計画しているAWS リージョンのいずれかを使用していることを確認してください。
-
次の
create-taskコマンドをコピーします。aws datasync create-task \ --source-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --destination-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --task-mode "ENHANCED-or-BASIC" -
--source-location-arnパラメータには、ソースの場所の Amazon リソースネーム (ARN) を指定します。 -
--destination-location-arnには、転送先の場所の ARN を指定します。AWS リージョンまたは アカウント間で転送する場合は、ARN に他のリージョンまたはアカウント ID が含まれていることを確認してください。
-
--task-modeにはENHANCEDまたはBASICを指定します。詳細については、「タスクモードの違いを理解する」を参照してください。
-
必要に応じて、他のタスクオプションを指定してください。オプションは以下のとおりです。
-
ファイルメタデータを処理し、データ整合性を検証する方法を設定します。
-
タスクレポートまたは Amazon CloudWatch Logs を使用して転送をモニタリングします。
その他のオプションについては、「create-task
」を参照してください。以下は、拡張モードとその他のいくつかのオプションを指定する create-taskコマンドの例です。aws datasync create-task \ --source-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --destination-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --name "task-name" \ --task-mode "ENHANCED" \ --options TransferMode=CHANGED,VerifyMode=ONLY_FILES_TRANSFERRED,ObjectTags=PRESERVE,LogLevel=TRANSFER -
create-taskコマンドを実行します。コマンドが成功すると、作成した場所の ARN を示す応答が返されます。例:
{ "TaskArn": "arn:aws:datasync:us-east-1:111222333444:task/task-08de6e6697796f026" }
CreateTask オペレーションで TaskMode パラメータを設定することで DataSync タスクモードを指定できます。