

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 사용자 데이터 전송을 위한 작업 생성
<a name="create-task-how-to"></a>

*작업은*가 데이터를 AWS DataSync 전송하는 위치와 방법을 설명합니다. 작업은 다음과 같이 구성됩니다.
+ [**소스 위치**](working-with-locations.md) - DataSync가 데이터를 전송하는 소스 스토리지 시스템 또는 서비스입니다.
+ [**대상 위치**](working-with-locations.md) - DataSync가 데이터를 전송하는 대상 스토리지 시스템 또는 서비스입니다.
+ [**작업 옵션**](task-options.md) - 전송할 파일, 데이터 확인 방법, 작업 실행 시기 등의 설정입니다.
+ [**태스크 실행**](run-task.md) - 태스크를 실행하는 것을 *태스크 실행*이라고 합니다.

## 작업 생성
<a name="create-task-steps"></a>

DataSync 작업을 생성할 때 소스 및 대상 위치를 지정합니다. 전송할 파일, 메타데이터 처리 방법, 일정 설정 등을 선택하여 작업을 사용자 지정할 수도 있습니다.

작업을 생성하기 전에 [DataSync 전송 방식](how-datasync-transfer-works.md#transferring-files)을 이해하고 [작업 할당량](datasync-limits.md#task-hard-limits)을 검토해야 합니다.

**중요**  
Amazon S3 위치와 데이터를 주고받을 계획이라면 시작하기 전에 [DataSync가 S3 요청 요금에 미치는 영향](create-s3-location.md#create-s3-location-s3-requests) 및 [DataSync 요금 페이지](https://aws.amazon.com/datasync/pricing/)를 검토하세요.

### DataSync 콘솔 사용
<a name="create-task-console"></a>

1. [https://console.aws.amazon.com/datasync/](https://console.aws.amazon.com/datasync/) AWS DataSync 콘솔을 엽니다.

1. 데이터를 전송 AWS 리전 하려는 중 하나에 있는지 확인합니다.

1. 왼쪽 탐색 창에서 **데이터 전송**을 확장한 다음 **작업**을 선택하고 **작업 생성**을 선택합니다.

1. **소스 위치 구성** 페이지에서 소스 위치를 [생성](transferring-data-datasync.md)하거나 선택하고 **다음**을 선택합니다.

1. **대상 위치 구성** 페이지에서 대상 위치를 [생성](transferring-data-datasync.md)하거나 선택하고 **다음**을 선택합니다.

1. (권장) **설정 구성** 페이지에서 작업에 기억할 수 있는 이름을 지정합니다.

1. **설정 구성** 페이지에서 작업 옵션을 선택하거나 기본 설정을 사용합니다.

   다음 옵션 중 일부에 관심이 있을 수 있습니다.
   + 사용할 [작업 모드](choosing-task-mode.md)를 지정합니다.
   + [매니페스트](transferring-with-manifest.md) 또는 [필터](filtering.md)를 사용하여 전송할 데이터를 지정합니다.
   + [파일 메타데이터를 처리](configure-metadata.md)하고 [데이터 무결성을 확인](configure-data-verification-options.md)하는 방법을 구성합니다.
   + [작업 보고서](task-reports.md) 또는 [Amazon CloudWatch](monitor-datasync.md)를 사용하여 전송을 모니터링합니다. 작업에 대한 일종의 모니터링을 설정하는 것이 좋습니다.

   완료했으면 **다음**을 선택합니다.

1. 작업 구성을 검토한 후 **작업 생성**을 선택합니다.

[작업을 시작](run-task.md)할 준비가 되었습니다.

### 사용 AWS CLI
<a name="create-task-cli"></a>

[DataSync 소스 및 대상 위치를 생성](transferring-data-datasync.md)하면 작업을 생성할 수 있습니다.

1.  AWS CLI 설정에서 데이터를 전송 AWS 리전 하려는 중 하나를 사용하고 있는지 확인합니다.

1. 다음 `create-task`명령을 복사합니다.

   ```
   aws datasync create-task \
     --source-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \
     --destination-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \
     --name "task-name"
   ```

1. `--source-location-arn`에서 소스 위치의 Amazon 리소스 이름(ARN)을 지정합니다.

1. `--destination-location-arn`에서 대상 위치의 ARN을 지정합니다.

    AWS 리전 또는 계정 간에 전송하는 경우 ARN에 다른 리전 또는 계정 ID가 포함되어 있는지 확인합니다.

1. (권장) `--name`에서 기억할 수 있는 작업의 이름을 지정합니다.

1. 필요에 따라 다른 작업 옵션을 지정합니다. 다음 옵션 중 일부에 관심이 있을 수 있습니다.
   + [매니페스트](transferring-with-manifest.md) 또는 [필터](filtering.md)를 사용하여 전송할 데이터를 지정합니다.
   + [파일 메타데이터를 처리](configure-metadata.md)하고 [데이터 무결성을 확인](configure-data-verification-options.md)하는 방법을 구성합니다.
   + [작업 보고서](task-reports.md) 또는 [Amazon CloudWatch](monitor-datasync.md)를 사용하여 전송을 모니터링합니다. 작업에 대한 일종의 모니터링을 설정하는 것이 좋습니다.

   자세한 옵션은 [create-task](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/datasync/create-task.html) 섹션을 참조하세요. 다음은 여러 옵션을 지정하는 예제 `create-task` 명령입니다.

   ```
   aws datasync create-task \
     --source-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \
     --destination-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \
     --cloud-watch-log-group-arn "arn:aws:logs:region:account-id" \
     --name "task-name" \
     --options VerifyMode=NONE,OverwriteMode=NEVER,Atime=BEST_EFFORT,Mtime=PRESERVE,Uid=INT_VALUE,Gid=INT_VALUE,PreserveDevices=PRESERVE,PosixPermissions=PRESERVE,PreserveDeletedFiles=PRESERVE,TaskQueueing=ENABLED,LogLevel=TRANSFER
   ```

1. `create-task` 명령을 실행합니다.

   명령이 성공하면 생성한 작업의 ARN을 보여주는 응답을 받게 됩니다. 예제:

   ```
   { 
       "TaskArn": "arn:aws:datasync:us-east-1:111222333444:task/task-08de6e6697796f026" 
   }
   ```

[작업을 시작](run-task.md)할 준비가 되었습니다.

## 태스크 상태
<a name="understand-task-creation-statuses"></a>

DataSync 작업을 생성할 때 상태를 확인하여 실행할 준비가 되었는지 확인할 수 있습니다.


| 콘솔 상태 | API 상태 | 설명 | 
| --- | --- | --- | 
| Available |  `AVAILABLE`  |  작업이 데이터 전송을 시작할 준비가 되었습니다.  | 
| 실행 |  `RUNNING`  | 작업 실행이 진행 중입니다. 자세한 내용은 [태스크 실행 상태](run-task.md#understand-task-execution-statuses) 단원을 참조하십시오. | 
|  Unavailable  |  `UNAVAILABLE`  |  태스크에 사용되는 DataSync 에이전트는 오프라인 상태입니다. 자세한 내용은 [에이전트가 오프라인 상태인 경우, 어떻게 해야 하나요?](troubleshooting-datasync-agents.md#troubleshoot-agent-offline) 섹션을 참조하세요.  | 
|  대기됨  |  `QUEUED`  |  동일한 DataSync 에이전트를 사용하는 다른 작업 실행이 진행 중입니다. 자세한 내용은 [작업이 대기열에 있는 시점 파악](run-task.md#queue-task-execution) 단원을 참조하십시오.  | 

## 여러 작업으로 대규모 데이터세트 파티셔닝
<a name="multiple-tasks-large-dataset"></a>

수백만 개의 파일 또는 객체 [마이그레이션](datasync-large-migration.md)과 같은 대규모 데이터 세트를 전송하는 경우 전송에 DataSync Enhanced 모드를 사용하는 것이 좋습니다.이 모드는 거의 무제한의 파일로 데이터 세트를 전송할 수 있습니다. 수십억 개의 파일이 있는 매우 큰 데이터 세트의 경우 여러 DataSync 작업으로 데이터 세트를 분할하는 것을 고려해야 합니다. 여러 작업(및 위치에 따라 [에이전트](do-i-need-datasync-agent.md#multiple-agents))에 데이터를 분할하면 DataSync가 데이터를 준비하고 전송하는 데 걸리는 시간을 줄일 수 있습니다.

여러 DataSync 작업에 걸쳐 대규모 데이터세트를 분할할 수 있는 몇 가지 방법을 고려하세요.
+ 개별 폴더를 전송하는 작업을 생성합니다. 예를 들어 소스 스토리지에서 각각 `/FolderA` 및 `/FolderB`를 대상으로 하는 두 개의 작업을 생성할 수 있습니다.
+ [매니페스트](transferring-with-manifest.md) 또는 [필터](filtering.md)를 사용하여 파일, 객체, 폴더의 하위 집합을 전송하는 작업을 생성합니다.

이러한 접근 방식으로 스토리지 시스템의 I/O 작업이 증가하고 네트워크 대역폭에 영향을 미칠 수 있다는 점에 유의하세요. 자세한 내용은 [How to accelerate your data transfers with DataSync scale out architectures](https://aws.amazon.com/blogs/storage/how-to-accelerate-your-data-transfers-with-aws-datasync-scale-out-architectures/)에 관한 블로그를 참조하세요.

## 여러 작업을 사용하여 전송된 데이터 분할
<a name="multiple-tasks-organize-transfer"></a>

서로 다른 데이터세트를 동일한 대상으로 전송하는 경우 전송하는 데이터를 분할하는 데 도움이 되는 여러 작업을 생성할 수 있습니다.

예를 들어 `MyBucket`이라는 동일한 S3 버킷으로 전송하는 경우 각 작업에 해당하는 다른 접두사를 버킷에 생성할수 있습니다. 이 접근 방식은 파일 이름이 데이터세트와 충돌하는 것을 방지하고 각 접두사에 대해 서로 다른 권한을 설정할 수 있습니다. 이를 설정하는 방법은 다음과 같습니다.

1. `task1`, `task2`, `task3`라는 이름의 대상 `MyBucket`에 세 개의 접두사를 생성합니다.
   + `s3://MyBucket/task1`
   + `s3://MyBucket/task2`
   + `s3://MyBucket/task3`

1. `task1`, `task2`, `task3`라는 이름의 DataSync 작업 세 개를 생성하여 `MyBucket`의 해당 접두사로 전송합니다.