

더 이상 Amazon Machine Learning 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다. 자세한 내용은 [머신 러닝이란?](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html) 단원을 참조하세요.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 5단계: ML 모델을 사용하여 예측 생성
<a name="step-5-create-predictions"></a>

 Amazon Machine Learning(Amazon ML)은 배치 예측과 실시간 예측이라는 두 가지 유형의 예측을 생성할 수 있습니다.

*실시간 예측*은 ML이 온디맨드 방식으로 생성하는 단일 관측치에 대한 예측입니다. 실시간 예측은 결과를 대화식으로 사용해야 하는 모바일 앱, 웹 사이트 및 기타 애플리케이션에 적합합니다.

 *배치 예측*은 관측치 그룹에 대한 예측 집합입니다. Amazon ML은 레코드를 배치 예측으로 함께 처리하므로 처리에 다소 시간이 걸릴 수 있습니다. 배치 예측은 관측치 집합에 대한 예측이 필요한 애플리케이션이나 결과를 대화식으로 사용하지 않는 예측이 필요한 애플리케이션에 사용합니다.

이 자습서에서는 한 명의 잠재 고객이 신제품을 구독할지 여부를 예측하는 실시간 예측을 생성합니다. 또한 대규모 잠재 고객에 대한 예측도 생성할 수 있습니다. 배치 예측의 경우 [1단계: 데이터 준비](step-1-download-edit-and-upload-data.md)에서 업로드한 `banking-batch.csv` 파일을 사용하게 될 것입니다.

실시간 예측부터 시작해 보겠습니다.

**참고**  
실시간 예측이 필요한 애플리케이션의 경우 ML 모델을 위한 실시간 엔드포인트를 만들어야 합니다. 실시간 엔드포인트를 사용할 수 있는 동안 요금이 발생합니다. 실시간 예측을 사용하기 전에 실시간 엔드포인트를 만들지 않고도 웹 브라우저의 실시간 예측 기능을 사용해 볼 수 있습니다. 이것이 바로 이 개인 교습에서 우리가 할 일입니다.

**실시간 예측을 시도하려면**

1. **ML 모델 보고서** 탐색 창에서 **실시간 예측 시도**를 선택합니다.  
![\[Navigation pane with "Try real-time predictions" option circled in red.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/try-real-time-prediction-menu.png)

1. **레코드 붙여넣기**를 선택합니다.  
![\[Button labeled "Paste a record" highlighted in a web interface form.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/paste-a-record.png)

1. **레코드 붙여넣기** 대화 상자에서 다음 관측치를 붙여 넣습니다.

   ```
   32,services,divorced,basic.9y,no,unknown,yes,cellular,dec,mon,110,1,11,0,nonexistent,-1.8,94.465,-36.1,0.883,5228.1
   ```

1. **레코드 붙여넣기** 대화 상자에서 **제출**을 선택하여 이 관측치에 대한 예측을 생성할지 확인합니다. Amazon ML이 실시간 예측 양식에 값을 채워줍니다.  
![\[Table row showing 'age' attribute with Numeric type and Value of 32.0.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/value-column.png)
**참고**  
개별 값을 입력하여 **값** 필드를 채울 수도 있습니다. 어떤 방법을 선택하든 모델 학습에 사용되지 않은 관측치를 제공해야 합니다.

1. 페이지 하단에서 **예측 생성**을 선택합니다.

   예측이 오른쪽의 **예측 결과** 창에 표시됩니다. 이 예측에는 `0`의 **예측 레이블**이 붙어 있는데, 이는 이 잠재 고객이 캠페인에 반응할 가능성이 낮다는 것을 의미합니다. `1`의 **예측 레이블**은 고객이 캠페인에 반응할 가능성이 높다는 뜻입니다.  
![\[Prediction results showing binary ML model with predicted label 0 and score 0.033486433.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/real-time-result.png)

이제 배치 예측을 생성합니다. 사용 중인 ML 모델의 이름, 예측을 생성하려는 입력 데이터의 Amazon Simple Storage Service(Amazon S3) 위치(Amazon ML이 이 데이터로부터 배치 예측 데이터 소스를 생성함), 결과를 저장할 Amazon S3 위치를 Amazon ML에 제공하게 될 것입니다.

**배치 예측을 생성하려면**

1. **머신 러닝**을 선택한 다음 **배치 예측**을 선택합니다.  
![\[Amazon Machine Learning dropdown menu with Batch Predictions option highlighted.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image29.png)

1. **새 배치 예측 생성**을 선택합니다.

1. **배치 예측용 ML 모델** 페이지에서 **ML 모델: 은행 데이터 1**을 선택합니다.

   Amazon ML이 ML 모델 이름, ID, 생성 시간 및 관련 데이터 소스 ID를 표시합니다.

1. **계속**을 선택합니다.

1. 예측을 생성하려면 Amazon ML에 예측이 필요한 데이터를 제공해야 합니다. 이를 *입력 데이터*라고 합니다. 먼저 Amazon ML에서 액세스할 수 있도록 입력 데이터를 데이터 소스에 넣습니다.

   **입력 데이터 찾기**에서 **내 데이터가 S3에 있고, 데이터 소스를 생성해야 합니다**를 선택합니다.  
![\[Radio button options for locating input data, with the second option selected.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image31.png)

1. **데이터 소스 이름**에서 **Banking Data 2**를 입력합니다.

1. **S3 위치**에서 `banking-batch.csv` 파일: *your-bucket***/banking-batch.csv**의 전체 위치를 입력합니다.

1. **CSV의 첫 줄에 열 이름이 들어 있습니까?**에 대해, **예**를 선택합니다.

1. **확인**을 선택합니다.

   Amazon ML이 데이터의 위치를 검증합니다.

1. **계속**을 선택합니다.

1. **S3 목적지**에서 1단계: 데이터 준비에서 파일을 업로드했던 S3 위치의 이름을 입력합니다. Amazon ML이 여기에 예측 결과를 업로드합니다.

1. **배치 예측 이름**에 대해 기본값인 **Batch prediction: ML model: Banking Data 1**를 그대로 사용합니다. Amazon ML은 예측 생성에 사용할 모델을 기반으로 기본 이름을 선택합니다. 이 자습서에서는 학습 데이터 소스, `Banking Data 1`의 이름을 따서 모델 및 예측의 이름을 지정합니다.

1. **검토**를 선택합니다.

1. **S3 권한** 대화 상자에서 **예**를 선택합니다.  
![\[Dialog box asking to grant Amazon Machine Learning write permission on S3 location.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image32.png)

1. **검토** 페이지에서 **완료**를 선택합니다.

   배치 예측 요청이 Amazon ML로 전송되고 대기열로 들어갑니다. Amazon ML에서 배치 예측을 처리하는 데 걸리는 시간은 데이터 소스의 크기와 ML 모델의 복잡성에 따라 달라집니다. ML은 요청을 처리하는 동안 상태가 **진행 중**으로 보고됩니다. 배치 예측이 완료되면 요청 상태가 **완료됨**으로 변경됩니다. 이제 결과를 확인할 수 있습니다.

**예측을 확인하려면**

1. **머신 러닝**을 선택한 다음 **배치 예측**을 선택합니다.  
![\[Amazon Machine Learning dropdown menu showing options including Batch Predictions.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image33.png)

1. 예측 목록에서 **배치 예측: ML 모델: 은행 데이터 1**을 선택합니다. **배치 예측 정보** 페이지가 나타납니다.  
![\[Batch prediction details including name, ID, status, and associated data sources and models.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image34.png)

1. 배치 예측 결과를 확인하려면 S3 콘솔([https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/))로 이동하여 **출력 S3 URL** 필드에 참조된 S3 위치로 이동합니다. 여기에서 `s3://aml-data/batch-prediction/result`과 비슷한 이름을 가진 결과 폴더로 이동합니다.  
![\[AWS S3 console showing a single file in the batch-prediction result folder.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image35.png)

   예측은 확장자가.gz인 압축된.gzip 파일 형태로 저장됩니다.

1. 예측 파일을 데스크톱으로 다운로드하고 압축을 풀고 엽니다.  
![\[Table showing bestAnswer scores with numerical values ranging from 0.00046 to 0.30811.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image36.png)

   이 파일에는 **BestAnswer**와 **점수**라는 두 개의 열과 데이터 소스의 각 관측치에 대한 행이 있습니다. **최고응답** 열의 결과는 [4단계: ML 모델의 예측 성능 검토 및 점수 임계값 설정](step-4-review-model-and-set-cutoff.md)에서 설정했던 점수 임계값인 0.77을 기반으로 합니다. 0.77보다 큰 **점수**는 긍정 응답 또는 예측에 해당하는 **최고응답** 1이 되고, 0.77보다 작은 **점수**는 부정 응답 또는 예측에 해당하는 **최고응답** 0이 됩니다.

   다음 예에서는 점수 임계값인 0.77을 기반으로 한 긍정 예측과 부정 예측을 보여줍니다.

 긍정 예측: 

![\[Table showing bestAnswer score of 1 with a corresponding value of 0.822876.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image37.png)


이 예제에서 **최고응답**의 값은 1이고 **점수**의 값은 0.8228876입니다. **점수**가 점수 임계값인 0.77보다 크기 때문에 **최고응답**의 값은 1이 됩니다. **최고응답**이 1이면 고객이 제품을 구매할 가능성이 높다는 의미이므로 긍정 예측으로 간주됩니다.

 부정 예측: 

![\[Table showing bestAnswer score of 0 and a numerical score of 0.7693356.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image38.png)


 이 예제에서 **점수** 값이 0.7695356이고 점수 임계값인 0.77보다 작기 때문에 **최고응답**의 값이 0이 됩니다. **최고응답**가 0이면 고객이 제품을 구매할 가능성이 낮다는 의미이므로 부정 예측으로 간주됩니다.

배치 결과의 각 행은 배치 입력(데이터 소스의 관측치)의 행에 해당합니다.

예측을 분석한 후 타겟 마케팅 캠페인을 실행할 수 있습니다. 예를 들어 예측 점수가 `1`인 전단지를 모든 사람에게 발송할 수 있습니다.

이제 모델을 만들고, 검토하고, 사용했으니, [생성한 데이터와 AWS 리소스를 정리](step-6-clean-up.md)하여 불필요한 비용이 발생하지 않도록 하고 작업 공간을 깔끔하게 유지합니다.