

더 이상 Amazon Machine Learning 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다. 자세한 내용은 [머신 러닝이란?](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html) 단원을 참조하세요.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon Machine Learning이란?
<a name="what-is-amazon-machine-learning"></a>

더 이상 Amazon Machine Learning(Amazon ML) 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다.

AWS 는 이제 Amazon SageMaker AI라는 강력한 클라우드 기반 서비스를 제공하므로 모든 기술 수준의 개발자가 기계 학습 기술을 사용할 수 있습니다. SageMaker AI는 강력한 기계 학습 모델을 생성하는 데 도움이 되는 완전 관리형 기계 학습 서비스입니다. SageMaker AI를 사용하면 데이터 과학자와 개발자가 기계 학습 모델을 구축 및 훈련한 다음 프로덕션 지원 호스팅 환경에 직접 배포할 수 있습니다.

자세한 내용은 [SageMaker AI 설명서를](https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html) 참조하세요.

**Topics**
+ [Amazon Machine Learning에 사용되는 주요 개념](amazon-machine-learning-key-concepts.md)
+ [머신 러닝에 액세스](accessing-amazon-machine-learning.md)
+ [지역 및 엔드포인트](regions-and-endpoints.md)
+ [Amazon EKS 요금](pricing.md)

# Amazon Machine Learning에 사용되는 주요 개념
<a name="amazon-machine-learning-key-concepts"></a>

 이 단원에서는 다음 주요 개념을 요약하고 Amazon ML에서 이들 개념이 어떻게 사용되는 지를 자세히 설명합니다.
+  [데이터 소스](#datasources)은 ML에 대한 데이터 입력과 관련된 메타데이터를 포함시킵니다.
+  [ML 모델](#ml-models)은 입력 데이터에서 추출한 패턴을 사용하여 예측을 생성합니다.
+  [평가](#evaluations)은 ML 모델의 품질을 측정합니다.
+  [배치 예측](#batch-predictions)은 여러 입력 데이터 관측치에 대한 예측을 *비동기적으로* 생성합니다.
+  [실시간 예측](#real-time-predictions)은 개별 데이터 관측치에 대한 예측을 *동기적으로* 생성합니다.

## 데이터 소스
<a name="datasources"></a>

 데이터 소스는 입력 데이터에 대한 메타데이터를 포함하고 있는 객체입니다. Amazon ML은 입력 데이터를 읽고, 해당 속성에 대한 설명 통계를 계산하고, 스키마 및 기타 정보와 함께 통계를 데이터 소스 객체의 일부로 저장합니다. 그 다음, Amazon ML은 데이터 소스를 사용하여 ML 모델을 학습 및 평가하고 배치 예측을 생성합니다.

**중요**  
 데이터 소스는 입력 데이터의 사본은 저장하지 않습니다. 대신 입력 데이터가 있는 Amazon S3 위치에 대한 참조를 저장합니다. Amazon S3 파일을 이동하거나 변경한 경우 Amazon ML은 이 파일에 액세스하거나 이를 사용하여 ML 모델을 생성하거나 평가를 생성하거나 예측을 생성할 수 없습니다.

 다음 표에는 데이터 소스와 관련된 용어가 정의되어 있습니다.


|  **용어**  |  **정의**  | 
| --- | --- | 
|  속성  |   관측치 내에서 고유하고 이름이 지정된 속성. 스프레드시트 또는 쉼표로 구분된 값(.csv) 파일과 같은 표 형식 데이터에서 열 헤더는 특성을 나타내며 행은 각 특성에 대한 값을 포함하고 있습니다.  동의어: 변수, 변수 이름, 필드, 열   | 
|  데이터 소스 이름  |  (선택 사항) 사람이 읽을 수 있는 데이터 소스 이름을 정의할 수 있습니다. 이러한 이름을 사용하면 Amazon ML 콘솔에서 데이터 소스를 찾고 관리할 수 있습니다. | 
|  입력 데이터  |  데이터 소스에서 참조하는 모든 관측치의 총칭. | 
|  위치  |  입력 데이터의 위치. 현재 Amazon ML은 Amazon S3 버킷, Amazon Redshift 데이터베이스 또는 Amazon Relational Database Service(RDS)의 MySQL 데이터베이스에 저장된 데이터를 사용할 수 있습니다. | 
|  관측치  |   단일 입력 데이터 단위. 예를 들어 사기 거래를 탐지하기 위한 ML 모델을 만드는 경우 입력 데이터는 각각 개별 거래를 나타내는 많은 관측치로 구성될 것입니다.  동의어: 레코드, 예제, 인스턴스, 행   | 
|  행 ID  |   (선택 사항) 입력 데이터에서 예측 출력에 포함시킬 속성을 식별하는 플래그(지정된 경우). 이 속성을 사용하면 어떤 예측이 어떤 관측치에 대응하는 지를 보다 쉽게 연결할 수 있습니다.  동의어: 행 식별자   | 
|  스키마  |  속성 이름 및 할당된 데이터 형식, 특수 속성의 이름 등을 포함하여 입력 데이터를 해석하는 데 필요한 정보. | 
|  Statistics  |   입력 데이터의 각 속성에 대한 요약 통계 이 통계는 다음 두 가지 목적을 위한 것입니다.  Amazon ML 콘솔은 데이터를 한 눈에 파악하고 불규칙성이나 오류를 식별할 수 있도록 그래프로 표시합니다.  Amazon ML은 학습 프로세스 중에 이를 사용하여 결과로 생성된 ML 모델의 품질을 개선합니다.  | 
|  상태 표시기  |  데이터 소스의 현재 상태(예: 진행 중, 완료됨, 실패)를 나타냅니다. | 
|  대상 속성  |   ML 모델 학습과 관련하여 대상 속성은 입력 데이터에서 "정답"이 포함된 속성의 이름을 식별합니다. Amazon ML은 이를 사용하여 입력 데이터에서 패턴을 발견하고 ML 모델을 생성합니다. 예측 평가 및 생성의 맥락에서 대상 속성이란 학습된 ML 모델을 통해 예측된 값을 가진 속성을 말합니다.  동의어: 대상   | 

## ML 모델
<a name="ml-models"></a>

 ML 모델은 데이터에서 패턴을 찾아 예측을 생성하는 수학적 모델입니다. Amazon ML은 바이너리 분류, 멀티클래스 분류 및 회귀라는 세 가지 유형의 ML 모델을 지원합니다.

 다음 표에는 데이터 품질과 관련된 용어가 정의되어 있습니다.


|  **용어**  |  **정의**  | 
| --- | --- | 
|  회귀  |  회귀 ML 모델 학습의 목표는 숫자 값을 예측하는 것입니다. | 
|  멀티클래스  |  멀티클래스 ML 모델 학습의 목표는 미리 정의된 제한적인 허용 값 집합에 속하는 값을 예측하는 것입니다. | 
|  바이너리  |  이진 ML 모델 학습의 목표는 true 또는 false와 같이 두 가지 상태 중 하나만 가질 수 있는 값을 예측하는 것입니다. | 
|  모델 크기  |  ML 모델은 패턴을 캡처하고 저장합니다. ML 모델이 저장하는 패턴이 많을수록 모델 크기는 더 커집니다. ML 모델 크기는 MB 단위로 설명됩니다. | 
|  전달 횟수  |  ML 모델을 학습할 때는 데이터 소스의 데이터를 사용합니다. 학습 프로세스에서 각 데이터 레코드를 두 번 이상 사용하는 것이 유용한 경우가 있습니다. Amazon ML에서 동일한 데이터 레코드를 사용하도록 허용한 횟수를 전달 횟수라고 합니다. | 
|  정규화  |  정규화란 고품질 모델을 얻는 데 사용할 수 있는 기계 학습 기법입니다. Amazon ML은 대부분의 경우에 잘 작동하는 기본 설정을 제공합니다. | 

## 평가
<a name="evaluations"></a>

 평가는 ML 모델의 품질을 측정하고 성능이 좋은지 판단합니다.

 다음 표에는 평가와 관련된 용어가 정의되어 있습니다.


|  **용어**  |  **정의**  | 
| --- | --- | 
|  모델 인사이트 정보  |  Amazon ML은 모델의 예측 성능을 평가하는 데 사용할 수 있는 지표와 다양한 인사이트 정보를 제공합니다. | 
|  AUC  |  ROC 곡선하면적(AUC)에서는 부정 예제보다 긍정 예제에 대해 더 높은 점수를 예측하는 모델의 기능을 측정합니다. | 
|  매크로 평균 F1 점수  |  매크로 평균 F1 점수는 멀티클래스 ML 모델의 예측 성능을 평가하는 데 사용됩니다. | 
|  RMSE  |  평균 제곱근 오차(RMSE)는 회귀 ML 모델의 예측 성능을 평가하는 데 사용되는 지표입니다. | 
|  커트라인  |  ML 모델은 숫자 예측 점수를 생성하는 방식으로 작동합니다. 시스템은 커트라인 값을 적용하여 이러한 점수를 0과 1 레이블로 변환합니다. | 
|  정확도  |  정확도는 올바른 예측의 백분율을 측정합니다. | 
|  정밀도  |  정밀도는 검색된 인스턴스(양수로 예측되는 인스턴스) 중 실제 양성이 확인된 인스턴스(거짓 긍정과 반대)의 비율을 나타냅니다. 즉, 선택한 항목 중 긍정에 해당하는 항목 수를 말합니다. | 
|  재현율  |  재현율은 관련 인스턴스의 총 수 중 실제 긍정의 비율(실제 긍정)을 나타냅니다. 즉, 선택된 긍정 항목의 수를 나타냅니다. | 

## 배치 예측
<a name="batch-predictions"></a>

 배치 예측은 한 번에 모두 실행할 수 있는 일련의 관측치에 대한 예측입니다. 이는 실시간 요구 사항이 없는 예측 분석에 적합합니다.

 다음 표에는 배치 예측과 관련된 용어가 정의되어 있습니다.


|  **용어**  |  **정의**  | 
| --- | --- | 
|  출력 위치  |  배치 예측의 결과는 S3 버킷 출력 위치에 저장됩니다. | 
|  매니페스트 파일  |  매니페스트 파일은 각 입력 데이터 파일을 관련 배치 예측 결과와 관련시킵니다. 이 파일은 S3 버킷 출력 위치에 저장됩니다. | 

## 실시간 예측
<a name="real-time-predictions"></a>

 실시간 예측은 대화형 웹, 모바일 또는 데스크톱 애플리케이션과 같이 지연 시간이 짧아야 하는 애플리케이션을 위한 것입니다. ML 모델에 지연 시간이 짧은 실시간 예측 API를 사용하여 실시간으로 예측을 쿼리할 수 있습니다.

 다음 표에는 실시간 예측과 관련된 용어가 정의되어 있습니다.


|  **용어**  |  **정의**  | 
| --- | --- | 
|  실시간 예측 API  |  실시간 예측 API는 요청 페이로드에서 단일 입력 관측치를 수용하고 응답에서 예측을 반환합니다. | 
|  실시간 예측 엔드포인트  |  ML 모델을 실시간 예측 API와 함께 사용하려면 실시간 예측 엔드포인트를 생성해야 합니다. 생성된 엔드포인트에는 실시간 예측을 요청하는 데 사용할 수 있는 URL이 포함됩니다. | 

# 머신 러닝에 액세스
<a name="accessing-amazon-machine-learning"></a>

ML은 다음 방법 중 하나를 사용하여 액세스할 수 있습니다.

**ML 콘솔**  
 ML 콘솔에 액세스하려면 [https://console.aws.amazon.com/rds/](https://console.aws.amazon.com/machinelearning/) 에서 관리 콘솔에 로그인한 후 ML 콘솔을 엽니다.

**CLI**  
 CLI를 설치 및 구성하는 방법에 대한 자세한 내용은 [AWS Command Line Interface 사용 설명서](https://docs.aws.amazon.com/cli/latest/userguide/)의 명령줄 인터페이스로 설정 단원을 참조하세요.

**Amazon MQ API**  
 MQ API에 대한 자세한 내용은 [ML API 참조](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_Operations.html) 단원을 참조하세요.

**SDK**  
 SDK에 대한 자세한 내용은 [웹 서비스용 도구](https://aws.amazon.com/tools/) 단원을 참조하세요.

# 지역 및 엔드포인트
<a name="regions-and-endpoints"></a>

Amazon Machine Learning(Amazon ML)은 다음 두 지역에서 실시간 예측 엔드포인트를 지원합니다.


| 지역명 | 지역 | 엔드포인트 | 프로토콜 | 
| --- | --- | --- | --- | 
| 미국 동부(버지니아 북부) | us-east-1 |  machinelearning.us-east-1.amazonaws.com  | HTTPS | 
| 유럽(아일랜드) | eu-west-1 | machinelearning.eu-west-1.amazonaws.com | HTTPS | 

모든 지역에서 데이터 세트를 호스팅하고, 모델을 학습 및 평가하고, 예측을 트리거할 수 있습니다.

모든 리소스를 동일한 지역에 보관하는 것이 좋습니다. 입력 데이터가 Amazon ML 리소스와 다른 지역에 있는 경우 지역 간 데이터 전송 요금이 발생합니다. 어느 지역에서든 실시간 예측 엔드포인트를 호출할 수 있지만 호출하는 엔드포인트가 없는 지역에서 엔드포인트를 호출하면 실시간 예측 지연 시간에 영향을 미칠 수 있습니다.

# Amazon EKS 요금
<a name="pricing"></a>

 AWS 서비스를 사용하면 사용한 만큼만 비용을 지불하면 됩니다. 최소 요금 및 선수금은 없습니다.

Amazon Machine Learning(Amazon ML)은 데이터 통계를 계산하고 모델을 학습 및 평가하는 데 사용된 컴퓨팅 시간에 대해 시간당 요금을 부과하며, 그 이후에는 애플리케이션에 대해 생성된 예측 수에 따라 비용을 지불하게 됩니다. 실시간 예측의 경우 모델 크기에 따라 시간당 예약 용량 요금도 지불합니다.

ML은 [ML 콘솔](https://console.aws.amazon.com/machinelearning/)에서만 예측 비용을 추정합니다.

ML 요금에 대한 자세한 내용은 [https://aws.amazon.com/machine-learning/pricing/](https://aws.amazon.com/machine-learning/pricing/) 단원을 참조하세요.

**Topics**
+ [배치 예측 비용 추정](#w2aab7c20c14)
+ [실시간 예측 비용 추정](#w2aab7c20c16)

## 배치 예측 비용 추정
<a name="w2aab7c20c14"></a>

배치 예측 생성 마법사를 사용하여 Amazon ML 모델에서 배치 예측을 요청하면 Amazon ML이 이들 예측의 비용을 추정합니다. 추정치를 계산하는 방법은 사용 가능한 데이터의 유형에 따라 달라집니다.

### 데이터 통계를 사용할 수 있는 경우의 배치 예측 비용 추정
<a name="w2aab7c20c14b4"></a>

Amazon ML이 예측 요청에 사용된 데이터 소스에 대한 요약 통계를 이미 계산했을 때 가장 정확한 예상 비용이 산출됩니다. 이러한 통계는 Amazon ML 콘솔을 사용하여 생성한 데이터 소스에 대해 항상 계산됩니다. API 사용자는 [CreateDataSourceFromS3](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromS3.html), [CreateDataSourceFromRedshift](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromRedshift.html) 또는 [CreateDataSourceFromRDS](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromRDS.html) API를 사용하여 프로그래밍 방식으로 데이터 소스를 생성할 때 `ComputeStatistics` 플래그를 `True`로 설정해야 합니다. 통계를 사용할 수 있으려면 데이터 소스가 `READY` 상태에 있어야 합니다.

Amazon ML이 계산하는 통계 중 하나는 데이터 레코드 수입니다. 데이터 레코드 수를 사용할 수 있는 경우 ML 배치 예측 생성 마법사는 데이터 레코드 수에 [배치 예측 요금](https://aws.amazon.com/machine-learning/pricing/)을 곱하여 예측 수를 추정합니다.

실제 비용은 다음과 같은 이유로 이 추정치와 다를 수 있습니다.
+ 일부 데이터 레코드는 처리에 실패할 수 있습니다. 실패한 데이터 레코드의 예측에 대해서는 요금이 청구되지 않습니다.
+ 추정치에는 기존에 존재하던 크레딧이나 AWS에서 적용한 기타 조정 사항이 고려되지 않습니다.

 ![\[Batch prediction results page showing estimated cost, ML fee, and S3 destination input.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image59b.png) 

### 데이터 크기만 사용할 수 있는 경우의 배치 예측 비용 추정
<a name="w2aab7c20c14b6"></a>

배치 예측을 요청했는데 요청 데이터 소스에 대한 데이터 통계를 사용할 수 없는 경우 Amazon ML은 다음을 기준으로 비용을 추정합니다.
+ 데이터 소스 검증 중에 계산되고 지속되는 총 데이터 크기
+ 평균 데이터 레코드 크기. Amazon ML이 데이터 파일의 처음 100MB를 읽고 파싱하여 추정한 데이터 레코드 크기

배치 예측 비용을 추정하기 위해 Amazon ML은 총 데이터 크기를 평균 데이터 레코드 크기로 나눕니다. 데이터 파일의 첫 번째 레코드가 평균 레코드 크기를 정확하게 나타내지 못할 수 있으므로 이 비용 예측 방법은 사용 가능한 데이터 레코드 수가 많을 때 사용되는 방법보다 정확하지 않습니다.

### 데이터 통계와 데이터 크기를 모두 사용할 수 없는 경우의 배치 예측 비용 추정
<a name="w2aab7c20c14b8"></a>

데이터 통계나 데이터 크기를 모두 사용할 수 없는 경우 Amazon ML이 배치 예측 비용을 추정하지 못합니다. 일반적으로 배치 예측을 요청하는 데 사용하는 데이터 소스가 Amazon ML에서 아직 검증되지 않은 경우가 여기에 해당됩니다. 이는 Amazon Redshift(Amazon Redshift) 또는 Amazon Relational Database Service(Amazon RDS) 쿼리를 기반으로 하는 데이터 소스를 생성했는데 데이터 전송이 아직 완료되지 않았거나 데이터 소스 생성이 계정에서 다른 작업 뒤에 대기하는 경우에 발생할 수 있습니다. 이 경우 Amazon ML 콘솔에서 배치 예측 요금을 알려줍니다. 추정치 없이 배치 예측 요청을 진행하거나, 예측에 사용되는 데이터 소스가 진행 중 또는 준비 상태가 된 후에 마법사를 취소하고 반환하도록 선택할 수 있습니다.

## 실시간 예측 비용 추정
<a name="w2aab7c20c16"></a>

Amazon ML 콘솔을 사용하여 실시간 예측 엔드포인트를 생성하면 예상 예약 용량 요금이 표시됩니다. 이 요금은 예측 처리를 위해 엔드포인트를 예약하는 데 드는 지속적인 요금입니다. 이 요금은 [서비스 요금 페이지](https://aws.amazon.com/machine-learning/pricing/)에 설명된 대로 모델 크기에 따라 달라집니다. 또한 표준 Amazon ML 실시간 예측 요금에 대한 안내도 받게 됩니다.

 ![\[Dialog box for creating a real-time endpoint with model details and pricing information.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image60b.png) 