

Amazon Fraud Detector는 2025년 11월 7일부터 신규 고객에게 더 이상 공개되지 않습니다. Amazon Fraud Detector와 유사한 기능을 알아보려면 Amazon SageMaker, AutoGluon 및를 살펴보세요 AWS WAF.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 모델
<a name="create-model"></a>

Amazon Fraud Detector는 기계 학습 모델을 사용하여 사기 예측을 생성합니다. 각 모델은 *모델 유형을* 사용하여 훈련됩니다. 모델 유형은 모델 훈련에 사용되는 알고리즘과 변환을 지정합니다. 모델 훈련은 제공한 데이터 세트를 사용하여 사기 이벤트를 예측할 수 있는 모델을 생성하는 프로세스입니다.

모델을 생성하려면 먼저 모델 유형을 선택한 다음 모델 훈련에 사용할 데이터를 준비하고 제공해야 합니다.

# 모델 유형 선택
<a name="choosing-model-type"></a>

Amazon Fraud Detector에서 사용할 수 있는 모델 유형은 다음과 같습니다. 사용 사례에 적합한 모델 유형을 선택합니다.
+ **온라인 사기 인사이트**

  *Online Fraud Insights* 모델 유형은 평가 대상 엔터티에 대한 과거 데이터가 거의 없을 때 사기를 탐지하도록 최적화되어 있습니다. 예를 들어, 새 계정에 온라인으로 등록하는 신규 고객이 이에 해당합니다.
+ **트랜잭션 사기 인사이트**

  *Transaction Fraud Insights* 모델 유형은 평가 중인 엔터티에 예측 정확도를 개선하기 위해 모델이 분석할 수 있는 상호 작용 기록이 있을 수 있는 사기 사용 사례를 탐지하는 데 가장 적합합니다(예: 과거 구매 기록이 있는 기존 고객).
+ **계정 탈취 인사이트**

  *Account Takeover Insights* 모델 유형은 계정이 피싱 또는 다른 유형의 공격으로 인해 손상되었는지 감지합니다. 로그인 시 사용되는 브라우저 및 디바이스와 같이 손상된 계정의 로그인 데이터는 계정과 연결된 과거 로그인 데이터와 다릅니다.

# 온라인 사기 인사이트
<a name="online-fraud-insights"></a>

Online Fraud Insights는 지도 기계 학습 모델로, 사기 및 합법적인 거래의 과거 예를 사용하여 모델을 교육합니다. 온라인 사기 인사이트 모델은 적은 기록 데이터를 기반으로 사기를 탐지할 수 있습니다. 모델의 입력은 유연하므로 가짜 리뷰, 프로모션 침해, 게스트 체크아웃 사기 등 다양한 사기 위험을 탐지하도록 조정할 수 있습니다.

Online Fraud Insights 모델은 데이터 보강, 변환 및 사기 분류에 기계 학습 알고리즘 앙상블을 사용합니다. 모델 훈련 프로세스의 일환으로 Online Fraud Insights는 IP 주소 및 BIN 번호와 같은 원시 데이터 요소를 IP 주소의 지리적 위치 또는 신용 카드 발급 은행과 같은 타사 데이터로 보강합니다. 온라인 사기 인사이트는 타사 데이터 외에도 Amazon 및에서 관찰된 사기 패턴을 고려하는 딥 러닝 알고리즘을 사용합니다 AWS. 이러한 사기 패턴은 그라데이션 트리 부스팅 알고리즘을 사용하여 모델에 대한 입력 기능이 됩니다.

성능을 높이기 위해 Online Fraud Insights는 베이지안 최적화 프로세스를 통해 그라데이션 트리 부스팅 알고리즘의 하이퍼 파라미터를 최적화합니다. 다양한 모델 파라미터(예: 나무 수, 나무 깊이, 잎당 샘플 수)를 사용하여 수십 개의 다양한 모델을 순차적으로 훈련합니다. 또한 소수의 사기 집단을 확대하여 매우 낮은 사기 발생률을 처리하는 등 다양한 최적화 전략을 사용합니다.

## 데이터 소스 선택
<a name="selecting-training-data-source-OFI"></a>

Online Fraud Insights 모델을 훈련할 때 외부(Amazon Fraud Detector 외부)에 저장되거나 Amazon Fraud Detector 내에 저장된 이벤트 데이터에 대해 모델을 훈련하도록 선택할 수 있습니다. Amazon Fraud Detector는 현재 Amazon Simple Storage Service(Amazon S3)를 지원합니다. 에서 외부 스토리지를 사용하는 경우 이벤트 데이터 세트를 쉼표로 구분된 값(CSV) 형식으로 Amazon S3 버킷에 업로드해야 합니다. 이러한 데이터 스토리지 옵션을 모델 훈련 구성 내에서 EXTERNAL\$1EVENTS(외부 스토리지용) 및 INGESTED\$1EVENTS(내부 스토리지용)라고 합니다. 사용 가능한 데이터 소스와 해당 소스에 데이터를 저장하는 방법에 대한 자세한 내용은 섹션을 참조하세요[이벤트 데이터 스토리지](event-data-storage.md).

## 데이터 준비
<a name="preparing-training-data-OFI"></a>

이벤트 데이터(Amazon S3 또는 Amazon Fraud Detector)를 저장하는 위치에 관계없이 Online Fraud Insights 모델 유형에 대한 요구 사항은 동일합니다.

데이터 세트에는 EVENT\$1LABEL 열 헤더가 포함되어야 합니다. 이 변수는 이벤트를 사기 또는 합법적인 것으로 분류합니다. CSV 파일(외부 스토리지)을 사용하는 경우 파일의 각 이벤트에 EVENT\$1LABEL을 포함해야 합니다. 내부 스토리지의 경우 EVENT\$1LABEL 필드는 선택 사항이지만 훈련 데이터 세트에 포함되도록 모든 이벤트에 레이블을 지정해야 합니다. 모델 훈련을 구성할 때 레이블이 지정되지 않은 이벤트를 무시할지, 레이블이 지정되지 않은 이벤트에 대해 합법적인 레이블을 맡을지, 레이블이 지정되지 않은 모든 이벤트에 대해 사기성 레이블을 맡을지 선택할 수 있습니다.

## 데이터 선택
<a name="selecting-training-data-OFI"></a>

온라인 사기 인사이트 모델 훈련을 위한 데이터 선택에 대한 자세한 내용은 [이벤트 데이터 수집](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#gather-event-data)을 참조하세요.

온라인 사기 인사이트 훈련은 EVENT\$1TIMESTAMP를 기반으로 과거 데이터를 샘플링하고 분할합니다. 데이터를 수동으로 샘플링할 필요가 없으며 그렇게 하면 모델 결과에 부정적인 영향을 미칠 수 있습니다.

## 이벤트 변수
<a name="input-variables-OFI"></a>

Online Fraud Insights 모델에는 필요한 이벤트 메타데이터를 제외하고 모델 훈련을 위한 [데이터 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 통과하고 모델당 최대 100개의 변수를 허용하는 최소 2개의 변수가 필요합니다. 일반적으로 변수를 많이 제공할수록 모델이 사기와 합법적인 이벤트를 더 잘 구별할 수 있습니다. Online Fraud Insights 모델은 사용자 지정 변수를 포함한 수십 개의 변수를 지원할 수 있지만 이러한 변수는 일반적으로 평가 중인 개체를 식별하는 데 가장 효과적이므로 IP 주소와 이메일 주소를 포함하는 것이 좋습니다.

## 데이터 검증
<a name="training-data-validations-OFI"></a>

교육 프로세스의 일환으로 Online Fraud Insights는 데이터 세트에서 모델 교육에 영향을 미칠 수 있는 데이터 품질 문제를 검증합니다. 데이터를 검증한 후 Amazon Fraud Detector는 가능한 최상의 모델을 구축하기 위해 적절한 조치를 취합니다. 여기에는 잠재적 데이터 품질 문제에 대한 경고 실행, 데이터 품질 문제가 있는 변수 자동 제거 또는 오류 실행 및 모델 훈련 프로세스 중지가 포함됩니다. 자세한 내용은 [데이터 세트 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 참조하세요.

# 트랜잭션 사기 인사이트
<a name="transaction-fraud-insights"></a>

Transaction Fraud Insights 모델 유형은 온라인 또는 card-not-present 거래 사기를 탐지하도록 설계되었습니다. Transaction Fraud Insights는 지도 기계 학습 모델로, 사기 및 합법적인 거래의 과거 예를 사용하여 모델을 교육합니다.

Transaction Fraud Insights 모델은 데이터 보강, 변환 및 사기 분류에 기계 학습 알고리즘 앙상블을 사용합니다. 특성 엔지니어링 엔진을 활용하여 개체 수준 및 이벤트 수준 집계를 생성합니다. 모델 훈련 프로세스의 일환으로 Transaction Fraud Insights는 IP 주소 및 BIN 번호와 같은 원시 데이터 요소를 IP 주소의 지리적 위치 또는 신용 카드 발급 은행과 같은 타사 데이터로 보강합니다. 서드 파티 데이터 외에도 Transaction Fraud Insights는 Amazon에서 관찰된 사기 패턴을 고려하는 딥 러닝 알고리즘을 사용하며 AWS , 이러한 사기 패턴은 그라데이션 트리 부스팅 알고리즘을 사용하여 모델에 입력 기능이 됩니다.

성능을 높이기 위해 Transaction Fraud Insights는 베이지안 최적화 프로세스를 통해 그라데이션 트리 부스팅 알고리즘의 하이퍼 파라미터를 최적화하고, 다양한 모델 파라미터(예: 나무 수, 나무 깊이, 잎당 샘플 수)와 매우 낮은 사기율을 처리하기 위해 소수의 사기 집단에 가중치를 부여하는 등의 다양한 최적화 전략을 사용하여 수십 가지 모델을 순차적으로 훈련합니다.

모델 훈련 프로세스의 일환으로 트랜잭션 사기 모델의 특성 엔지니어링 엔진은 훈련 데이터 세트 내의 각 고유 개체에 대한 값을 계산하여 사기 예측을 개선합니다. 예를 들어 훈련 프로세스 중에 Amazon Fraud Detector는 개체가 마지막으로 구매한 시간을 계산 및 저장하고 `GetEventPrediction` 또는 `SendEvent` API를 호출할 때마다이 값을 동적으로 업데이트합니다. 사기 예측 중에 이벤트 변수는 다른 개체 및 이벤트 메타데이터와 결합되어 트랜잭션이 사기인지 여부를 예측합니다.

## 데이터 소스 선택
<a name="selecting-training-data-source-TFI"></a>

Transaction Fraud Insights 모델은 Amazon Fraud Detector(INGESTED\$1EVENTS)를 사용하여 내부적으로 저장된 데이터 세트에 대해서만 훈련됩니다. 이를 통해 Amazon Fraud Detector는 평가 중인 개체에 대해 계산된 값을 지속적으로 업데이트할 수 있습니다. 사용 가능한 데이터 소스에 대한 자세한 내용은 섹션을 참조하세요. [이벤트 데이터 스토리지](event-data-storage.md) 

## 데이터 준비
<a name="preparing-training-data-TFI"></a>

Transaction Fraud Insights 모델을 훈련하기 전에 [이벤트 데이터 세트 준비](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#prepare-event-dataset)에 언급된 대로 데이터 파일에 모든 헤더가 포함되어 있는지 확인합니다. Transaction Fraud Insights 모델은 수신된 새 엔터티를 데이터 세트의 사기 및 합법적인 엔터티의 예와 비교하므로 각 엔터티에 여러 예제를 제공하는 것이 좋습니다.

Amazon Fraud Detector는 저장된 이벤트 데이터 세트를 훈련을 위한 올바른 형식으로 자동 변환합니다. 모델이 훈련을 완료한 후 성능 지표를 검토하고 훈련 데이터 세트에 개체를 추가해야 하는지 여부를 결정할 수 있습니다.

## 데이터 선택
<a name="selecting-training-data-TFI"></a>

기본적으로 Transaction Fraud Insights는 선택한 이벤트 유형에 대해 저장된 전체 데이터 세트를 훈련합니다. 선택적으로 시간 범위를 설정하여 모델 훈련에 사용되는 이벤트를 줄일 수 있습니다. 시간 범위를 설정할 때 모델 훈련에 사용되는 레코드가 충분히 성숙할 시간을 가졌는지 확인합니다. 즉, 합법적인 레코드와 사기 레코드를 올바르게 식별할 수 있는 충분한 시간이 지났습니다. 예를 들어, 차지백 사기의 경우 사기 이벤트를 올바르게 식별하는 데 60일 이상이 걸리는 경우가 많습니다. 최상의 모델 성능을 위해 훈련 데이터 세트의 모든 레코드가 성숙해야 합니다.

이상적인 사기 발생률을 나타내는 시간 범위를 선택할 필요가 없습니다. Amazon Fraud Detector는 데이터를 자동으로 샘플링하여 사기 발생률, 시간 범위 및 엔터티 수 간의 균형을 맞춥니다.

Amazon Fraud Detector는 모델을 성공적으로 훈련할 이벤트가 충분하지 않은 시간 범위를 선택하면 모델 훈련 중에 검증 오류를 반환합니다. 저장된 데이터 세트의 경우 EVENT\$1LABEL 필드는 선택 사항이지만 훈련 데이터 세트에 포함하려면 이벤트에 레이블을 지정해야 합니다. 모델 훈련을 구성할 때 레이블이 지정되지 않은 이벤트를 무시할지, 레이블이 지정되지 않은 이벤트에 대한 합법적인 레이블을 맡을지, 레이블이 지정되지 않은 이벤트에 대한 사기성 레이블을 맡을지 선택할 수 있습니다.

## 이벤트 변수
<a name="input-variables-TFI"></a>

모델을 훈련하는 데 사용되는 이벤트 유형은 필수 이벤트 메타데이터를 제외하고 [데이터 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 통과하고 최대 100개의 변수를 포함할 수 있는 최소 2개의 변수를 포함해야 합니다. 일반적으로 변수를 많이 제공할수록 모델이 사기와 합법적인 이벤트를 더 잘 구별할 수 있습니다. Transaction Fraud Insight 모델은 사용자 지정 변수를 비롯한 수십 가지 변수를 지원할 수 있지만 IP 주소, 이메일 주소, 결제 수단 유형, 주문 가격 및 카드 BIN을 포함하는 것이 좋습니다.

## 데이터 검증
<a name="training-data-validations-TFI"></a>

훈련 프로세스의 일환으로 Transaction Fraud Insights는 훈련 데이터 세트에서 모델 훈련에 영향을 미칠 수 있는 데이터 품질 문제를 검증합니다. 데이터를 검증한 후 Amazon Fraud Detector는 가능한 최상의 모델을 구축하기 위해 적절한 조치를 취합니다. 여기에는 잠재적 데이터 품질 문제에 대한 경고 실행, 데이터 품질 문제가 있는 변수 자동 제거 또는 오류 실행 및 모델 훈련 프로세스 중지가 포함됩니다. 자세한 내용은 [데이터 세트 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 참조하세요.

Amazon Fraud Detector는 경고를 표시하지만 고유한 개체 수가 1,500개 미만인 경우 모델을 계속 훈련합니다. 이는 훈련 데이터의 품질에 영향을 미칠 수 있기 때문입니다. 경고가 표시되면 [성능 지표](training-performance-metrics.md)를 검토합니다.

# 계정 탈취 인사이트
<a name="account-takeover-insights"></a>

계정 탈취 인사이트(ATI) 모델 유형은 악의적인 탈취, 피싱 또는 도난당한 자격 증명으로 인해 계정이 손상되었는지 감지하여 사기 온라인 활동을 식별합니다. Account Takeover Insights는 온라인 비즈니스의 로그인 이벤트를 사용하여 모델을 교육하는 기계 학습 모델입니다.

실시간 로그인 흐름 내에 훈련된 Account Takeover Insights 모델을 포함하여 계정이 손상되었는지 감지할 수 있습니다. 모델은 다양한 인증 및 로그인 유형을 평가합니다. 여기에는 웹 애플리케이션 로그인, API 기반 인증 및 single-sign-on)가 포함됩니다. Account Takeover Insights 모델을 사용하려면 유효한 로그인 자격 증명이 제공된 후 [GetEventPrediction](https://docs.aws.amazon.com/frauddetector/latest/api/API_GetEventPrediction.html) API를 호출합니다. API는 계정이 손상될 위험을 정량화하는 점수를 생성합니다. Amazon Fraud Detector는 사용자가 정의한 점수와 규칙을 사용하여 로그인 이벤트에 대한 하나 이상의 결과를 반환합니다. 결과는 구성한 결과입니다. 수신한 결과에 따라 각 로그인에 대해 적절한 조치를 취할 수 있습니다. 즉, 로그인에 대해 제공된 자격 증명을 승인하거나 챌린지할 수 있습니다. 예를 들어 추가 확인으로 계정 PIN을 요청하여 자격 증명에 문제를 일으킬 수 있습니다.

Account Takeover Insights 모델을 사용하여 계정 로그인을 비동기적으로 평가하고 고위험 계정에 대해 조치를 취할 수도 있습니다. 예를 들어, 고위험 계정을 조사 대기열에 추가하여 인적 검토자가 계정 일시 중지와 같은 추가 조치를 취해야 하는지 여부를 결정할 수 있습니다.

Account Takeover Insights 모델은 비즈니스의 과거 로그인 이벤트가 포함된 데이터 세트를 사용하여 훈련됩니다. 이 데이터를 제공합니다. 필요에 따라 계정에 합법적인 또는 사기적인 레이블을 지정할 수 있습니다. 그러나 모델을 훈련하는 데는 필요하지 않습니다. Account Takeover Insights 모델은 계정의 성공적인 로그인 기록을 기반으로 이상을 감지합니다. 또한 악의적인 계정 탈취 이벤트의 위험 증가를 암시하는 사용자 동작의 이상을 탐지하는 방법을 알아봅니다. 예를 들어 일반적으로 동일한 디바이스 및 IP 주소 집합에서 로그인하는 사용자입니다. 사기범은 일반적으로 다른 디바이스 및 지리적 위치에서 로그인합니다. 이 기법은 일반적으로 악성 계정 탈취의 주요 특성인 비정상적인 활동의 위험 점수를 생성합니다.

Account Takeover Insights 모델을 훈련하기 전에 Amazon Fraud Detector는 기계 학습 기법의 조합을 사용하여 데이터 보강, 데이터 집계 및 데이터 변환을 수행합니다. 그런 다음 훈련 프로세스 중에 Amazon Fraud Detector는 사용자가 제공하는 원시 데이터 요소를 보강합니다. 원시 데이터 요소의 예로는 IP 주소 및 사용자 에이전트가 있습니다. Amazon Fraud Detector는 이러한 요소를 사용하여 로그인 데이터를 설명하는 추가 입력을 생성합니다. 이러한 입력에는 디바이스, 브라우저 및 지리적 위치 입력이 포함됩니다. 또한 Amazon Fraud Detector는 사용자가 제공한 로그인 데이터를 사용하여 과거 사용자 동작을 설명하는 집계된 변수를 지속적으로 계산합니다. 사용자 동작의 예로는 사용자가 특정 IP 주소에서 로그인한 횟수가 있습니다. Amazon Fraud Detector는 이러한 추가 보강 및 집계를 사용하여 로그인 이벤트의 작은 입력 세트에서 강력한 모델 성능을 생성할 수 있습니다.

Account Takeover Insights 모델은 악의적인 행위자가 인간이든 로봇이든 상관없이 악의적인 행위자가 합법적인 계정에 액세스하는 인스턴스를 감지합니다. 모델은 계정 손상의 상대적 위험을 나타내는 단일 점수를 생성합니다. 손상되었을 수 있는 계정은 고위험 계정으로 플래그가 지정됩니다. 두 가지 방법 중 하나로 고위험 계정을 처리할 수 있습니다. 어느 쪽이든 추가 자격 증명 확인을 적용할 수 있습니다. 또는 수동 조사를 위해 계정을 대기열로 보낼 수 있습니다.

## 데이터 소스 선택
<a name="selection-training-data-source-ATI"></a>

Account Takeover Insights 모델은 Amazon Fraud Detector에 내부적으로 저장된 데이터 세트에 대해 훈련됩니다. Amazon Fraud Detector로 로그인 이벤트 데이터를 저장하려면 사용자의 로그인 이벤트가 포함된 CSV 파일을 생성합니다. 각 이벤트에 대해 이벤트 타임스탬프, 사용자 ID, IP 주소, 사용자 에이전트, 로그인 데이터가 유효한지 여부와 같은 로그인 데이터를 포함합니다. CSV 파일을 생성한 후 먼저 파일을 Amazon Fraud Detector에 업로드한 다음 가져오기 기능을 사용하여 데이터를 저장합니다. 그런 다음 저장된 데이터를 사용하여 모델을 훈련할 수 있습니다. Amazon Fraud Detector를 사용하여 이벤트 데이터 세트를 저장하는 방법에 대한 자세한 내용은 섹션을 참조하세요. [Amazon Fraud Detector를 사용하여 이벤트 데이터를 내부적으로 저장](storing-event-data-afd.md) 

## 데이터 준비
<a name="preparing-training-data-ATI"></a>

Amazon Fraud Detector를 사용하려면 사용자 계정 로그인 데이터를 UTF-8 형식으로 인코딩된 쉼표로 구분된 값(CSV) 파일로 제공해야 합니다. CSV 파일의 첫 번째 줄에는 파일 헤더가 포함되어야 합니다. 파일 헤더는 각 데이터 요소를 설명하는 이벤트 메타데이터와 이벤트 변수로 구성됩니다. 이벤트 데이터는 헤더를 따릅니다. 이벤트 데이터의 각 줄은 단일 로그인 이벤트의 데이터로 구성됩니다.

Accounts Takeover Insights 모델의 경우 CSV 파일의 헤더 라인에 다음 이벤트 메타데이터 및 이벤트 변수를 제공해야 합니다.

** 이벤트 메타데이터**

CSV 파일 헤더에 다음 메타데이터를 제공하는 것이 좋습니다. 이벤트 메타데이터는 대문자여야 합니다.
+ EVENT\$1ID - 로그인 이벤트의 고유 식별자입니다.
+ ENTITY\$1TYPE - 판매자 또는 고객과 같이 로그인 이벤트를 수행하는 엔터티입니다.
+ ENTITY\$1ID - 로그인 이벤트를 수행하는 개체의 식별자입니다.
+ EVENT\$1TIMESTAMP - 로그인 이벤트가 발생한 타임스탬프입니다. 타임스탬프는 UTC의 ISO 8601 표준이어야 합니다.
+ EVENT\$1LABEL(권장) - 이벤트를 사기성 또는 합법적인 것으로 분류하는 레이블입니다. "사기", "권한", "1" 또는 "0"과 같은 모든 레이블을 사용할 수 있습니다.

**참고**  
이벤트 메타데이터는 대문자여야 합니다. 대/소문자를 구분합니다.
로그인 이벤트에는 레이블이 필요하지 않습니다. 그러나 EVENT\$1LABEL 메타데이터를 포함하고 로그인 이벤트에 대한 레이블을 제공하는 것이 좋습니다. 레이블이 불완전하거나 산발적인 경우에도 괜찮습니다. 레이블을 제공하면 Amazon Fraud Detector는 레이블을 사용하여 계정 탈취 검색 속도를 자동으로 계산하고 모델 성능 차트 및 테이블에 표시합니다.

** 이벤트 변수**

Accounts Takeover Insights 모델의 경우 제공해야 하는 필수(필수) 변수와 선택적 변수가 모두 있습니다. 변수를 생성할 때 변수를 올바른 변수 유형에 할당해야 합니다. 모델 훈련 프로세스의 일환으로 Amazon Fraud Detector는 변수와 연결된 변수 유형을 사용하여 변수 보강 및 기능 엔지니어링을 수행합니다.

**참고**  
이벤트 변수 이름은 소문자여야 합니다. 대/소문자를 구분합니다.

**필수 변수**

Accounts Takeover Insights 모델을 훈련하려면 다음 변수가 필요합니다.


| 카테고리 | 변수 유형 | 설명 | 
| --- | --- | --- | 
| IP 주소 | IP\$1ADDRESS | 로그인 이벤트에 사용되는 IP 주소 | 
| 브라우저 및 디바이스 | USERAGENT | 로그인 이벤트에 사용되는 브라우저, 디바이스 및 OS | 
| 유효한 자격 증명 | VALIDCRED | 로그인에 사용된 자격 증명이 유효한지 여부를 나타냅니다. | 

**선택적 변수**

다음 변수는 Accounts Takeover Insights 모델을 훈련할 때 선택 사항입니다.


| 카테고리 | Type | 설명 | 
| --- | --- | --- | 
| 브라우저 및 디바이스 | 지문 | 브라우저 또는 디바이스 지문의 고유 식별자 | 
| 세션 ID | SESSION\$1ID | 인증 세션의 식별자입니다. | 
| Label | EVENT\$1LABEL | 이벤트를 사기 또는 합법적인 것으로 분류하는 레이블입니다. "사기", "권한", "1" 또는 "0"과 같은 모든 레이블을 사용할 수 있습니다. | 
| 타임스탬프 | LABEL\$1TIMESTAMP | 레이블이 마지막으로 업데이트된 타임스탬프입니다. EVENT\$1LABEL이 제공된 경우 필요합니다. | 

**참고**  
두 필수 변수의 선택적 변수에 모든 변수 이름을 제공할 수 있습니다. 각 필수 및 선택적 변수를 올바른 변수 유형에 할당하는 것이 중요합니다.
추가 변수를 제공할 수 있습니다. 그러나 Amazon Fraud Detector에는 Accounts Takeover Insights 모델 훈련을 위한 이러한 변수가 포함되지 않습니다.

## 데이터 선택
<a name="selecting-training-data-ATI"></a>

데이터 수집은 Account Takeover Insights 모델을 생성하는 데 중요한 단계입니다. 로그인 데이터를 수집하기 시작할 때 다음 요구 사항 및 권장 사항을 고려하세요.

**필수**
+ 각각 2개 이상의 연결된 로그인 이벤트가 있는 1,500개 이상의 사용자 계정 예제를 제공합니다.
+ 데이터 세트는 최소 30일의 로그인 이벤트를 포함해야 합니다. 나중에 모델을 훈련하는 데 사용할 이벤트의 특정 시간 범위를 지정할 수 있습니다.

**권장**
+ 데이터 세트에는 실패한 로그인 이벤트의 예가 포함되어 있습니다. 이러한 실패한 로그인에 선택적으로 “사기” 또는 “합법적”으로 레이블을 지정할 수 있습니다.
+ 6개월 이상의 로그인 이벤트로 기록 데이터를 준비하고 100K엔터티를 포함합니다.

최소 요구 사항을 이미 충족하는 데이터 세트가 없는 경우 [SendEvent](https://docs.aws.amazon.com/frauddetector/latest/api/API_SendEvent.html) API 작업을 호출하여 이벤트 데이터를 Amazon Fraud Detector로 스트리밍하는 것이 좋습니다.

## 데이터 검증
<a name="training-data-validations-ATI"></a>

Account Takeover Insights 모델을 생성하기 전에 Amazon Fraud Detector는 모델 훈련을 위해 데이터 세트에 포함된 메타데이터 및 변수가 크기 및 형식 요구 사항을 충족하는지 확인합니다. 자세한 내용은 [데이터세트 검증](create-event-dataset.md#dataset-validation) 단원을 참조하십시오. 또한 다른 요구 사항도 확인합니다. 데이터 세트가 검증을 통과하지 못하면 모델이 생성되지 않습니다. 모델을 성공적으로 생성하려면 다시 훈련하기 전에 검증을 통과하지 못한 데이터를 수정해야 합니다.

**일반적인 데이터 세트 오류**

Account Takeover Insights 모델 훈련을 위해 데이터 세트를 검증할 때 Amazon Fraud Detector는 이러한 문제와 기타 문제를 스캔하고 하나 이상의 문제가 발생하면 오류를 발생시킵니다.
+ CSV 파일은 UTF-8 형식이 아닙니다.
+ CSV 파일 헤더에는 `EVENT_ID`, `ENTITY_ID`또는 메타데이터 중 하나 이상이 포함되어 있지 않습니다`EVENT_TIMESTAMP`.
+ CSV 파일 헤더에는 `IP_ADDRESS`, `USERAGENT`또는 변수 유형 중 하나 이상의 변수가 포함되어 있지 않습니다`VALIDCRED`.
+ 동일한 변수 유형과 연결된 변수가 두 개 이상 있습니다.
+ 에서 값의 0.1% 이상이 지원되는 날짜 및 타임스탬프 형식 이외의 null 또는 값을 `EVENT_TIMESTAMP` 포함합니다.
+ 첫 번째 이벤트와 마지막 이벤트 사이의 일수는 30일 미만입니다.
+ `IP_ADDRESS` 변수 유형 변수의 10% 이상이 유효하지 않거나 null입니다.
+ `USERAGENT` 변수 유형의 변수 중 50% 이상이 null을 포함합니다.
+ 변수 유형의 모든 `VALIDCRED` 변수는 로 설정됩니다`false`.

# 모델 빌드
<a name="building-a-model"></a>

Amazon Fraud Detector 모델은 특정 이벤트 유형에 대한 사기를 탐지하는 방법을 학습합니다. Amazon Fraud Detector에서는 먼저 모델 버전을 위한 컨테이너 역할을 하는 모델을 생성합니다. 모델을 훈련할 때마다 새 버전이 생성됩니다. AWS 콘솔을 사용하여 모델을 생성하고 훈련하는 방법에 대한 자세한 내용은 섹션을 참조하세요[3단계: 모델 생성](part-a.md#step-3-create-new-ml-model).

각 모델에는 해당 모델 점수 변수가 있습니다. Amazon Fraud Detector는 모델을 생성할 때 사용자를 대신하여이 변수를 생성합니다. 규칙 표현식에서이 변수를 사용하여 사기 평가 중에 모델 점수를 해석할 수 있습니다.

## 를 사용하여 모델 훈련 및 배포 AWS SDK for Python (Boto3)
<a name="train-and-deploy-a-model-using-the-aws-python-sdk"></a>

모델 버전은 `CreateModel` 및 `CreateModelVersion` 작업을 호출하여 생성됩니다.는 모델 버전을 위한 컨테이너 역할을 하는 모델을 `CreateModel` 시작합니다.는 훈련 프로세스를 `CreateModelVersion` 시작하여 모델의 특정 버전을 생성합니다. `CreateModelVersion`을 호출할 때마다 새 솔루션 버전이 생성됩니다.

다음 예제에서는 `CreateModel` API에 대한 샘플 요청을 보여줍니다. 이 예제에서는 *Online Fraud Insights* 모델 유형을 생성하고 이벤트 유형을 생성했다고 가정합니다`sample_registration`. 이벤트 유형 생성에 대한 자세한 내용은 섹션을 참조하세요[이벤트 유형 생성](create-event-type.md).

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.create_model (
modelId = 'sample_fraud_detection_model',
eventTypeName = 'sample_registration',
modelType = 'ONLINE_FRAUD_INSIGHTS')
```

[CreateModelVersion](https://docs.aws.amazon.com//frauddetector/latest/api/API_CreateModelVersion.html) API를 사용하여 첫 번째 버전을 훈련합니다. `TrainingDataSource` 및에 대해 훈련 데이터 세트의 소스 및 Amazon S3 위치를 `ExternalEventsDetail` 지정합니다. 의 경우 Amazon Fraud Detector가 훈련 데이터를 해석하는 방법, 특히 포함할 이벤트 변수와 이벤트 레이블을 분류하는 방법을 `TrainingDataSchema` 지정합니다. 기본적으로 Amazon Fraud Detector는 레이블이 지정되지 않은 이벤트를 무시합니다. 이 예제 코드는 `AUTO`에 `unlabeledEventsTreatment`를 사용하여 Amazon Fraud Detector가 레이블이 지정되지 않은 이벤트를 사용하는 방법을 결정하도록 지정합니다.

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.create_model_version (
modelId = 'sample_fraud_detection_model',
modelType = 'ONLINE_FRAUD_INSIGHTS',
trainingDataSource = 'EXTERNAL_EVENTS',
trainingDataSchema = {
    'modelVariables' : ['ip_address', 'email_address'],
    'labelSchema' : {
        'labelMapper' : {
            'FRAUD' : ['fraud'],
            'LEGIT' : ['legit']
        }
       unlabeledEventsTreatment = 'AUTO'
    }
}, 
externalEventsDetail = {
    'dataLocation' : 's3://bucket/file.csv',
    'dataAccessRoleArn' : 'role_arn'
}
)
```

요청이 성공하면 상태의 새 모델 버전이 생성됩니다`TRAINING_IN_PROGRESS`. 훈련 중 언제든지를 호출`UpdateModelVersionStatus`하고 상태를 로 업데이트하여 훈련을 취소할 수 있습니다`TRAINING_CANCELLED`. 훈련이 완료되면 모델 버전 상태가 로 업데이트됩니다`TRAINING_COMPLETE`. Amazon Fraud Detector 콘솔을 사용하거나를 호출하여 모델 성능을 검토할 수 있습니다`DescribeModelVersions`. 모델 점수와 성능을 해석하는 방법에 대한 자세한 내용은 [모델 점수](model-scores.md) 및 섹션을 참조하세요[모델 성능 지표](training-performance-metrics.md).

 모델 성능을 검토한 후 모델을 활성화하여 감지기가 실시간 사기 예측에 사용할 수 있도록 합니다. Amazon Fraud Detector는 자동 크기 조정이 켜져 있는 중복성을 위해 여러 가용 영역에 모델을 배포하여 모델이 실행 중인 사기 예측 수에 따라 확장되도록 합니다. 모델을 활성화하려면 `UpdateModelVersionStatus` API를 호출하고 상태를 로 업데이트합니다`ACTIVE`.

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.update_model_version_status (
modelId = 'sample_fraud_detection_model',
modelType = 'ONLINE_FRAUD_INSIGHTS',
modelVersionNumber = '1.00',
status = 'ACTIVE'
)
```

# 모델 점수
<a name="model-scores"></a>

Amazon Fraud Detector는 모델 유형에 따라 모델 점수를 다르게 생성합니다.

**계정 탈취 인사이트(ATI)** 모델의 경우 Amazon Fraud Detector는 집계된 값(원시 변수 세트를 결합하여 계산한 값)만 사용하여 모델 점수를 생성합니다. 새 개체의 첫 번째 이벤트에 대해 -1점이 생성되어 알 수 *없는 위험을* 나타냅니다. 이는 새 개체의 경우 집계 계산에 사용되는 값이 0 또는 null이기 때문입니다. Account Takeeover Insights(ATI) 모델은 동일한 엔터티 및 기존 엔터티에 대한 모든 후속 이벤트에 대해 0\$11000 사이의 모델 점수를 생성합니다. 여기서 0은 *사기 위험이 낮음*을 나타내고 1000은 *사기 위험이 높*음을 나타냅니다. ATI 모델의 경우 모델 점수는 챌린지 비율(CR)과 직접 관련이 있습니다. 예를 들어 500점은 예상 5% 챌린지 비율에 해당하는 반면 900점은 예상 0.1% 챌린지 비율에 해당합니다.

**온라인 사기 인사이트(OFI)** 및 **트랜잭션 사기 인사이트(TFI)** 모델의 경우 Amazon Fraud Detector는 집계된 값(원시 변수 세트를 결합하여 계산된 값)과 원시 값( 변수에 제공된 값)을 모두 사용하여 모델 점수를 생성합니다. 모델 점수는 0에서 1000 사이일 수 있습니다. 여기서 0은 *사기 위험이 낮음*을 나타내고 1000은 *사기 위험이 높*음을 나타냅니다. OFI 및 TFI 모델의 경우 모델 점수는 거짓 긍정률(FPR)과 직접 관련이 있습니다. 예를 들어 600점은 예상 10% 거짓 긍정 비율에 해당하는 반면, 900점은 예상 2% 거짓 긍정 비율에 해당합니다. 다음 표에는 특정 모델 점수와 예상 거짓 긍정 비율의 상관 관계에 대한 세부 정보가 나와 있습니다.


| 모델 점수 | 예상 FPR | 
| --- | --- | 
|  975  |  0.50%  | 
|  950  |  1%  | 
|  900  |  2%  | 
|  860  |  3%  | 
|  775  |  5%  | 
|  700  |  7%  | 
|  600  |  10%  | 

# 모델 성능 지표
<a name="training-performance-metrics"></a>

모델 훈련이 완료되면 Amazon Fraud Detector는 모델 훈련에 사용되지 않은 데이터의 15%를 사용하여 모델 성능을 검증합니다. 훈련된 Amazon Fraud Detector 모델은 검증 성능 지표와 유사한 실제 사기 탐지 성능을 가질 것으로 예상할 수 있습니다.

기업으로서 더 많은 사기를 탐지하는 것과 합법적인 고객에게 더 많은 마찰을 가하는 것 사이의 균형을 맞춰야 합니다. 적절한 균형을 선택하는 데 도움이 되도록 Amazon Fraud Detector는 모델 성능을 평가하는 다음과 같은 도구를 제공합니다.
+ **점수 분포 차트** - 모델 점수 분포의 히스토그램은 100,000개의 이벤트로 구성된 예제 모집단을 가정합니다. 왼쪽 Y축은 합법적인 이벤트를 나타내고 오른쪽 Y축은 사기 이벤트를 나타냅니다. 차트 영역을 클릭하여 특정 모델 임계값을 선택할 수 있습니다. 그러면 혼동 행렬 및 ROC 차트의 해당 뷰가 업데이트됩니다.
+ **혼동 행렬** - 모델 예측과 실제 결과를 비교하여 지정된 점수 임계값에 대한 모델 정확도를 요약합니다. Amazon Fraud Detector는 100,000개의 이벤트로 구성된 예제 모집단을 가정합니다. 사기 및 합법적인 이벤트의 배포는 비즈니스의 사기 발생률을 시뮬레이션합니다.
  + **참 긍정 **- 모델은 사기를 예측하고 이벤트는 실제로 사기입니다.
  + **거짓 긍정** - 모델은 사기를 예측하지만 이벤트는 실제로 합법적입니다.
  + **참 부정 **- 모델은 합법적인 것으로 예측하고 이벤트는 실제로 합법적인 것으로 예측합니다.
  + **거짓 부정 **- 모델은 합법적인 것으로 예측하지만 실제로 이벤트는 사기입니다.
  + **참 긍정률(TPR)** - 모델이 탐지한 총 사기의 비율입니다. 캡처 속도라고도 합니다.
  + **FPR(False positive rate)** - 사기로 잘못 예측된 총 합법적인 이벤트의 비율입니다.
+ **수신기 연산자 곡선(ROC) **- 가능한 모든 모델 점수 임계값에 대해 참 긍정 비율을 거짓 긍정 비율의 함수로 표시합니다. **고급 지표를 선택하여이 차트를** 봅니다.
+ **곡선하면적(AUC)** - 가능한 모든 모델 점수 임계값에서 TPR 및 FPR을 요약합니다. 예측력이 없는 모델은 AUC가 0.5인 반면, 완벽한 모델은 점수가 1.0입니다.
+ **불확실성 범위** - 모델에서 예상되는 AUC 범위를 보여줍니다. 범위가 클수록(AUC > 0.1의 상한과 하한 차이) 모델 불확실성이 높아집니다. 불확실성 범위가 큰 경우(>0.1) 레이블이 더 많은 이벤트를 제공하고 모델을 재학습하는 것이 좋습니다.

**모델 성능 지표를 사용하려면**

1. **점수 분포** 차트부터 시작하여 사기 및 합법적인 이벤트에 대한 모델 점수 분포를 검토합니다. 이상적으로는 사기와 합법적인 이벤트가 명확하게 구분됩니다. 이는 모델이 어떤 이벤트가 사기이고 어떤 이벤트가 합법적인지 정확하게 식별할 수 있음을 나타냅니다. 차트 영역을 클릭하여 모델 임계값을 선택합니다. 모델 점수 임계값을 조정하면 참 긍정 및 거짓 긍정 비율에 어떤 영향을 미치는지 확인할 수 있습니다.
**참고**  
점수 분포 차트는 사기 및 합법적인 이벤트를 두 개의 서로 다른 Y축에 표시합니다. 왼쪽 Y축은 합법적인 이벤트를 나타내고 오른쪽 Y축은 사기 이벤트를 나타냅니다.

1. **혼동 행렬**을 검토합니다. 선택한 모델 점수 임계값에 따라 100,000개의 이벤트 샘플을 기반으로 시뮬레이션된 영향을 볼 수 있습니다. 사기 및 합법적인 이벤트의 배포는 비즈니스의 사기 발생률을 시뮬레이션합니다. 이 정보를 사용하여 참 긍정 비율과 거짓 긍정 비율 간의 적절한 균형을 찾을 수 있습니다.

1. 자세한 내용을 보려면 **고급 지표를** 선택합니다. ROC 차트를 사용하여 모델 점수 임계값에 대한 참 긍정 비율과 거짓 긍정 비율 간의 관계를 이해합니다. ROC 곡선은 참 긍정 비율과 거짓 긍정 비율 간의 균형을 미세 조정하는 데 도움이 될 수 있습니다.
**참고**  
테이블을 선택하여 테이블 형식의 지표를 검토할 수도 **있습니다**.  
테이블 보기에는 지표 **정밀도**도 표시됩니다. **정밀도**는 사기로 예측된 모든 이벤트와 비교하여 사기로 올바르게 예측된 사기 이벤트의 백분율입니다.

1. 성능 지표를 사용하여 목표 및 사기 탐지 사용 사례를 기반으로 비즈니스에 대한 최적의 모델 임계값을 결정합니다. 예를 들어 모델을 사용하여 새 계정 등록을 위험도 높음, 중간 또는 낮음으로 분류하려는 경우 다음과 같이 세 가지 규칙 조건의 초안을 작성할 수 있도록 두 개의 임계값 점수를 식별해야 합니다.
   + 점수 > X는 위험이 높습니다.
   + 점수 < X이지만 > Y는 중간 위험입니다.
   + 점수가 < Y이면 위험이 낮습니다.

# 모델 변수 중요도
<a name="model-variable-importance"></a>

*모델 변수 중요*도는 모델 버전 내에서 모델 변수의 순위를 매기는 Amazon Fraud Detector의 기능입니다. 각 모델 변수에는 모델의 전체 성능에 대한 상대적 중요도를 기반으로 값이 제공됩니다. 값이 가장 높은 모델 변수는 해당 모델 버전의 데이터 세트에 있는 다른 모델 변수보다 모델에 더 중요하며 기본적으로 상단에 나열됩니다. 마찬가지로 값이 가장 낮은 모델 변수는 기본적으로 하단에 나열되며 다른 모델 변수에 비해 가장 중요하지 않습니다. 모델 변수 중요도 값을 사용하면 모델의 성능을 주도하는 입력에 대한 인사이트를 얻을 수 있습니다.

Amazon Fraud Detector 콘솔에서 또는 [DescribeModelVersion](https://docs.aws.amazon.com/frauddetector/latest/api/API_DescribeModelVersions.html) API를 사용하여 훈련된 모델 버전의 모델 변수 중요도 값을 볼 수 있습니다.

모델 변수 중요도는 [모델 버전을](https://docs.aws.amazon.com/frauddetector/latest/api/API_CreateModelVersion.html) 훈련하는 데 사용되는 각 [변수](https://docs.aws.amazon.com/frauddetector/latest/api/API_TrainingDataSchema.html#FraudDetector-Type-TrainingDataSchema-modelVariables)에 대해 다음과 같은 값 집합을 제공합니다.
+ **변수 유형**: 변수 유형(예: IP 주소 또는 이메일). 자세한 내용은 [변수 유형](variables.md#variable-types) 단원을 참조하십시오. 계정 탈취 인사이트(ATI) 모델의 경우 Amazon Fraud Detector는 원시 변수 유형과 집계 변수 유형 모두에 대해 가변 중요도 값을 제공합니다. 원시 변수 유형은 사용자가 제공하는 변수에 할당됩니다. 집계 변수 유형은 Amazon Fraud Detector가 집계된 중요도 값을 계산하기 위해 결합한 원시 변수 집합에 할당됩니다.
+ **변수 이름**: 모델 버전을 훈련하는 데 사용된 이벤트 변수의 이름입니다(예: , `ip_address``email_address`, `are_creadentials_valid`). 집계된 변수 유형의 경우 집계된 변수 중요도 값을 계산하는 데 사용된 모든 변수의 이름이 나열됩니다.
+ **변수 중요도 값**: 모델 성능에 대한 원시 또는 집계 변수의 상대적 중요도를 나타내는 숫자입니다. 일반적인 범위: 0\$110

Amazon Fraud Detector 콘솔에서 온라인 사기 인사이트(OFI) 또는 트랜잭션 사기 인사이트(TFI) 모델에 대한 모델 변수 중요도 값은 다음과 같이 표시됩니다. Account Takeover Insight(ATI) 모델은 원시 변수의 중요도 값 외에도 집계된 변수 중요도 값을 제공합니다. 시각적 차트를 사용하면 세로 점선으로 변수 간의 상대적 중요도를 쉽게 확인할 수 있어 순위가 가장 높은 변수의 중요도 값을 참조할 수 있습니다.

![\[모델 변수 중요도 차트.\]](http://docs.aws.amazon.com/ko_kr/frauddetector/latest/ug/images/hawksnest-console-mvi-pane.png)


Amazon Fraud Detector는 추가 비용 없이 모든 Fraud Detector 모델 버전에 대해 가변 중요도 값을 생성합니다.

**중요**  
*2021년 7월 9*일 이전에 생성된 모델 버전에는 가변 중요도 값이 없습니다. 모델 변수 중요도 값을 생성하려면 모델의 새 버전을 훈련해야 합니다.

## 모델 변수 중요도 값 사용
<a name="how-to-use-mvi"></a>

 모델 변수 중요도 값을 사용하여 모델의 성능을 높이거나 낮추는 요인과 가장 많이 기여하는 변수에 대한 인사이트를 얻을 수 있습니다. 그런 다음 모델을 조정하여 전반적인 성능을 개선합니다.

특히 모델 성능을 개선하려면 도메인 지식을 기준으로 가변 중요도 값을 검사하고 훈련 데이터의 문제를 디버깅합니다. 예를 들어, 계정 ID가 모델에 대한 입력으로 사용되었고 상단에 나열되어 있는 경우 변수 중요도 값을 살펴보십시오. 변수 중요도 값이 나머지 값보다 훨씬 높으면 모델이 특정 사기 패턴에 과적합할 수 있습니다(예: 모든 사기 이벤트가 동일한 계정 ID에서 발생함). 그러나 변수가 사기 레이블에 의존하는 경우 레이블 유출이 발생할 수도 있습니다. 도메인 지식을 기반으로 한 분석 결과에 따라 변수를 제거하고 더 다양한 데이터 세트로 훈련하거나 모델을 그대로 유지하는 것이 좋습니다.

마찬가지로 마지막에 순위가 매겨진 변수를 살펴봅니다. 변수 중요도 값이 나머지 값보다 훨씬 낮은 경우이 모델 변수는 모델 훈련에 중요하지 않을 수 있습니다. 더 간단한 모델 버전을 훈련하기 위해 변수를 제거하는 것을 고려할 수 있습니다. 모델에 두 개의 변수와 같은 변수가 거의 없는 경우 Amazon Fraud Detector는 여전히 변수 중요도 값을 제공하고 변수의 순위를 매깁니다. 그러나이 경우 인사이트는 제한됩니다.

**중요**  
**모델 변수 중요도 차트에 누락된 변수**가 있는 경우 다음 이유 중 하나 때문일 수 있습니다. 데이터 세트에서 변수를 수정하고 모델을 재학습하는 것이 좋습니다.  
훈련 데이터 세트의 변수에 대한 고유 값 수가 100개 미만입니다.
변수 값이 0.9보다 크면 훈련 데이터 세트에서 누락됩니다.
모델의 입력 변수를 조정하려면 매번 새 모델 버전을 훈련해야 합니다.

## 모델 변수 중요도 값 평가
<a name="how-to-evaluate-mvi"></a>

모델 변수 중요도 값을 평가할 때 다음 사항을 고려하는 것이 좋습니다.
+ 가변 중요도 값은 항상 도메인 지식과 함께 평가해야 합니다.
+ 모델 버전 내 다른 변수의 변수 중요도 값을 기준으로 변수의 변수 중요도 값을 검사합니다. 단일 변수에 대한 변수 중요도 값을 독립적으로 고려하지 마십시오.
+ 동일한 모델 버전 내에서 변수의 변수 중요도 값을 비교합니다. 모델 버전에서 변수의 변수 중요도 값이 다른 모델 버전에서 동일한 변수의 값과 다를 수 있으므로 모델 버전 간에 동일한 변수의 변수 중요도 값을 비교하지 마십시오. 동일한 변수와 데이터 세트를 사용하여 다른 모델 버전을 훈련하는 경우 반드시 동일한 변수 중요도 값을 생성하지는 않습니다.

## 모델 변수 중요도 순위 보기
<a name="how-to-view-mvi"></a>

모델 훈련이 완료되면 Amazon Fraud Detector 콘솔에서 또는 [DescribeModelVersion](https://docs.aws.amazon.com/frauddetector/latest/api/API_DescribeModelVersions.html) API를 사용하여 훈련된 모델 버전의 모델 변수 중요도 순위를 볼 수 있습니다.

**콘솔을 사용하여 모델 변수 중요도 순위를 보려면**

1.  AWS 콘솔을 열고 계정에 로그인합니다. Amazon Fraud Detector로 이동합니다.

1. 왼쪽 탐색 창에서 **모델**을 선택합니다.

1. 모델을 선택한 다음 모델 버전을 선택합니다.

1. **개요** 탭이 선택되어 있는지 확인합니다.

1. 아래로 스크롤하여 **모델 변수 중요**도 창을 봅니다.

## 모델 변수 중요도 값이 계산되는 방법 이해
<a name="how-mvi-value-calculated"></a>

각 모델 버전 훈련이 완료되면 Amazon Fraud Detector는 모델 변수 중요도 값과 모델의 성능 지표를 자동으로 생성합니다. 이를 위해 Amazon Fraud Detector는 SHapley Additive exPlanations([SHAP](https://papers.nips.cc/paper/2017/file/8a20a8621978632d76c43dfd28b67767-Paper.pdf))를 사용합니다. SHAP는 기본적으로 모든 모델 변수의 가능한 모든 조합을 고려한 후 모델 변수의 평균 예상 기여도입니다.

SHAP는 먼저 이벤트 예측을 위해 각 모델 변수의 기여도를 할당합니다. 그런 다음 이러한 예측을 집계하여 모델 수준에서 변수의 순위를 생성합니다. 예측에 각 모델 변수의 기여도를 할당하기 위해 SHAP는 가능한 모든 변수 조합 간의 모델 출력 차이를 고려합니다. SHAP는 특정 변수 집합을 포함하거나 제거하여 모델 출력을 생성할 수 있는 모든 가능성을 포함하여 각 모델 변수의 중요도에 정확하게 액세스할 수 있습니다. 이는 모델 변수가 서로 높은 상관관계를 가질 때 특히 중요합니다.

ML 모델은 대부분의 경우 변수를 제거할 수 없습니다. 대신 모델에서 제거되거나 누락된 변수를 하나 이상의 기준(예: 사기가 아닌 이벤트)의 해당 변수 값으로 바꿀 수 있습니다. 적절한 기준 인스턴스를 선택하는 것은 어려울 수 있지만 Amazon Fraud Detector를 사용하면이 기준을 모집단 평균으로 설정하여 이를 쉽게 수행할 수 있습니다.

# SageMaker AI 모델 가져오기
<a name="import-an-amazon-sagemaker-model"></a>

선택적으로 SageMaker AI 호스팅 모델을 Amazon Fraud Detector로 가져올 수 있습니다. 모델과 마찬가지로 SageMaker AI 모델을 탐지기에 추가하고 `GetEventPrediction` API를 사용하여 사기 예측을 생성할 수 있습니다. `GetEventPrediction` 요청의 일부로 Amazon Fraud Detector는 SageMaker AI 엔드포인트를 호출하고 결과를 규칙에 전달합니다.

`GetEventPrediction` 요청의 일부로 전송된 이벤트 변수를 사용하도록 Amazon Fraud Detector를 구성할 수 있습니다. 이벤트 변수를 사용하기로 선택한 경우 입력 템플릿을 제공해야 합니다. Amazon Fraud Detector는이 템플릿을 사용하여 이벤트 변수를 SageMaker AI 엔드포인트를 호출하는 데 필요한 입력 페이로드로 변환합니다. 또는 `GetEventPrediction` 요청의 일부로 전송되는 byteBuffer를 사용하도록 SageMaker AI 모델을 구성할 수 있습니다.

Amazon Fraud Detector는 JSON 또는 CSV 입력 형식과 JSON 또는 CSV 출력 형식을 사용하는 SageMaker AI 알고리즘 가져오기를 지원합니다. 지원되는 SageMaker AI 알고리즘의 예로는 XGBoost, Linear Learner 및 Random Cut Forest가 있습니다.

## 를 사용하여 SageMaker AI 모델 가져오기 AWS SDK for Python (Boto3)
<a name="import-an-amazon-sagemaker-model-using-the-aws-python-sdk"></a>

SageMaker AI 모델을 가져오려면 `PutExternalModel` API를 사용합니다. 다음 예제에서는 SageMaker AI 엔드포인트`sagemaker-transaction-model`가 배포되었고, `InService` 상태이며, XGBoost 알고리즘을 사용한다고 가정합니다.

입력 구성은가 이벤트 변수를 사용하여 모델 입력을 구성하도록 지정합니다(`useEventVariables`는 로 설정됨`TRUE`). XGBoost에 CSV 입력이 필요한 경우 입력 형식은 TEXT\$1CSV입니다. csvInputTemplate은 `GetEventPrediction` 요청의 일부로 전송된 변수에서 CSV 입력을 구성하는 방법을 지정합니다. 이 예제에서는 변수 `order_amt`, `prev_amt` `hist_amt` 및를 생성했다고 가정합니다`payment_type`.

출력 구성은 SageMaker AI 모델의 응답 형식을 지정하고 적절한 CSV 인덱스를 Amazon Fraud Detector 변수에 매핑합니다`sagemaker_output_score`. 구성되면 규칙에서 출력 변수를 사용할 수 있습니다.

**참고**  
SageMaker AI 모델의 출력은 소스가 인 변수에 매핑되어야 합니다`EXTERNAL_MODEL_SCORE`. **변수를** 사용하여 콘솔에서 이러한 변수를 생성할 수 없습니다. 모델 가져오기를 구성할 때 대신 생성해야 합니다.

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.put_external_model (
modelSource = 'SAGEMAKER',
modelEndpoint = 'sagemaker-transaction-model',
invokeModelEndpointRoleArn = 'your_SagemakerExecutionRole_arn',
inputConfiguration = {
    'useEventVariables' : True,
    'eventTypeName' : 'sample_transaction',
    'format' : 'TEXT_CSV',
    'csvInputTemplate' : '{{order_amt}}, {{prev_amt}}, {{hist_amt}}, {{payment_type}}'
},

outputConfiguration = {
    'format' : 'TEXT_CSV',
    'csvIndexToVariableMap' : {
        '0' : 'sagemaker_output_score'
    }
},
    
modelEndpointStatus = 'ASSOCIATED'
)
```

# 모델 또는 모델 버전 삭제
<a name="delete-model"></a>

탐지기 버전과 연결되지 않은 경우, 모형과 모형 버전을 Amazon Fraud Detector에서 삭제할 수 있습니다. 모델을 삭제하면 Amazon Fraud Detector가 해당 모델을 영구적으로 삭제하고 데이터는 더 이상 Amazon Fraud Detector에 저장되지 않습니다.

 Amazon SageMaker AI 모델이 감지기 버전과 연결되어 있지 않은 경우에도 제거할 수 있습니다. SageMaker AI 모델을 제거하면 Amazon Fraud Detector에서 연결이 끊어지지만 SageMaker AI에서는 모델을 계속 사용할 수 있습니다.

**모델 버전을 삭제하려면**

`Ready to deploy` 상태인 모델 버전만 삭제할 수 있습니다. 모델 버전을에서 `ACTIVE` `Ready to deploy` 상태로 변경하려면 모델 버전을 배포 취소합니다.

1. 에 로그인 AWS Management Console 하고 [https://console.aws.amazon.com/frauddetector](https://console.aws.amazon.com/frauddetector) Amazon Fraud Detector 콘솔을 엽니다.

1. Amazon Fraud Detector 콘솔의 왼쪽 탐색 창에서 **모델을** 선택합니다.

1. 삭제하려는 모델 버전이 포함된 모델을 선택합니다.

1. 삭제할 모델 버전을 선택합니다.

1. **작업**을 선택한 후 **삭제**를 선택합니다.

1. 모델 버전 이름을 입력한 다음 **모델 버전 삭제**를 선택합니다.

**모델 버전을 배포 취소하려면**

감지기 버전(`ACTIVE`, , )에서 사용 중인 모델 버전은 배포 취소할 수 없습니다`INACTIVE``DRAFT`. 따라서 감지기 버전에서 사용 중인 모델 버전을 배포 해제하려면 먼저 감지기 버전에서 모델 버전을 제거합니다.

1. Amazon Fraud Detector 콘솔의 왼쪽 탐색 창에서 **모델을** 선택합니다.

1. 배포 해제하려는 모델 버전이 포함된 모델을 선택합니다.

1. 삭제할 모델 버전을 선택합니다.

1. **작업을** 선택한 다음 **모델 버전 배포 취소를** 선택합니다.

**모델을 삭제하려면**

모델을 삭제하기 전에 먼저 모든 모델 버전을 삭제해야 하며 모델과 연결되어 있습니다.

1. Amazon Fraud Detector 콘솔의 왼쪽 탐색 창에서 **모델을** 선택합니다.

1. 삭제할 모델을 선택합니다.

1. **작업**을 선택한 후 **삭제**를 선택합니다.

1. 모델 이름을 입력한 다음 **모델 삭제**를 선택합니다.

**Amazon SageMaker AI 모델을 제거하려면**

1. Amazon Fraud Detector 콘솔의 왼쪽 탐색 창에서 **모델을** 선택합니다.

1. 제거할 SageMaker AI 모델을 선택합니다.

1. **작업을** 선택한 다음 **모델 제거**를 선택합니다.

1. 모델 이름을 입력한 다음 ** SageMaker AI 모델 제거**를 선택합니다.