Amazon Fraud Detector는 2025년 11월 7일부터 신규 고객에게 더 이상 공개되지 않습니다. Amazon Fraud Detector와 유사한 기능을 알아보려면 Amazon SageMaker, AutoGluon 및를 살펴보세요 AWS WAF.
기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
온라인 사기 인사이트
Online Fraud Insights는 지도 기계 학습 모델로, 사기 및 합법적인 거래의 과거 예를 사용하여 모델을 교육합니다. 온라인 사기 인사이트 모델은 적은 기록 데이터를 기반으로 사기를 탐지할 수 있습니다. 모델의 입력은 유연하므로 가짜 리뷰, 프로모션 침해, 게스트 체크아웃 사기 등 다양한 사기 위험을 탐지하도록 조정할 수 있습니다.
Online Fraud Insights 모델은 데이터 보강, 변환 및 사기 분류에 기계 학습 알고리즘 앙상블을 사용합니다. 모델 훈련 프로세스의 일환으로 Online Fraud Insights는 IP 주소 및 BIN 번호와 같은 원시 데이터 요소를 IP 주소의 지리적 위치 또는 신용 카드 발급 은행과 같은 타사 데이터로 보강합니다. 온라인 사기 인사이트는 타사 데이터 외에도 Amazon 및에서 관찰된 사기 패턴을 고려하는 딥 러닝 알고리즘을 사용합니다 AWS. 이러한 사기 패턴은 그라데이션 트리 부스팅 알고리즘을 사용하여 모델에 대한 입력 기능이 됩니다.
성능을 높이기 위해 Online Fraud Insights는 베이지안 최적화 프로세스를 통해 그라데이션 트리 부스팅 알고리즘의 하이퍼 파라미터를 최적화합니다. 다양한 모델 파라미터(예: 나무 수, 나무 깊이, 리프당 샘플 수)를 사용하여 수십 개의 다양한 모델을 순차적으로 훈련합니다. 또한 소수의 사기 집단을 확대하여 매우 낮은 사기 발생률을 처리하는 등 다양한 최적화 전략을 사용합니다.
데이터 소스 선택
온라인 사기 인사이트 모델을 훈련할 때 외부(Amazon 사기 탐지기 외부)에 저장되거나 Amazon 사기 탐지기 내에 저장된 이벤트 데이터에 대해 모델을 훈련하도록 선택할 수 있습니다. Amazon Fraud Detector는 현재 Amazon Simple Storage Service(Amazon S3)를 지원합니다. 에서 외부 스토리지를 사용하는 경우 이벤트 데이터 세트를 쉼표로 구분된 값(CSV) 형식으로 Amazon S3 버킷에 업로드해야 합니다. 이러한 데이터 스토리지 옵션을 모델 훈련 구성 내에서 EXTERNAL_EVENTS(외부 스토리지의 경우) 및 INGESTED_EVENTS(내부 스토리지의 경우)라고 합니다. 사용 가능한 데이터 소스와 해당 소스에 데이터를 저장하는 방법에 대한 자세한 내용은 섹션을 참조하세요이벤트 데이터 스토리지.
데이터 준비
이벤트 데이터(Amazon S3 또는 Amazon Fraud Detector)를 저장하는 위치에 관계없이 Online Fraud Insights 모델 유형에 대한 요구 사항은 동일합니다.
데이터 세트에는 EVENT_LABEL 열 헤더가 포함되어야 합니다. 이 변수는 이벤트를 사기 또는 합법적인 것으로 분류합니다. CSV 파일(외부 스토리지)을 사용하는 경우 파일의 각 이벤트에 EVENT_LABEL을 포함해야 합니다. 내부 스토리지의 경우 EVENT_LABEL 필드는 선택 사항이지만 훈련 데이터 세트에 포함되도록 모든 이벤트에 레이블을 지정해야 합니다. 모델 훈련을 구성할 때 레이블이 지정되지 않은 이벤트를 무시할지, 레이블이 지정되지 않은 이벤트에 대해 합법적인 레이블을 맡을지, 레이블이 지정되지 않은 모든 이벤트에 대해 사기성 레이블을 맡을지 선택할 수 있습니다.
데이터 선택
온라인 사기 인사이트 모델 훈련을 위한 데이터 선택에 대한 자세한 내용은 이벤트 데이터 수집을 참조하세요.
온라인 사기 인사이트 훈련은 EVENT_TIMESTAMP를 기반으로 과거 데이터를 샘플링하고 분할합니다. 데이터를 수동으로 샘플링할 필요가 없으며 그렇게 하면 모델 결과에 부정적인 영향을 미칠 수 있습니다.
이벤트 변수
Online Fraud Insights 모델에는 필요한 이벤트 메타데이터를 제외하고 모델 훈련을 위한 데이터 검증을 통과하고 모델당 최대 100개의 변수를 허용하는 최소 2개의 변수가 필요합니다. 일반적으로 변수를 많이 제공할수록 모델이 사기와 합법적인 이벤트를 더 잘 구별할 수 있습니다. Online Fraud Insights 모델은 사용자 지정 변수를 포함한 수십 개의 변수를 지원할 수 있지만 이러한 변수는 일반적으로 평가 중인 개체를 식별하는 데 가장 효과적이므로 IP 주소와 이메일 주소를 포함하는 것이 좋습니다.
데이터 검증
교육 프로세스의 일환으로 Online Fraud Insights는 데이터 세트에서 모델 교육에 영향을 미칠 수 있는 데이터 품질 문제를 검증합니다. 데이터를 검증한 후 Amazon Fraud Detector는 가능한 최상의 모델을 구축하기 위해 적절한 조치를 취합니다. 여기에는 잠재적 데이터 품질 문제에 대한 경고 실행, 데이터 품질 문제가 있는 변수 자동 제거 또는 오류 실행 및 모델 훈련 프로세스 중지가 포함됩니다. 자세한 내용은 데이터 세트 검증을 참조하세요.