Einblicke in Online-Betrug - Amazon Fraud Detector

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einblicke in Online-Betrug

Online Fraud Insights ist ein Modell für überwachtes maschinelles Lernen, was bedeutet, dass es historische Beispiele betrügerischer und legitimer Transaktionen verwendet, um das Modell zu trainieren. Das Online Fraud Insights-Modell kann Betrug anhand weniger historischer Daten aufdecken. Die Eingaben des Modells sind flexibel, sodass Sie es anpassen können, um eine Vielzahl von Betrugsrisiken zu erkennen, darunter gefälschte Bewertungen, Missbrauch von Werbeangeboten und Betrug beim Checkout von Gästen.

Das Modell Online Fraud Insights verwendet ein Ensemble von Algorithmen für maschinelles Lernen zur Datenanreicherung, Transformation und Betrugsklassifizierung. Im Rahmen des Modellschulungsprozesses reichert Online Fraud Insights Rohdatenelemente wie IP-Adresse und BIN-Nummer mit Daten von Drittanbietern an, z. B. der Geolokalisierung der IP-Adresse oder der ausstellenden Bank für eine Kreditkarte. Zusätzlich zu Daten von Drittanbietern verwendet Online Fraud Insights Deep-Learning-Algorithmen, die Betrugsmuster berücksichtigen, die bei Amazon und festgestellt wurden AWS. Diese Betrugsmuster werden mithilfe eines Gradienten-Tree-Boosting-Algorithmus zu Eingabemerkmalen für Ihr Modell.

Um die Leistung zu steigern, optimiert Online Fraud Insights die Hyperparameter des Gradienten-Tree-Boosting-Algorithmus mithilfe eines Bayesschen Optimierungsprozesses. Es trainiert nacheinander Dutzende verschiedener Modelle mit unterschiedlichen Modellparametern (wie Anzahl der Bäume, Tiefe der Bäume und Anzahl der Proben pro Blatt). Außerdem werden verschiedene Optimierungsstrategien verwendet, wie z. B. die Gewichtung der betrügerischen Minderheit, um sehr niedrigen Betrugsraten entgegenzuwirken.

Datenquelle auswählen

Beim Training eines Online Fraud Insights-Modells können Sie wählen, ob Sie das Modell anhand von Ereignisdaten trainieren möchten, die entweder extern (außerhalb von Amazon Fraud Detector) oder innerhalb von Amazon Fraud Detector gespeichert sind. Der externe Speicher, den Amazon Fraud Detector derzeit unterstützt, ist Amazon Simple Storage Service (Amazon S3). Wenn Sie externen Speicher verwenden, muss Ihr Ereignisdatensatz im CSV-Format (Comma-Separated Values) in einen Amazon S3 S3-Bucket hochgeladen werden. Diese Datenspeicheroptionen werden in der Modelltrainingskonfiguration als EXTERNAL_EVENTS (für externen Speicher) und INGESTED_EVENTS (für internen Speicher) bezeichnet. Weitere Informationen zu den verfügbaren Datenquellen und zum Speichern von Daten in ihnen finden Sie unter. Speicherung von Ereignisdaten

Vorbereiten von Daten

Unabhängig davon, wo Sie Ihre Ereignisdaten speichern möchten (Amazon S3 oder Amazon Fraud Detector), sind die Anforderungen für den Modelltyp Online Fraud Insights dieselben.

Ihr Datensatz muss die Spaltenüberschrift EVENT_LABEL enthalten. Diese Variable klassifiziert ein Ereignis als betrügerisch oder legitim. Wenn Sie eine CSV-Datei (externer Speicher) verwenden, müssen Sie EVENT_LABEL für jedes Ereignis in der Datei angeben. Für den internen Speicher ist das Feld EVENT_LABEL optional, aber alle Ereignisse müssen beschriftet werden, um in einen Trainingsdatensatz aufgenommen zu werden. Bei der Konfiguration Ihres Modelltrainings können Sie wählen, ob Ereignisse ohne Kennzeichnung ignoriert, ein legitimes Etikett für nicht gekennzeichnete Ereignisse oder ein betrügerisches Etikett für alle nicht gekennzeichneten Ereignisse angenommen werden sollen.

Daten auswählen

Informationen zur Auswahl von Daten für das Training Ihres Online Fraud Insights-Modells finden Sie unter Erfassen von Ereignisdaten.

Bei der Schulung Online Fraud Insights werden historische Daten anhand von EVENT_TIMESTAMP entnommen und partitioniert. Es ist nicht erforderlich, die Daten manuell abzutasten, da sich dies negativ auf Ihre Modellergebnisse auswirken kann.

Ereignisvariablen

Das Online Fraud Insights-Modell erfordert neben den erforderlichen Ereignismetadaten mindestens zwei Variablen, die die Datenvalidierung für das Modelltraining bestanden haben und bis zu 100 Variablen pro Modell zulassen. Generell gilt: Je mehr Variablen Sie angeben, desto besser kann das Modell zwischen Betrug und legitimen Ereignissen unterscheiden. Das Online Fraud Insights-Modell kann zwar Dutzende von Variablen unterstützen, einschließlich benutzerdefinierter Variablen, wir empfehlen jedoch, IP-Adresse und E-Mail-Adresse anzugeben, da diese Variablen in der Regel bei der Identifizierung der zu bewertenden Entität am effektivsten sind.

Daten validieren

Im Rahmen des Schulungsprozesses überprüft Online Fraud Insights den Datensatz auf Datenqualitätsprobleme, die sich auf das Modelltraining auswirken können. Nach der Validierung der Daten ergreift Amazon Fraud Detector geeignete Maßnahmen, um das bestmögliche Modell zu erstellen. Dazu gehören das Ausgeben von Warnungen vor potenziellen Datenqualitätsproblemen, das automatische Entfernen von Variablen mit Datenqualitätsproblemen oder das Ausgeben eines Fehlers und das Stoppen des Modelltrainingsprozesses. Weitere Informationen finden Sie unter Validierung von Datensätzen.