Fehlerbehebung - Amazon Fraud Detector

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Fehlerbehebung

Die folgenden Abschnitte helfen Ihnen bei der Behebung von Problemen, die bei der Arbeit mit Amazon Fraud Detector auftreten können.

Beheben Sie Probleme mit Trainingsdaten

Verwenden Sie die Informationen in diesem Abschnitt, um Probleme zu diagnostizieren und zu lösen, die beim Training Ihres Modells möglicherweise im Bereich Modelltraining-Diagnose in der Amazon Fraud Detector Detector-Konsole auftreten.

Die im Diagnosebereich Model Training angezeigten Probleme sind wie folgt kategorisiert. Ob das Problem behoben werden muss, hängt von der Kategorie des Problems ab.

  • Error icon Fehler — führt dazu, dass das Modelltraining fehlschlägt. Diese Probleme müssen behoben werden, damit das Modell erfolgreich trainiert werden kann.

  • Warning icon Warnung — bewirkt, dass das Modelltraining fortgesetzt wird, einige Variablen werden jedoch möglicherweise aus dem Trainingsprozess ausgeschlossen. Suchen Sie in diesem Abschnitt nach den entsprechenden Anleitungen, um die Qualität Ihres Datensatzes zu verbessern.

  • Information icon Information (Info) — hat keinen Einfluss auf das Modelltraining und alle Variablen werden für das Training verwendet. Wir empfehlen Ihnen, die entsprechenden Hinweise in diesem Abschnitt zu lesen, um die Qualität Ihres Datensatzes und die Modellleistung weiter zu verbessern.

Instabile Betrugsrate im angegebenen Datensatz

Art des Problems: Fehler

Beschreibung

Die Betrugsrate bei den angegebenen Daten ist im Laufe der Zeit zu instabil. Bitte stellen Sie sicher, dass Ihre Betrugsfälle und legitimen Ereignisse im Laufe der Zeit einheitlich erfasst werden.

Ursache

Dieser Fehler tritt auf, wenn die betrügerischen und legitimen Ereignisse in Ihrem Datensatz ungleichmäßig verteilt sind und aus unterschiedlichen Zeitfenstern stammen. Amazon Fraud Detector modelliert den Trainingsprozess mit Stichproben und partitioniert Ihren Datensatz auf der Grundlage von EVENT_TIMESTAMP. Wenn Ihr Datensatz beispielsweise aus Betrugsereignissen der letzten 6 Monate besteht, aber nur legitime Ereignisse des letzten Monats enthalten sind, gilt der Datensatz als instabil. Ein instabiler Datensatz kann zu Verzerrungen bei der Bewertung der Modellleistung führen.

Lösung

Stellen Sie sicher, dass Sie die Daten zu betrügerischen und legitimen Ereignissen aus demselben Zeitfenster bereitstellen, damit sich die Betrugsrate im Laufe der Zeit nicht dramatisch ändert.

Unzureichende Daten

  1. Art des Problems: Fehler

    Beschreibung

    Weniger als 50 Zeilen sind als betrügerische Ereignisse gekennzeichnet. Stellen Sie sicher, dass sowohl betrügerische als auch legitime Ereignisse die Mindestanzahl von 50 überschreiten, und trainieren Sie das Modell erneut.

    Ursache

    Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als betrügerisch eingestufte Ereignisse enthält, als für das Modelltraining erforderlich sind. Amazon Fraud Detector benötigt mindestens 50 betrügerische Ereignisse, um Ihr Modell zu trainieren.

    Lösung

    Stellen Sie sicher, dass Ihr Datensatz mindestens 50 betrügerische Ereignisse enthält. Sie können dies sicherstellen, indem Sie bei Bedarf einen längeren Zeitraum abdecken.

  2. Art des Problems: Fehler

    Beschreibung

    Weniger als 50 Zeilen werden als legitime Ereignisse gekennzeichnet. Stellen Sie sicher, dass sowohl betrügerische als auch legitime Ereignisse die Mindestanzahl von $threshold überschreiten, und trainieren Sie das Modell erneut.

    Ursache

    Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Ereignisse enthält, die als legitim eingestuft wurden, als für das Modelltraining erforderlich sind. Amazon Fraud Detector benötigt mindestens 50 legitime Ereignisse, um Ihr Modell zu trainieren.

    Lösung

    Stellen Sie sicher, dass Ihr Datensatz mindestens 50 legitime Ereignisse enthält. Sie können dies sicherstellen, indem Sie bei Bedarf einen längeren Zeitraum abdecken.

  3. Art des Problems: Fehler

    Beschreibung

    Die Anzahl der eindeutigen Entitäten, die mit Betrug in Verbindung gebracht werden, liegt unter 100. Erwägen Sie, mehr Beispiele für betrügerische Unternehmen aufzunehmen, um die Leistung zu verbessern.

    Ursache

    Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Entitäten mit betrügerischen Ereignissen enthält, als für das Modelltraining erforderlich sind. Für das Modell Transaction Fraud Insights (TFI) sind mindestens 100 Entitäten mit Betrugsereignissen erforderlich, um eine maximale Abdeckung des Betrugsbereichs zu gewährleisten. Das Modell lässt sich möglicherweise nicht gut verallgemeinern, wenn alle Betrugsereignisse von einer kleinen Gruppe von Unternehmen durchgeführt werden.

    Lösung

    Stellen Sie sicher, dass Ihr Datensatz mindestens 100 Entitäten mit betrügerischen Ereignissen enthält. Sie können bei Bedarf sicherstellen, dass dies einen längeren Zeitraum abdeckt.

  4. Art des Problems: Fehler

    Beschreibung

    Die Anzahl der eindeutigen Entitäten, die legitimen Entitäten zugeordnet sind, liegt unter 100. Erwägen Sie, mehr Beispiele für legitime Entitäten aufzunehmen, um die Leistung zu verbessern.

    Ursache

    Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Entitäten mit legitimen Ereignissen enthält, als für das Modelltraining erforderlich sind. Das Modell Transaction Fraud Insights (TFI) erfordert mindestens 100 Entitäten mit legitimen Ereignissen, um eine maximale Abdeckung des Betrugsbereichs zu gewährleisten. Das Modell lässt sich möglicherweise nicht gut verallgemeinern, wenn alle legitimen Ereignisse von einer kleinen Gruppe von Entitäten durchgeführt werden.

    Lösung

    Stellen Sie sicher, dass Ihr Datensatz mindestens 100 Entitäten mit legitimen Ereignissen enthält. Sie können bei Bedarf sicherstellen, dass dies einen längeren Zeitraum abdeckt.

  5. Art des Problems: Fehler

    Beschreibung

    Der Datensatz enthält weniger als 100 Zeilen. Stellen Sie sicher, dass der Gesamtdatensatz mehr als 100 Zeilen enthält und mindestens 50 Zeilen als betrügerisch gekennzeichnet sind.

    Ursache

    Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als 100 Datensätze enthält. Amazon Fraud Detector benötigt für das Modelltraining Daten von mindestens 100 Ereignissen (Datensätzen) in Ihrem Datensatz.

    Lösung

    Stellen Sie sicher, dass Ihr Datensatz Daten von mehr als 100 Ereignissen enthält.

Fehlende oder unterschiedliche EVENT_LABEL-Werte

  1. Art des Problems: Fehler

    Beschreibung

    Mehr als 1% Ihrer EVENT_LABEL-Spalte sind Null oder es handelt sich um Werte, die nicht in der Modellkonfiguration definiert sind. $label_values Stellen Sie sicher, dass in Ihrer EVENT_LABEL-Spalte weniger als 1% der fehlenden Werte vorhanden sind und dass die Werte denen entsprechen, die in der Modellkonfiguration definiert sind. $label_values

    Ursache

    Dieser Fehler tritt aus einem der folgenden Gründe auf:

    • Bei mehr als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthält, fehlen Werte in der Spalte EVENT_LABEL.

    • Mehr als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthalten, haben Werte in der Spalte EVENT_LABEL, die sich von denen unterscheiden, die deinem Ereignistyp zugeordnet sind.

    Das Modell Online Fraud Insights (OFI) erfordert, dass die Spalte EVENT_LABEL in jedem Datensatz mit einem der Labels gefüllt wird, die mit Ihrem Ereignistyp verknüpft sind (oder zugeordnet sind). CreateModelVersion

    Lösung

    Wenn dieser Fehler auf die fehlenden EVENT_LABEL-Werte zurückzuführen ist, sollten Sie erwägen, diesen Datensätzen die richtigen Bezeichnungen zuzuweisen oder diese Datensätze aus Ihrem Datensatz zu löschen. Wenn dieser Fehler darauf zurückzuführen ist, dass die Beschriftungen einiger Datensätze nicht dazugehörenlabel_values, stellen Sie sicher, dass Sie alle Werte in der Spalte EVENT_LABEL den Beschriftungen des Ereignistyps hinzufügen und bei der Modellerstellung entweder betrügerisch oder legitim (Betrug, legitim) zuordnen.

  2. Art des Problems: Information

    Beschreibung

    Ihre EVENT_LABEL-Spalte enthält Nullwerte oder Labelwerte, die nicht in der Modellkonfiguration definiert sind. $label_values Diese inkonsistenten Werte wurden vor dem Training auf „Kein Betrug“ umgerechnet.

    Ursache

    Sie erhalten diese Informationen aus einem der folgenden Gründe:

    • Bei weniger als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthalten, fehlen Werte in der Spalte EVENT_LABEL

    • Weniger als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthalten, haben Werte in der Spalte EVENT_LABEL, die sich von denen unterscheiden, die deinem Ereignistyp zugeordnet sind.

    Das Modelltraining wird in beiden Fällen erfolgreich sein. Die Labelwerte der Ereignisse, bei denen Labelwerte fehlen oder denen nicht zugeordnet wurden, werden jedoch in legitime Werte umgewandelt. Wenn Sie der Meinung sind, dass dies ein Problem ist, folgen Sie der unten angegebenen Lösung.

    Lösung

    Wenn in Ihrem Datensatz EVENT_LABEL-Werte fehlen, sollten Sie erwägen, diese Datensätze aus Ihrem Datensatz zu löschen. Wenn die für diese EVENT_LABELS bereitgestellten Werte nicht zugeordnet sind, stellen Sie sicher, dass all diese Werte für jedes Ereignis entweder betrügerisch oder legitim (Betrug, legitim) zugeordnet sind.

Fehlende oder falsche EVENT_TIMESTAMP-Werte

  1. Art des Problems: Fehler

    Beschreibung

    Ihr Trainingsdatensatz enthält EVENT_TIMESTAMP mit Zeitstempeln, die nicht den akzeptierten Formaten entsprechen. Stellen Sie sicher, dass es sich bei dem Format um eines der akzeptierten Datums- und Zeitstempelformate handelt.

    Ursache

    Dieser Fehler tritt auf, wenn die Spalte EVENT_TIMESTAMP einen Wert enthält, der nicht den von Amazon Fraud Detector unterstützten Zeitstempelformaten entspricht.

    Lösung

    Stellen Sie sicher, dass die für die Spalte EVENT_TIMESTAMP angegebenen Werte den unterstützten Zeitstempelformaten entsprechen. Wenn in der Spalte EVENT_TIMESTAMP Werte fehlen, können Sie diese entweder mit Werten im unterstützten Zeitstempelformat auffüllen oder erwägen, das Ereignis komplett zu löschen, anstatt Zeichenketten wie, oder einzugeben. none null missing

  2. Art des Problems: Fehler

    Ihr Trainingsdatensatz enthält EVENT_TIMESTAMP mit fehlenden Werten. Stellen Sie sicher, dass keine Werte fehlen.

    Ursache

    Dieser Fehler tritt auf, wenn in der Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte fehlen. Amazon Fraud Detector erfordert, dass die Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte enthält.

    Lösung

    Stellen Sie sicher, dass die Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte enthält und dass diese Werte den unterstützten Zeitstempelformaten entsprechen. Wenn in der Spalte EVENT_TIMESTAMP Werte fehlen, können Sie diese entweder mit Werten im unterstützten Zeitstempelformat auffüllen oder erwägen, das Ereignis komplett zu löschen, anstatt Zeichenketten wie, oder einzugeben. none null missing

Daten wurden nicht aufgenommen

Art des Problems: Fehler

Beschreibung

Es wurden keine für das Training aufgenommenen Ereignisse gefunden. Bitte überprüfen Sie Ihre Trainingskonfiguration.

Ursache

Dieser Fehler tritt auf, wenn Sie ein Modell mit Ereignisdaten erstellen, die bei Amazon Fraud Detector gespeichert sind, aber Ihren Datensatz nicht in Amazon Fraud Detector importiert haben, bevor Sie mit dem Training Ihres Modells begonnen haben.

Lösung

Verwenden Sie den SendEvent API-Vorgang, den CreateBatchImportJob API-Vorgang oder die Batch-Importfunktion in der Amazon Fraud Detector Detector-Konsole, um zuerst Ihre Ereignisdaten zu importieren und dann Ihr Modell zu trainieren. Weitere Informationen finden Sie unter Gespeicherte Ereignisdatensätze.

Anmerkung

Wir empfehlen, nach Abschluss des Imports Ihrer Daten 10 Minuten zu warten, bevor Sie sie zum Trainieren Ihres Modells verwenden.

Sie können die Amazon Fraud Detector Detector-Konsole verwenden, um die Anzahl der Ereignisse zu überprüfen, die bereits für jeden Ereignistyp gespeichert wurden. Weitere Informationen finden Sie unter Metriken Ihrer gespeicherten Ereignisse anzeigen.

Unzureichende Variablen

Art des Problems: Fehler

Beschreibung

Der Datensatz muss mindestens 2 Variablen enthalten, die für das Training geeignet sind.

Ursache

Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als 2 Variablen enthält, die für das Modelltraining geeignet sind. Amazon Fraud Detector betrachtet eine Variable nur dann als geeignet für das Modelltraining, wenn sie alle Validierungen besteht. Wenn eine Variable die Validierung nicht besteht, wird sie vom Modelltraining ausgeschlossen und Sie erhalten eine Meldung in der Modelltrainingsdiagnose.

Lösung

Stellen Sie sicher, dass Ihr Datensatz mindestens zwei Variablen enthält, die mit Werten gefüllt sind und alle Datenvalidierungen bestanden haben. Beachten Sie, dass die Zeile mit den Event-Metadaten, in der Sie Ihre Spaltenüberschriften (EVENT_TIMESTAMP, EVENT_ID, ENTITY_ID, EVENT_LABEL usw.) angegeben haben, nicht als Variable betrachtet wird.

Fehlender oder falscher Variablentyp

Art des Problems: Warnung

Beschreibung

Der erwartete Datentyp für $variable_name ist NUMERIC. Überprüfen und aktualisieren $variable_name Sie Ihren Datensatz und trainieren Sie das Modell erneut.

Ursache

Sie erhalten diese Warnung, wenn eine Variable als NUMERIC-Variable definiert ist, sie aber im Datensatz Werte enthält, die nicht in NUMERIC konvertiert werden können. Daher wird diese Variable beim Modelltraining ausgeschlossen.

Lösung

Wenn Sie sie als NUMERISCHE Variable beibehalten möchten, stellen Sie sicher, dass die von Ihnen angegebenen Werte in Fließkommazahlen umgewandelt werden können. Beachten Sie, dass, falls die Variable fehlende Werte enthält, diese nicht mit Zeichenketten wie nonenenull, oder gefüllt missing werden sollten. Wenn die Variable nicht numerische Werte enthält, erstellen Sie sie als Variablentyp CATEGORICAL oder FREE_FORM_TEXT neu.

Fehlende Variablenwerte

Art des Problems: Warnung

Beschreibung

$thresholdWerte, die größer als für $variable_name sind, fehlen in Ihrem Trainingsdatensatz. Erwägen Sie, Ihren Datensatz zu ändern $variable_name und erneut zu trainieren, um die Leistung zu verbessern.

Ursache

Sie erhalten diese Warnung, wenn die angegebene Variable aufgrund zu vieler fehlender Werte gelöscht wird. Amazon Fraud Detector lässt fehlende Werte für eine Variable zu. Wenn jedoch bei einer Variablen zu viele Werte fehlen, trägt sie nicht viel zum Modell bei und diese Variable wird beim Modelltraining gelöscht.

Lösung

Stellen Sie zunächst sicher, dass diese fehlenden Werte nicht auf Fehler bei der Datenerfassung und -aufbereitung zurückzuführen sind. Wenn es sich um Fehler handelt, können Sie erwägen, sie aus Ihrem Modelltraining zu streichen. Wenn Sie jedoch der Meinung sind, dass diese fehlenden Werte wertvoll sind und diese Variable trotzdem beibehalten möchten, können Sie fehlende Werte sowohl beim Modelltraining als auch bei der Echtzeit-Inferenz manuell mit einer Konstante füllen.

Unzureichende eindeutige Variablenwerte

Art des Problems: Warnung

Beschreibung

Die Anzahl der Einzelwerte von $variable_name liegt unter 100. Überprüfen und aktualisieren $variable_name Sie Ihren Datensatz und trainieren Sie das Modell erneut.

Ursache

Sie erhalten diese Warnung, wenn die Anzahl der Einzelwerte der angegebenen Variablen unter 100 liegt. Die Schwellenwerte unterscheiden sich je nach Variablentyp. Bei sehr wenigen Einzelwerten besteht das Risiko, dass der Datensatz nicht allgemein genug ist, um den Merkmalsraum dieser Variablen abzudecken. Infolgedessen lässt sich das Modell bei Echtzeitvorhersagen möglicherweise nicht gut generalisieren.

Lösung

Stellen Sie zunächst sicher, dass die Variablenverteilung für den tatsächlichen Geschäftsverkehr repräsentativ ist. Anschließend können Sie entweder besser trainierte Variablen mit höherer Kardinalität verwenden, z. B. full_customer_name anstelle von first_name und last_name getrennt verwenden, oder den Variablentyp in KATEGORISCH ändern, was eine geringere Kardinalität ermöglicht.

Falscher Variablenausdruck

  1. Art des Problems: Information

    Beschreibung

    Mehr als 50% der $email_variable_name Werte stimmen nicht mit dem erwarteten regulären Ausdruck http://emailregex.com überein. Erwägen Sie, Ihren Datensatz zu ändern $email_variable_name und erneut zu trainieren, um die Leistung zu verbessern.

    Ursache

    Diese Informationen werden angezeigt, wenn mehr als 50% der Datensätze in Ihrem Datensatz E-Mail-Werte enthalten, die nicht einem regulären E-Mail-Ausdruck entsprechen und daher nicht überprüft werden können.

    Lösung

    Formatieren Sie die E-Mail-Variablenwerte so, dass sie dem regulären Ausdruck entsprechen. Wenn E-Mail-Werte fehlen, empfehlen wir, sie leer zu lassen, anstatt sie mit Zeichenfolgen wie nonenull, oder zu füllenmissing.

  2. Art des Problems: Information

    Beschreibung

    Mehr als 50% der $IP_variable_name Werte entsprechen nicht den regulären Ausdrücken für IPv4 oder IPv6 Adressen https://digitalfortress.tech/tricks/top-15-com monly-used-regex /. Erwägen Sie, Ihren Datensatz zu ändern $IP_variable_name und erneut zu trainieren, um die Leistung zu verbessern.

    Ursache

    Diese Informationen werden angezeigt, wenn mehr als 50% der Datensätze in Ihrem Datensatz IP-Werte enthalten, die nicht einem regulären IP-Ausdruck entsprechen und daher nicht validiert werden können.

    Lösung

    Formatieren Sie die IP-Werte so, dass sie dem regulären Ausdruck entsprechen. Wenn IP-Werte fehlen, empfehlen wir, sie leer zu lassen, anstatt sie mit Zeichenfolgen wie nonenull, oder zu füllenmissing.

  3. Art des Problems: Information

    Beschreibung

    Mehr als 50% der $phone_variable_name Werte stimmen nicht mit dem regulären Standardausdruck für Telefone /$pattern/ überein. Erwägen Sie, Ihren Datensatz $phone_variable_name zu ändern und erneut zu trainieren, um die Leistung zu verbessern.

    Ursache

    Diese Informationen werden angezeigt, wenn mehr als 50% der Datensätze in Ihrem Datensatz Telefonnummern enthalten, die nicht einem regulären Telefonnummernausdruck entsprechen und daher nicht überprüft werden können.

    Lösung

    Formatieren Sie die Telefonnummern so, dass sie dem regulären Ausdruck entsprechen. Wenn Telefonnummern fehlen, empfehlen wir, sie leer zu lassen, anstatt sie mit Zeichenfolgen wie nonenull, oder zu füllenmissing.

Unzureichende eindeutige Entitäten

Art des Problems: Information

Beschreibung

Die Anzahl der eindeutigen Entitäten beträgt weniger als 1500. Erwägen Sie, mehr Daten einzubeziehen, um die Leistung zu verbessern.

Ursache

Diese Informationen werden angezeigt, wenn Ihr Datensatz eine geringere Anzahl eindeutiger Entitäten als die empfohlene Anzahl enthält. Das Modell Transaction Fraud Insights (TFI) verwendet sowohl Zeitreihenaggregate als auch generische Transaktionsfunktionen, um die beste Leistung zu erzielen. Wenn Ihr Datensatz zu wenige eindeutige Entitäten enthält, haben die meisten Ihrer generischen Daten wie IP_ADDRESS, EMAIL_ADDRESS möglicherweise keine eindeutigen Werte. Dann besteht auch das Risiko, dass dieser Datensatz nicht allgemein genug ist, um den Merkmalsraum dieser Variablen abzudecken. Infolgedessen lässt sich das Modell bei Transaktionen von neuen Entitäten möglicherweise nicht gut generalisieren.

Lösung

Fügen Sie mehr Entitäten hinzu. Erweitern Sie bei Bedarf den Zeitraum Ihrer Trainingsdaten.