Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Fehlerbehebung
Die folgenden Abschnitte helfen Ihnen bei der Behebung von Problemen, die bei der Arbeit mit Amazon Fraud Detector auftreten können.
Beheben Sie Probleme mit Trainingsdaten
Verwenden Sie die Informationen in diesem Abschnitt, um Probleme zu diagnostizieren und zu lösen, die beim Training Ihres Modells möglicherweise im Bereich Modelltraining-Diagnose in der Amazon Fraud Detector Detector-Konsole auftreten.
Die im Diagnosebereich Model Training angezeigten Probleme sind wie folgt kategorisiert. Ob das Problem behoben werden muss, hängt von der Kategorie des Problems ab.
-
Fehler — führt dazu, dass das Modelltraining fehlschlägt. Diese Probleme müssen behoben werden, damit das Modell erfolgreich trainiert werden kann.
-
Warnung — bewirkt, dass das Modelltraining fortgesetzt wird, einige Variablen werden jedoch möglicherweise aus dem Trainingsprozess ausgeschlossen. Suchen Sie in diesem Abschnitt nach den entsprechenden Anleitungen, um die Qualität Ihres Datensatzes zu verbessern.
-
Information (Info) — hat keinen Einfluss auf das Modelltraining und alle Variablen werden für das Training verwendet. Wir empfehlen Ihnen, die entsprechenden Hinweise in diesem Abschnitt zu lesen, um die Qualität Ihres Datensatzes und die Modellleistung weiter zu verbessern.
Themen
Instabile Betrugsrate im angegebenen Datensatz
Art des Problems: Fehler
Beschreibung
Die Betrugsrate bei den angegebenen Daten ist im Laufe der Zeit zu instabil. Bitte stellen Sie sicher, dass Ihre Betrugsfälle und legitimen Ereignisse im Laufe der Zeit einheitlich erfasst werden.
Ursache
Dieser Fehler tritt auf, wenn die betrügerischen und legitimen Ereignisse in Ihrem Datensatz ungleichmäßig verteilt sind und aus unterschiedlichen Zeitfenstern stammen. Amazon Fraud Detector modelliert den Trainingsprozess mit Stichproben und partitioniert Ihren Datensatz auf der Grundlage von EVENT_TIMESTAMP. Wenn Ihr Datensatz beispielsweise aus Betrugsereignissen der letzten 6 Monate besteht, aber nur legitime Ereignisse des letzten Monats enthalten sind, gilt der Datensatz als instabil. Ein instabiler Datensatz kann zu Verzerrungen bei der Bewertung der Modellleistung führen.
Lösung
Stellen Sie sicher, dass Sie die Daten zu betrügerischen und legitimen Ereignissen aus demselben Zeitfenster bereitstellen, damit sich die Betrugsrate im Laufe der Zeit nicht dramatisch ändert.
Unzureichende Daten
-
Art des Problems: Fehler
Beschreibung
Weniger als 50 Zeilen sind als betrügerische Ereignisse gekennzeichnet. Stellen Sie sicher, dass sowohl betrügerische als auch legitime Ereignisse die Mindestanzahl von 50 überschreiten, und trainieren Sie das Modell erneut.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als betrügerisch eingestufte Ereignisse enthält, als für das Modelltraining erforderlich sind. Amazon Fraud Detector benötigt mindestens 50 betrügerische Ereignisse, um Ihr Modell zu trainieren.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 50 betrügerische Ereignisse enthält. Sie können dies sicherstellen, indem Sie bei Bedarf einen längeren Zeitraum abdecken.
-
Art des Problems: Fehler
Beschreibung
Weniger als 50 Zeilen werden als legitime Ereignisse gekennzeichnet. Stellen Sie sicher, dass sowohl betrügerische als auch legitime Ereignisse die Mindestanzahl von $threshold überschreiten, und trainieren Sie das Modell erneut.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Ereignisse enthält, die als legitim eingestuft wurden, als für das Modelltraining erforderlich sind. Amazon Fraud Detector benötigt mindestens 50 legitime Ereignisse, um Ihr Modell zu trainieren.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 50 legitime Ereignisse enthält. Sie können dies sicherstellen, indem Sie bei Bedarf einen längeren Zeitraum abdecken.
-
Art des Problems: Fehler
Beschreibung
Die Anzahl der eindeutigen Entitäten, die mit Betrug in Verbindung gebracht werden, liegt unter 100. Erwägen Sie, mehr Beispiele für betrügerische Unternehmen aufzunehmen, um die Leistung zu verbessern.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Entitäten mit betrügerischen Ereignissen enthält, als für das Modelltraining erforderlich sind. Für das Modell Transaction Fraud Insights (TFI) sind mindestens 100 Entitäten mit Betrugsereignissen erforderlich, um eine maximale Abdeckung des Betrugsbereichs zu gewährleisten. Das Modell lässt sich möglicherweise nicht gut verallgemeinern, wenn alle Betrugsereignisse von einer kleinen Gruppe von Unternehmen durchgeführt werden.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 100 Entitäten mit betrügerischen Ereignissen enthält. Sie können bei Bedarf sicherstellen, dass dies einen längeren Zeitraum abdeckt.
-
Art des Problems: Fehler
Beschreibung
Die Anzahl der eindeutigen Entitäten, die legitimen Entitäten zugeordnet sind, liegt unter 100. Erwägen Sie, mehr Beispiele für legitime Entitäten aufzunehmen, um die Leistung zu verbessern.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger Entitäten mit legitimen Ereignissen enthält, als für das Modelltraining erforderlich sind. Das Modell Transaction Fraud Insights (TFI) erfordert mindestens 100 Entitäten mit legitimen Ereignissen, um eine maximale Abdeckung des Betrugsbereichs zu gewährleisten. Das Modell lässt sich möglicherweise nicht gut verallgemeinern, wenn alle legitimen Ereignisse von einer kleinen Gruppe von Entitäten durchgeführt werden.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens 100 Entitäten mit legitimen Ereignissen enthält. Sie können bei Bedarf sicherstellen, dass dies einen längeren Zeitraum abdeckt.
-
Art des Problems: Fehler
Beschreibung
Der Datensatz enthält weniger als 100 Zeilen. Stellen Sie sicher, dass der Gesamtdatensatz mehr als 100 Zeilen enthält und mindestens 50 Zeilen als betrügerisch gekennzeichnet sind.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als 100 Datensätze enthält. Amazon Fraud Detector benötigt für das Modelltraining Daten von mindestens 100 Ereignissen (Datensätzen) in Ihrem Datensatz.
Lösung
Stellen Sie sicher, dass Ihr Datensatz Daten von mehr als 100 Ereignissen enthält.
Fehlende oder unterschiedliche EVENT_LABEL-Werte
-
Art des Problems: Fehler
Beschreibung
Mehr als 1% Ihrer EVENT_LABEL-Spalte sind Null oder es handelt sich um Werte, die nicht in der Modellkonfiguration definiert sind.
$label_values
Stellen Sie sicher, dass in Ihrer EVENT_LABEL-Spalte weniger als 1% der fehlenden Werte vorhanden sind und dass die Werte denen entsprechen, die in der Modellkonfiguration definiert sind.$label_values
Ursache
Dieser Fehler tritt aus einem der folgenden Gründe auf:
-
Bei mehr als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthält, fehlen Werte in der Spalte EVENT_LABEL.
-
Mehr als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthalten, haben Werte in der Spalte EVENT_LABEL, die sich von denen unterscheiden, die deinem Ereignistyp zugeordnet sind.
Das Modell Online Fraud Insights (OFI) erfordert, dass die Spalte EVENT_LABEL in jedem Datensatz mit einem der Labels gefüllt wird, die mit Ihrem Ereignistyp verknüpft sind (oder zugeordnet sind).
CreateModelVersion
Lösung
Wenn dieser Fehler auf die fehlenden EVENT_LABEL-Werte zurückzuführen ist, sollten Sie erwägen, diesen Datensätzen die richtigen Bezeichnungen zuzuweisen oder diese Datensätze aus Ihrem Datensatz zu löschen. Wenn dieser Fehler darauf zurückzuführen ist, dass die Beschriftungen einiger Datensätze nicht dazugehören
label_values
, stellen Sie sicher, dass Sie alle Werte in der Spalte EVENT_LABEL den Beschriftungen des Ereignistyps hinzufügen und bei der Modellerstellung entweder betrügerisch oder legitim (Betrug, legitim) zuordnen. -
-
Art des Problems: Information
Beschreibung
Ihre EVENT_LABEL-Spalte enthält Nullwerte oder Labelwerte, die nicht in der Modellkonfiguration definiert sind.
$label_values
Diese inkonsistenten Werte wurden vor dem Training auf „Kein Betrug“ umgerechnet.Ursache
Sie erhalten diese Informationen aus einem der folgenden Gründe:
-
Bei weniger als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthalten, fehlen Werte in der Spalte EVENT_LABEL
-
Weniger als 1% der Datensätze in der CSV-Datei, die deine Trainingsdaten enthalten, haben Werte in der Spalte EVENT_LABEL, die sich von denen unterscheiden, die deinem Ereignistyp zugeordnet sind.
Das Modelltraining wird in beiden Fällen erfolgreich sein. Die Labelwerte der Ereignisse, bei denen Labelwerte fehlen oder denen nicht zugeordnet wurden, werden jedoch in legitime Werte umgewandelt. Wenn Sie der Meinung sind, dass dies ein Problem ist, folgen Sie der unten angegebenen Lösung.
Lösung
Wenn in Ihrem Datensatz EVENT_LABEL-Werte fehlen, sollten Sie erwägen, diese Datensätze aus Ihrem Datensatz zu löschen. Wenn die für diese EVENT_LABELS bereitgestellten Werte nicht zugeordnet sind, stellen Sie sicher, dass all diese Werte für jedes Ereignis entweder betrügerisch oder legitim (Betrug, legitim) zugeordnet sind.
-
Fehlende oder falsche EVENT_TIMESTAMP-Werte
-
Art des Problems: Fehler
Beschreibung
Ihr Trainingsdatensatz enthält EVENT_TIMESTAMP mit Zeitstempeln, die nicht den akzeptierten Formaten entsprechen. Stellen Sie sicher, dass es sich bei dem Format um eines der akzeptierten Datums- und Zeitstempelformate handelt.
Ursache
Dieser Fehler tritt auf, wenn die Spalte EVENT_TIMESTAMP einen Wert enthält, der nicht den von Amazon Fraud Detector unterstützten Zeitstempelformaten entspricht.
Lösung
Stellen Sie sicher, dass die für die Spalte EVENT_TIMESTAMP angegebenen Werte den unterstützten Zeitstempelformaten entsprechen. Wenn in der Spalte EVENT_TIMESTAMP Werte fehlen, können Sie diese entweder mit Werten im unterstützten Zeitstempelformat auffüllen oder erwägen, das Ereignis komplett zu löschen, anstatt Zeichenketten wie, oder einzugeben.
none
null
missing
-
Art des Problems: Fehler
Ihr Trainingsdatensatz enthält EVENT_TIMESTAMP mit fehlenden Werten. Stellen Sie sicher, dass keine Werte fehlen.
Ursache
Dieser Fehler tritt auf, wenn in der Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte fehlen. Amazon Fraud Detector erfordert, dass die Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte enthält.
Lösung
Stellen Sie sicher, dass die Spalte EVENT_TIMESTAMP in Ihrem Datensatz Werte enthält und dass diese Werte den unterstützten Zeitstempelformaten entsprechen. Wenn in der Spalte EVENT_TIMESTAMP Werte fehlen, können Sie diese entweder mit Werten im unterstützten Zeitstempelformat auffüllen oder erwägen, das Ereignis komplett zu löschen, anstatt Zeichenketten wie, oder einzugeben.
none
null
missing
Daten wurden nicht aufgenommen
Art des Problems: Fehler
Beschreibung
Es wurden keine für das Training aufgenommenen Ereignisse gefunden. Bitte überprüfen Sie Ihre Trainingskonfiguration.
Ursache
Dieser Fehler tritt auf, wenn Sie ein Modell mit Ereignisdaten erstellen, die bei Amazon Fraud Detector gespeichert sind, aber Ihren Datensatz nicht in Amazon Fraud Detector importiert haben, bevor Sie mit dem Training Ihres Modells begonnen haben.
Lösung
Verwenden Sie den SendEvent
API-Vorgang, den CreateBatchImportJob
API-Vorgang oder die Batch-Importfunktion in der Amazon Fraud Detector Detector-Konsole, um zuerst Ihre Ereignisdaten zu importieren und dann Ihr Modell zu trainieren. Weitere Informationen finden Sie unter Gespeicherte Ereignisdatensätze.
Anmerkung
Wir empfehlen, nach Abschluss des Imports Ihrer Daten 10 Minuten zu warten, bevor Sie sie zum Trainieren Ihres Modells verwenden.
Sie können die Amazon Fraud Detector Detector-Konsole verwenden, um die Anzahl der Ereignisse zu überprüfen, die bereits für jeden Ereignistyp gespeichert wurden. Weitere Informationen finden Sie unter Metriken Ihrer gespeicherten Ereignisse anzeigen.
Unzureichende Variablen
Art des Problems: Fehler
Beschreibung
Der Datensatz muss mindestens 2 Variablen enthalten, die für das Training geeignet sind.
Ursache
Dieser Fehler tritt auf, wenn Ihr Datensatz weniger als 2 Variablen enthält, die für das Modelltraining geeignet sind. Amazon Fraud Detector betrachtet eine Variable nur dann als geeignet für das Modelltraining, wenn sie alle Validierungen besteht. Wenn eine Variable die Validierung nicht besteht, wird sie vom Modelltraining ausgeschlossen und Sie erhalten eine Meldung in der Modelltrainingsdiagnose.
Lösung
Stellen Sie sicher, dass Ihr Datensatz mindestens zwei Variablen enthält, die mit Werten gefüllt sind und alle Datenvalidierungen bestanden haben. Beachten Sie, dass die Zeile mit den Event-Metadaten, in der Sie Ihre Spaltenüberschriften (EVENT_TIMESTAMP, EVENT_ID, ENTITY_ID, EVENT_LABEL usw.) angegeben haben, nicht als Variable betrachtet wird.
Fehlender oder falscher Variablentyp
Art des Problems: Warnung
Beschreibung
Der erwartete Datentyp für $variable_name
ist NUMERIC. Überprüfen und aktualisieren $variable_name
Sie Ihren Datensatz und trainieren Sie das Modell erneut.
Ursache
Sie erhalten diese Warnung, wenn eine Variable als NUMERIC-Variable definiert ist, sie aber im Datensatz Werte enthält, die nicht in NUMERIC konvertiert werden können. Daher wird diese Variable beim Modelltraining ausgeschlossen.
Lösung
Wenn Sie sie als NUMERISCHE Variable beibehalten möchten, stellen Sie sicher, dass die von Ihnen angegebenen Werte in Fließkommazahlen umgewandelt werden können. Beachten Sie, dass, falls die Variable fehlende Werte enthält, diese nicht mit Zeichenketten wie nonene
null
, oder gefüllt missing
werden sollten. Wenn die Variable nicht numerische Werte enthält, erstellen Sie sie als Variablentyp CATEGORICAL oder FREE_FORM_TEXT neu.
Fehlende Variablenwerte
Art des Problems: Warnung
Beschreibung
$threshold
Werte, die größer als für $variable_name
sind, fehlen in Ihrem Trainingsdatensatz. Erwägen Sie, Ihren Datensatz zu ändern $variable_name
und erneut zu trainieren, um die Leistung zu verbessern.
Ursache
Sie erhalten diese Warnung, wenn die angegebene Variable aufgrund zu vieler fehlender Werte gelöscht wird. Amazon Fraud Detector lässt fehlende Werte für eine Variable zu. Wenn jedoch bei einer Variablen zu viele Werte fehlen, trägt sie nicht viel zum Modell bei und diese Variable wird beim Modelltraining gelöscht.
Lösung
Stellen Sie zunächst sicher, dass diese fehlenden Werte nicht auf Fehler bei der Datenerfassung und -aufbereitung zurückzuführen sind. Wenn es sich um Fehler handelt, können Sie erwägen, sie aus Ihrem Modelltraining zu streichen. Wenn Sie jedoch der Meinung sind, dass diese fehlenden Werte wertvoll sind und diese Variable trotzdem beibehalten möchten, können Sie fehlende Werte sowohl beim Modelltraining als auch bei der Echtzeit-Inferenz manuell mit einer Konstante füllen.
Unzureichende eindeutige Variablenwerte
Art des Problems: Warnung
Beschreibung
Die Anzahl der Einzelwerte von $variable_name
liegt unter 100. Überprüfen und aktualisieren $variable_name
Sie Ihren Datensatz und trainieren Sie das Modell erneut.
Ursache
Sie erhalten diese Warnung, wenn die Anzahl der Einzelwerte der angegebenen Variablen unter 100 liegt. Die Schwellenwerte unterscheiden sich je nach Variablentyp. Bei sehr wenigen Einzelwerten besteht das Risiko, dass der Datensatz nicht allgemein genug ist, um den Merkmalsraum dieser Variablen abzudecken. Infolgedessen lässt sich das Modell bei Echtzeitvorhersagen möglicherweise nicht gut generalisieren.
Lösung
Stellen Sie zunächst sicher, dass die Variablenverteilung für den tatsächlichen Geschäftsverkehr repräsentativ ist. Anschließend können Sie entweder besser trainierte Variablen mit höherer Kardinalität verwenden, z. B. full_customer_name
anstelle von first_name
und last_name
getrennt verwenden, oder den Variablentyp in KATEGORISCH ändern, was eine geringere Kardinalität ermöglicht.
Falscher Variablenausdruck
-
Art des Problems: Information
Beschreibung
Mehr als 50% der
$email_variable_name
Werte stimmen nicht mit dem erwarteten regulären Ausdruck http://emailregex.com überein. Erwägen Sie, Ihren Datensatz zu ändern$email_variable_name
und erneut zu trainieren, um die Leistung zu verbessern.Ursache
Diese Informationen werden angezeigt, wenn mehr als 50% der Datensätze in Ihrem Datensatz E-Mail-Werte enthalten, die nicht einem regulären E-Mail-Ausdruck entsprechen und daher nicht überprüft werden können.
Lösung
Formatieren Sie die E-Mail-Variablenwerte so, dass sie dem regulären Ausdruck entsprechen. Wenn E-Mail-Werte fehlen, empfehlen wir, sie leer zu lassen, anstatt sie mit Zeichenfolgen wie
none
null
, oder zu füllenmissing
. -
Art des Problems: Information
Beschreibung
Mehr als 50% der
$IP_variable_name
Werte entsprechen nicht den regulären Ausdrücken für IPv4 oder IPv6 Adressen https://digitalfortress.tech/tricks/top-15-com monly-used-regex /. Erwägen Sie, Ihren Datensatz zu ändern$IP_variable_name
und erneut zu trainieren, um die Leistung zu verbessern.Ursache
Diese Informationen werden angezeigt, wenn mehr als 50% der Datensätze in Ihrem Datensatz IP-Werte enthalten, die nicht einem regulären IP-Ausdruck entsprechen und daher nicht validiert werden können.
Lösung
Formatieren Sie die IP-Werte so, dass sie dem regulären Ausdruck entsprechen. Wenn IP-Werte fehlen, empfehlen wir, sie leer zu lassen, anstatt sie mit Zeichenfolgen wie
none
null
, oder zu füllenmissing
. -
Art des Problems: Information
Beschreibung
Mehr als 50% der
$phone_variable_name
Werte stimmen nicht mit dem regulären Standardausdruck für Telefone /$pattern/ überein. Erwägen Sie, Ihren Datensatz$phone_variable_name
zu ändern und erneut zu trainieren, um die Leistung zu verbessern.Ursache
Diese Informationen werden angezeigt, wenn mehr als 50% der Datensätze in Ihrem Datensatz Telefonnummern enthalten, die nicht einem regulären Telefonnummernausdruck entsprechen und daher nicht überprüft werden können.
Lösung
Formatieren Sie die Telefonnummern so, dass sie dem regulären Ausdruck entsprechen. Wenn Telefonnummern fehlen, empfehlen wir, sie leer zu lassen, anstatt sie mit Zeichenfolgen wie
none
null
, oder zu füllenmissing
.
Unzureichende eindeutige Entitäten
Art des Problems: Information
Beschreibung
Die Anzahl der eindeutigen Entitäten beträgt weniger als 1500. Erwägen Sie, mehr Daten einzubeziehen, um die Leistung zu verbessern.
Ursache
Diese Informationen werden angezeigt, wenn Ihr Datensatz eine geringere Anzahl eindeutiger Entitäten als die empfohlene Anzahl enthält. Das Modell Transaction Fraud Insights (TFI) verwendet sowohl Zeitreihenaggregate als auch generische Transaktionsfunktionen, um die beste Leistung zu erzielen. Wenn Ihr Datensatz zu wenige eindeutige Entitäten enthält, haben die meisten Ihrer generischen Daten wie IP_ADDRESS, EMAIL_ADDRESS möglicherweise keine eindeutigen Werte. Dann besteht auch das Risiko, dass dieser Datensatz nicht allgemein genug ist, um den Merkmalsraum dieser Variablen abzudecken. Infolgedessen lässt sich das Modell bei Transaktionen von neuen Entitäten möglicherweise nicht gut generalisieren.
Lösung
Fügen Sie mehr Entitäten hinzu. Erweitern Sie bei Bedarf den Zeitraum Ihrer Trainingsdaten.