

自 2025 年 11 月 7 日起，Amazon Fraud Detector 不再向新客戶開放。對於類似 Amazon Fraud Detector 的功能，請探索 Amazon SageMaker、AutoGluon 和 AWS WAF。

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 疑難排解
<a name="troubleshoot"></a>

下列各節可協助您針對使用 Amazon Fraud Detector 時可能遇到的問題進行疑難排解

## 訓練資料問題疑難排解
<a name="troubleshoot-training-data"></a>

使用本節中的資訊來協助診斷和解決您在訓練模型時，**Amazon Fraud Detector 主控台的模型訓練診斷**窗格中可能看到的問題。

**模型訓練診斷**窗格中顯示的問題分類如下。解決問題的要求取決於問題的類別。
+  ![Error icon](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/images/Error icon.png) **錯誤** - 導致模型訓練失敗。必須解決這些問題，模型才能成功訓練。
+  ![Warning icon](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/images/Warning icon.png) **警告** - 導致模型訓練繼續，但有些變數可能會在訓練程序中遭到排除。檢查本節中的相關指引，以改善資料集的品質。
+  ![Information icon](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/images/Info icon.png) **資訊 （資訊）** - 不會影響模型訓練，且所有變數都用於訓練。建議您查看本節中的相關指引，以進一步改善資料集和模型效能的品質。

**Topics**
+ [指定資料集中的不穩定詐騙率](#unstable-fraud-rate)
+ [資料不足](#insufficient-data)
+ [缺少或不同的 EVENT\_LABEL 值](#missing-different-event-label-values)
+ [缺少或不正確的 EVENT\_TIMESTAMP 值](#missing-incorrect-timestamp-values)
+ [資料未擷取](#data-not-ingested)
+ [變數不足](#insufficient-variables)
+ [變數類型遺失或不正確](#missing-incorrect-variable-type)
+ [缺少變數值](#missing-variable-values)
+ [唯一的變數值不足](#insufficient-unique-variable-values)
+ [變數表達式不正確](#incorrect-variable-expression)
+ [唯一實體不足](#insufficient-unique-entities)

### 指定資料集中的不穩定詐騙率
<a name="unstable-fraud-rate"></a>

**問題類型：錯誤**

**Description**

指定資料中的詐騙率隨著時間過於不穩定。請確定您的詐騙和合法事件會隨著時間統一抽樣。

**原因**

如果資料集中的詐騙和合法事件分佈不均勻，並從不同的時段取得，則會發生此錯誤。Amazon Fraud Detector 模型訓練程序範例，並根據 EVENT\_TIMESTAMP 分割資料集。例如，如果您的資料集包含從過去 6 個月提取的詐騙事件，但只包含最後一個月的合法事件，則資料集會被視為不穩定。不穩定的資料集可能會導致模型效能評估中的偏差。

**解決方案**

請務必提供相同時段的詐騙和合法事件資料，而且詐騙率不會隨著時間而大幅改變。

### 資料不足
<a name="insufficient-data"></a>

1. **問題類型：錯誤**

   **Description**

   少於 50 個資料列會標記為詐騙事件。確保詐騙和合法事件都超過 50 個的最低計數，並重新訓練模型。

   **原因**

   如果您的資料集標記為詐騙的事件少於模型訓練所需的事件，則會發生此錯誤。Amazon Fraud Detector 需要至少 50 個詐騙事件來訓練您的模型。

   **解決方案**

   請確定您的資料集包含至少 50 個詐騙事件。如有需要，您可以涵蓋較長的期間來確保這一點。

1. **問題類型：錯誤 **

   **Description**

   少於 50 個資料列會標記為合法事件。確保欺詐和合法事件都超過 $threshold 的最低計數，並重新訓練模型。

   **原因**

   如果您的資料集標記為合法的事件少於模型訓練所需的事件，則會發生此錯誤。Amazon Fraud Detector 需要至少 50 個合法事件來訓練您的模型。

   **解決方案**

   請確定您的資料集包含至少 50 個合法事件。如有需要，您可以涵蓋較長的期間來確保這一點。

1. **問題類型：錯誤 **

   **Description**

   與詐騙相關聯的唯一實體數量少於 100。請考慮包含更多詐騙實體的範例，以改善效能。

   **原因**

   如果您的資料集具有的詐騙事件實體少於模型訓練所需的實體，則會發生此錯誤。Transaction Fraud Insights (TFI) 模型需要至少 100 個具有詐騙事件的實體，以確保詐騙空間的最大涵蓋範圍。如果所有詐騙事件都是由一小群實體執行，則模型可能不會有良好的概括性。

   **解決方案**

   請確定您的資料集包含至少 100 個具有詐騙事件的實體。如有需要，您可以確保涵蓋更長的時間。

1. **問題類型：錯誤**

   **Description**

   與合法相關聯的唯一實體數量小於 100。考慮包含更多合法實體的範例，以改善效能。

   **原因**

   如果您的資料集具有合法事件的實體少於模型訓練所需的實體，則會發生此錯誤。Transaction Fraud Insights (TFI) 模型需要至少 100 個具有合法事件的實體，以確保詐騙空間的最大涵蓋範圍。如果所有合法事件都由一小群實體執行，則模型可能不會妥善概括。

   **解決方案**

   請確定您的資料集包含至少 100 個具有合法事件的實體。如有需要，您可以確保涵蓋更長的時間。

1. **問題類型：錯誤**

   **Description**

   資料集中少於 100 個資料列。確保總資料集中有超過 100 個資料列，且至少 50 個資料列標記為詐騙。

   **原因**

   如果您的資料集包含的記錄少於 100 筆，就會發生此錯誤。Amazon Fraud Detector 需要至少 100 個資料集事件 （記錄） 的資料，才能進行模型訓練。

   **解決方案**

   請確定您的資料集中有來自超過 100 個事件的資料。

### 缺少或不同的 EVENT\_LABEL 值
<a name="missing-different-event-label-values"></a>

1. **問題類型：錯誤 **

   **Description**

   大於 1% 的 EVENT\_LABEL 資料欄是 null 或值，而不是模型組態 中定義的值**$label\_values**。請確定您的 EVENT\_LABEL 資料欄中缺少的值少於 1%，且這些值是在模型組態 中定義的值**$label\_values**。

   **原因**

   由於下列其中一個原因，發生此錯誤：
   + 包含訓練資料的 CSV 檔案中，有超過 1% 的記錄在 EVENT\_LABEL 資料欄中缺少值。
   + 包含訓練資料的 CSV 檔案中超過 1% 的記錄，其 EVENT\_LABEL 資料欄中的值與事件類型相關聯的值不同。

   線上詐騙洞見 (OFI) 模型要求每個記錄中的 EVENT\_LABEL 資料欄填入與您的事件類型相關聯的其中一個標籤 （或在 中映射`CreateModelVersion`)。

   **解決方案**

   如果此錯誤是由於缺少 EVENT\_LABEL 值，請考慮為這些記錄指派適當的標籤，或從資料集捨棄這些記錄。如果此錯誤是因為某些記錄的標籤不在 之間**label\_values**，請務必將 EVENT\_LABEL 欄中的所有值新增至事件類型的標籤，並在模型建立中映射到欺詐或合法 （欺詐、合法）。

1. **問題類型：資訊**

   **Description**

   您的 EVENT\_LABEL 資料欄包含 Null 值或標籤值，但模型組態 中定義的值除外**$label\_values**。這些不一致的值在訓練之前已轉換為「非詐騙」。

   **原因**

   由於下列其中一個原因，您會收到此資訊：
   + 包含訓練資料的 CSV 檔案中，少於 1% 的記錄在 EVENT\_LABEL 欄中缺少值
   + 包含訓練資料的 CSV 檔案中少於 1% 的記錄，其 EVENT\_LABEL 資料欄中的值與事件類型相關聯的值不同。

   這兩種情況下的模型訓練都會成功。不過，這些具有遺失或未映射標籤值的事件的標籤值會轉換為合法。如果您認為這是問題，請遵循以下提供的解決方案。

   **解決方案**

   如果您的資料集中缺少 EVENT\_LABEL 值，請考慮從資料集捨棄這些記錄。如果為這些 EVENT\_LABELS 提供的值未映射，請確保所有這些值都映射到每個事件的欺詐或合法 （欺詐、合法）。

### 缺少或不正確的 EVENT\_TIMESTAMP 值
<a name="missing-incorrect-timestamp-values"></a>

1. **問題類型：錯誤**

   **Description**

   您的訓練資料集包含 EVENT\_TIMESTAMP，其時間戳記不符合可接受的格式。確保格式是其中一個可接受的日期/時間戳記格式。

   **原因**

   如果 EVENT\_TIMESTAMP 資料欄包含的值不符合 Amazon Fraud Detector 支援的[時間戳記格式](https://docs.aws.amazon.com/frauddetector/latest/ug/online-fraud-insights.html#timestamp-formats)，則會發生此錯誤。

   **解決方案**

   確保為 EVENT\_TIMESTAMP 資料欄提供的值符合支援的[時間戳記格式](https://docs.aws.amazon.com/frauddetector/latest/ug/online-fraud-insights.html#timestamp-formats)。如果您在 EVENT\_TIMESTAMP 欄中缺少值，您可以使用支援的時間戳記格式來回填這些值，或者考慮完全捨棄事件，而不是輸入字串，例如 `none`、 `null`或 `missing`。

1. **問題類型：錯誤**

   您的訓練資料集包含缺少值的 EVENT\_TIMESTAMP。請確定您沒有遺漏的值。

   **原因**

   如果資料集中的 EVENT\_TIMESTAMP 資料欄缺少值，就會發生此錯誤。Amazon Fraud Detector 要求資料集中的 EVENT\_TIMESTAMP 資料欄具有值。

   **解決方案**

   請確定資料集中的 EVENT\_TIMESTAMP 資料欄具有值，且這些值符合支援的[時間戳記格式](https://docs.aws.amazon.com/frauddetector/latest/ug/online-fraud-insights.html#timestamp-formats)。如果您在 EVENT\_TIMESTAMP 欄中缺少值，您可以使用支援的時間戳記格式來回填這些值，或者考慮完全捨棄事件，而不是輸入字串，例如 `none`、 `null`或 `missing`。

### 資料未擷取
<a name="data-not-ingested"></a>

**問題類型：錯誤**

**Description**

找不到用於訓練的擷取事件，請檢查您的訓練組態。

**原因**

如果您使用 Amazon Fraud Detector 存放的事件資料建立模型，但在開始訓練模型之前未將資料集匯入 Amazon Fraud Detector，則會發生此錯誤。

**解決方案**

使用 Amazon Fraud Detector 主控台中的 `SendEvent` API 操作、`CreateBatchImportJob`API 操作或批次匯入功能，先匯入事件資料，然後訓練模型。如需詳細資訊[，請參閱儲存的事件資料集](https://docs.aws.amazon.com/frauddetector/latest/ug/storing-event-data-afd.html)。

**注意**  
建議您在完成匯入資料後等待 10 分鐘，再使用資料來訓練模型。

您可以使用 Amazon Fraud Detector 主控台來檢查已為每個事件類型存放的事件數量。如需詳細資訊，請參閱[檢視預存事件的指標](https://docs.aws.amazon.com/frauddetector/latest/ug/storing-event-data-afd.html#view-stored-event-metrics)。

### 變數不足
<a name="insufficient-variables"></a>

**問題類型：錯誤**

**Description**

資料集必須至少包含 2 個適合訓練的變數。

**原因**

如果您的資料集包含少於 2 個適合模型訓練的變數，則會發生此錯誤。只有在 Amazon Fraud Detector 通過所有驗證時，才會考慮適合模型訓練的變數。如果變數驗證失敗，則會在模型訓練中排除，您會在**模型訓練診斷**中看到訊息。

**解決方案**

確保您的資料集至少有兩個填入值並傳遞所有資料驗證的變數。請注意，您已提供資料欄標頭的事件中繼資料資料列 (EVENT\_TIMESTAMP、EVENT\_ID、ENTITY\_ID、EVENT\_LABEL 等） 不會視為變數。

### 變數類型遺失或不正確
<a name="missing-incorrect-variable-type"></a>

**問題類型：警告**

**Description**

的預期資料類型**$variable\_name**為 NUMERIC。在資料集**$variable\_name**中檢閱和更新，並重新訓練模型。

**原因**

如果變數定義為 NUMERIC 變數，但資料集中有無法轉換為 NUMERIC 的值，則會收到此警告。因此，該變數會排除在模型訓練中。

**解決方案**

如果您想要將其保留為 NUMERIC 變數，請確定您提供的值可以轉換為浮點數。請注意，如果變數包含遺失的值，請不要將字串填入其中，例如 `nonene`、 `null`或 `missing`。如果變數包含非數值，請將其重新建立為 CATEGORICAL 或 FREE\_FORM\_TEXT 變數類型。

### 缺少變數值
<a name="missing-variable-values"></a>

**問題類型：警告**

**Description**

訓練資料集**$variable\_name**缺少大於 **$threshold**的值。請考慮在資料集**$variable\_name**中修改並重新訓練，以改善效能。

**原因**

如果指定的變數因遺失值太多而捨棄，您會收到此警告。Amazon Fraud Detector 允許遺失變數的值。不過，如果一個變數缺少太多值，則對模型的貢獻不大，而且該變數在模型訓練中會遭到捨棄。

**解決方案**

首先，確認這些遺失值不是由於資料收集和準備錯誤所致。如果它們是錯誤，您可以考慮將其從模型訓練中刪除。不過，如果您確信這些遺失值很有價值，但仍希望保留該變數，則可以在模型訓練和即時推論中以常數手動填入遺失值。

### 唯一的變數值不足
<a name="insufficient-unique-variable-values"></a>

**問題類型：警告**

**Description**

的唯一值計數**$variable\_name**低於 100。在資料集**$variable\_name**中檢閱和更新，並重新訓練模型。

**原因**

如果指定變數的唯一值數目小於 100，您會收到此警告。閾值會根據變數類型而有所不同。使用極少的唯一值，可能會有資料集不夠一般的風險，無法涵蓋該變數的特徵空間。因此，模型在即時預測上可能不會有良好的概括性。

**解決方案**

首先，請確定變數分佈代表實際的商業流量。然後，您可以採用更多經過精細訓練且基數較高的變數，例如使用 `full_customer_name`而非 `first_name`和 `last_name` 分別使用 ，或將變數類型變更為 CATEGORICAL，以允許基數較低。

### 變數表達式不正確
<a name="incorrect-variable-expression"></a>

1. **問題類型：資訊**

   **Description**

   大於 50% **$email\_variable\_name**的值不符合預期的規則表達式 http://emailregex.com。請考慮在資料集**$email\_variable\_name**中修改並重新訓練，以改善效能。

   **原因**

   如果資料集中超過 50% 的記錄具有不符合一般電子郵件表達式的電子郵件值，因此驗證失敗，則會顯示此資訊。

   **解決方案**

   格式化電子郵件變數值以符合規則表達式。如果缺少電子郵件值，建議您將它們保留空白，而不是用 `none`、 `null`或 等字串填入`missing`。

1. **問題類型：資訊**

   **Description**

   大於 50% **$IP\_variable\_name**的值不符合 IPv4 或 IPv6 地址 https：//https://digitalfortress.tech/tricks/top-15-commonly-used-regex/ 的規則表達式。請考慮在資料集**$IP\_variable\_name**中修改並重新訓練，以改善效能。

   **原因**

   如果資料集中超過 50% 的記錄的 IP 值不符合一般 IP 表達式，因此驗證失敗，則會顯示此資訊。

   **解決方案**

   格式化 IP 值以符合規則表達式。如果有遺失的 IP 值，建議您將它們保留空白，而不是以 `none`、 `null`或 等字串填入`missing`。

1. **問題類型：資訊**

   **Description**

   大於 50% **$phone\_variable\_name**的值不符合基本電話規則表達式 /$pattern/。請考慮在資料集**$phone\_variable\_name**中修改並重新訓練，以改善效能 。

   **原因**

   如果資料集中有 50% 以上的記錄的電話號碼不符合一般電話號碼表達式，因此驗證失敗，則會顯示此資訊。

   **解決方案**

   格式化電話號碼以符合規則表達式。如果缺少電話號碼，建議您將電話號碼保留空白，而不是用 `none`、 `null`或 等字串填入`missing`。

### 唯一實體不足
<a name="insufficient-unique-entities"></a>

**問題類型：資訊**

**Description**

唯一實體的數量小於 1500。考慮包含更多資料來改善效能。

**原因**

如果您的資料集具有比建議數量更小的唯一實體數量，則會顯示此資訊。Transaction Fraud Insights (TFI) 模型同時使用時間序列彙總和一般交易功能，以提供最佳效能。如果您的資料集具有太少的唯一實體，則 IP\_ADDRESS、EMAIL\_ADDRESS 等大部分一般資料可能沒有唯一的值。然後，此資料集也有無法涵蓋該變數特徵空間的普遍風險。因此，模型可能無法很好地將來自新實體的交易進行一般化。

**解決方案**

包含更多實體。如有需要，請延長訓練資料時間範圍。