

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 自訂模型
<a name="canvas-custom-models"></a>

在 Amazon SageMaker Canvas 中，您可以訓練根據您特定資料和使用案例量身打造的自訂機器學習模型。透過使用您的資料訓練的自訂模型，您可以擷取特定且最具代表性的資料特性和趨勢。例如，您可能想要建立自訂時間序列預測模型，此模型會使用倉儲中的庫存資料進行訓練，以管理您的物流作業。

Canvas 支援訓練各種模型類型。訓練自訂模型後，您可以評估模型的效能和準確性。一旦對模型感到滿意，您就可以對新資料進行預測，也可以選擇與資料科學家共用自訂模型，以進行進一步分析，或將其部署到 SageMaker AI 託管端點以進行即時推論，所有這些都可以在 Canvas 應用程式內完成。

您可以在下列類型的資料集上訓練 Canvas 自訂模型：
+ 表格式 (包括數值、分類、時間序列和文字資料)
+ 影像

下表顯示您可以在 Canvas 中建置的自訂模型類型，以及其支援的資料類型和資料來源


| 模型類型 | 範例使用案例 | 支援的資料類型 | 支援的資料來源 | 
| --- | --- | --- | --- | 
| 數值預測 | 根據平方英尺等功能預測房價 | 數值 | 本機上傳、Amazon S3、SaaS 連接器 | 
| 2 類別預測 | 預測客戶是否可能流失 | 二進位或分類 | 本機上傳、Amazon S3、SaaS 連接器 | 
| 3\$1 類別預測 | 預測出院後的患者結果 | 分類 | 本機上傳、Amazon S3、SaaS 連接器 | 
| 時間序列預測 | 預測下一季的庫存 | 時間序列 | 本機上傳、Amazon S3、SaaS 連接器 | 
| 單一標籤影像預測 | 預測影像中製造瑕疵的類型 | 映像 (JPG、PNG) | 本機上傳、Amazon S3 | 
| 多類別文字預測 | 根據產品描述預測產品類別，例如服裝、電子產品或家居用品 |  來源欄：文字 目標欄：二進位或分類 | 本機上傳、Amazon S3 | 

**開始使用**

若要開始從自訂模型建置和產生預測，請執行下列動作：
+ 決定您要建置的使用案例和模型類型。如需關於自訂模型的更多相關資訊，請參閱[自訂模型的運作方式](canvas-build-model.md)。如需關於有關自訂模型支援的資料類型和來源更多相關資訊，請參閱[資料匯入](canvas-importing-data.md)。
+ 將您的[資料匯入](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-importing-data.html) Canvas。您可以使用符合輸入要求的任何表格式或影像資料集來建立自訂模型。有關輸入要求的更多相關資訊，請參閱[建立資料集](canvas-import-dataset.md)。

  若要進一步了解您可以試驗的 SageMaker AI 提供的範例資料集，請參閱 [Canvas 中的範例資料集](canvas-sample-datasets.md)。
+ [建置](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-build-model.html)您的自訂模型。您可以執行**快速建置**以獲得模型並更快地開始進行預測，或者您可以執行**標準建置**以獲得更高的準確性。

  針對數值、分類和時間序列預測模型類型，您可以使用 [Data Wrangler 功能](canvas-data-prep.md)來清理和準備資料。在 Data Wrangler 中，您可以建立資料流程並使用各種資料準備技術，例如套用進階轉換或聯結資料集。針對影像預測模型，您可以[編輯影像資料集](canvas-edit-image.md)以更新標籤或新增和刪除映像。請注意，您無法將這些功能用於多類別文字預測模型。
+ [評估模型的效能](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-evaluate-model.html)，並決定模型在真實世界資料上的效能。
+ 使用您的模型[進行單一或批次預測](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-make-predictions.html)。

# 自訂模型的運作方式
<a name="canvas-build-model"></a>

使用 Amazon SageMaker Canvas 以已匯入的資料集上建立自訂模型。使用您建立的模型來對新資料進行預測。SageMaker Canvas 會使用資料集中的資訊建立最多 250 個模型，並選擇效能最佳的模型。

開始建立模型時，Canvas 會自動建議一個或多個*模型類型*。模型類型屬於下列其中一種類別：
+ **數值預測** — 這在機器學習中稱為*迴歸*。當您要預測數值資料時，請使用數值預測模型類型。例如，您可能想要根據房屋的平方英尺等功能來預測房價。
+ **分類預測** — 這在機器學習中稱為*分類*。當您要將資料分類為群組時，請使用分類預測模型類型：
  + **2 類別預測** — 當您有兩個要預測資料的類別時，請使用 2 類別預測模型類型 (在機器學習中也稱為*二進制分類*)。例如您可能想要判斷客戶是否可能流失。
  + **3\$1 類別預測** — 當您有三個以上要預測資料的類別時，請使用 3\$1 類別預測模型類型 (在機器學習中也稱為*多類別分類*)。例如，您可能想要根據先前付款等功能來預測客戶的貸款狀態。
+ **時間序列預測** — 當您想要預測一段時間內的狀況時，請使用時間序列預測。例如，您可能想要預測下一季出售的物品數量。如需有關時間序列預測的資訊，請參閱 [Amazon SageMaker Canvas 中的時間序列預測](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-time-series.html)。
+ **影像預測** — 當您要為影像指派標籤時，請使用單一標籤影像預測模型類型 (在機器學習中也稱為*單一標籤影像分類*)。例如，您可能想要分類產品影像中不同類型的製造瑕疵。
+ **文字預測** — 當您要將指派標籤給文字段落時，請使用多類文字預測模型類型 (在機器學習中也稱為*多類別文字分類*)。例如，您可能有產品的客戶評論資料集，並且您想要決定客戶是否喜歡或不喜歡該產品。您可能會讓模型預測指定的文字段落是 `Positive`、`Negative` 或 `Neutral`。

如需每個模型類型支援之輸入資料類型的資料表，請參閱[自訂模型](canvas-custom-models.md)。

針對您建立的每個表格式資料模型 (包括數值、分類、時間序列預測和文字預測模型)，您可以選擇**目標欄**。**目標欄**是包含您要預測之資訊的資料欄。例如，如果您正在建立模型以預測人們是否已取消訂閱，則**目標欄**包含關於某人取消狀態為 `yes` 或 `no` 的資料點。

針對影像預測模型，您可以使用已指派標籤的影像資料集來建立模型。針對您提供的未標籤影像，模型會預測標籤。例如，如果您要建立模型來預測影像是貓還是狗，則您會在建置模型時會提供標示為貓或狗的影像。然後該模型可以接受未標籤的影像，並預測其為貓或狗。

**建立模型時會出現的情況**

若要建立模型，您可以選擇**快速建置**或**標準建置**。**快速建置**的建置時間較短，但**標準建置**的準確性通常更高。

針對表格式和時間序列預測模型，Canvas 會使用*縮減取樣*，分別減少大於 5 GB 或 30 GB 的資料集大小。Canvas 使用分層取樣方法縮減取樣。下表依模型類型列出縮減取樣的大小。若要控制取樣程序，您可以使用 Canvas 中的 Data Wrangler，以您偏好的取樣技術進行取樣。針對時間序列資料，您可以重新取樣以彙總資料點。如需取樣的詳細資訊，請參閱[抽樣](canvas-transform.md#canvas-transform-sampling)。如需重新取樣時間序列資料的詳細資訊，請參閱[重新取樣時間序列資料](canvas-transform.md#canvas-resample-time-series)。

如果您選擇在超過 50,000 個資料列的資料集上執行**快速建置**，則 Canvas 會將您的資料取樣量降到 50,000 個資料列，以縮短模型訓練時間。

下表摘要說明模型建置程序的關鍵特性，包括每個模型和建置類型的平均建置時間、使用大型資料集建置模型時的縮減取樣大小，以及針對每個建置類型，您應具有的資料點數量下限和上限。


| 限制 | 數值和分類預測 | 時間序列預測 | 影像預測 | 文字預測 | 
| --- | --- | --- | --- | --- | 
| **快速建置**時間 | 2 - 20 分鐘 | 2 - 20 分鐘 | 15 - 30 分鐘 | 15 - 30 分鐘 | 
| **標準建置**時間 | 2 - 4 小時 | 2 - 4 小時 | 2 - 5 小時 | 2 - 5 小時 | 
| 縮減取樣大小 (Canvas 縮減取樣後大型資料集減少的大小) | 5 GB | 30 GB | N/A | N/A | 
| **快速建置**的項目數下限 (列) |  2 個類別：500 列 3 個以上類別、數值、時間序列：N/A  | N/A | N/A | N/A | 
| **標準建置**的項目數下限 (列、影像或文件) | 250 | 50 | 50 | N/A | 
| **快速建置**的項目數上限 (列、影像或文件) | N/A | N/A | 5000 | 7500 | 
| **標準建置**的項目數上限 (列、影像或文件) | N/A | 150，000 | 180,000 | N/A | 
| 欄數上限 | 1,000 | 1,000 | N/A | N/A | 

Canvas 會透過使用在資料集其餘部分的資訊來預測值，取決於模型類型：
+ 針對分類預測，Canvas 將每一列放入**目標欄**中列出的其中一個類別中。
+ 針對數值預測，Canvas 會使用資料集中的資訊來預測**目標欄**中的數值。
+ 針對時間序列預測，Canvas 使用歷史資料來預測未來的**目標欄**數值。
+ 針對影像預測，Canvas 使用已指派標籤的影像來預測未標籤影像的標籤。
+ 針對文字預測，Canvas 會分析已指派標籤的文字資料，以預測未標籤文字段落的標籤。

**可協助您建置模型的其他功能**

在建置您的模型之前，您可以使用 Canvas 中的 Data Wrangler，利用 300 多個內建轉換和運算子來準備資料。Data Wrangler 同時支援表格式和影像資料集的轉換。此外，您可以連線至 Canvas 外部的資料來源、建立任務以將轉換套用至整個資料集，以及匯出完全準備和清理的資料，以便在 Canvas 外部的 ML 工作流程中使用。如需詳細資訊，請參閱[資料準備](canvas-data-prep.md)。

若要查看視覺化和分析如何探索您的資料，並判斷您的模型中要包含哪些功能，您可以使用 Data Wrangler 的內建分析。您也可以存取**資料品質和洞見報告**，其中強調資料集的潛在問題，並提供如何修正這些問題的建議。如需詳細資訊，請參閱[執行探索性資料分析 (EDA)](canvas-analyses.md)。

除了透過 Data Wrangler 提供的更進階資料準備和探索功能之外，Canvas 還提供了一些您可以使用的基本功能：
+ 若要篩選您的資料並存取一組基本資料轉換，請參閱[準備用於模型建置的資料](canvas-prepare-data.md)。
+ 若要存取簡單的視覺化和分析進行功能探索，請參閱[資料探索和分析](canvas-explore-data.md)。
+ 若要進一步了解其他功能，例如預覽模型、驗證資料集，以及變更用於建立模型的隨機範例大小，請參閱[預覽模型](canvas-preview-model.md)。

針對具有多個資料欄的表格式資料集 (例如用於建立分類、數值或時間序列預測模型類型的資料集)，您可能會有遺失資料點的資料列。當 Canvas 建置模型時，它會自動新增缺少值。Canvas 會使用資料集中的值來執行缺少值的數學近似值。為了獲得最高的模型精確度，我們建議您在加入遺失資料中 (如果可以找到)。請注意，文字預測或影像預測模型不支援遺失資料功能。

**開始使用**

若要開始建置自訂模型，請參閱[建立模型](canvas-build-model-how-to.md)並遵循您要建置之模型類型的程序。

# 預覽模型
<a name="canvas-preview-model"></a>

**注意**  
下列功能僅適用於使用表格式資料集建置的自訂模型。也會排除多類別文字預測模型。

SageMaker Canvas 為您提供一種工具，讓您可在開始建置之前預覽模型。這提供您預估的正確性分數，也提供您每個資料欄如何影響模型的初步想法。

若要預覽模型分數，當您在模型的**建置**索引標籤上時，請選擇**預覽模型**。

模型預覽會產生**預估正確性**預測，預測模型可能分析您資料的正確程度。**快速建置**或**標準建置**的精確度代表模型在實際資料上的執行效能，而且通常高於**預估準確度**。

模型預覽也為您提供**資料欄影響**分數，這可以指出每個資料欄對模型預測的重要性。

下列螢幕擷取畫面顯示 Canvas 應用程式中的模型預覽。

![\[Canvas 中模型的建置索引標籤的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-build/canvas-build-preview-model.png)


Amazon SageMaker Canvas 會在建置模型時自動處理資料集中缺少值。它會使用存在於資料集中的相鄰值推斷缺少值。

如果您對模型預覽感到滿意，並想要繼續建置模型，請參閱[建立模型](canvas-build-model-how-to.md)。

# 資料驗證
<a name="canvas-dataset-validation"></a>

在建立模型之前，SageMaker Canvas 會檢查資料集中是否有可能導致建置失敗的問題。如果 SageMaker Canvas 發現任何問題，它會在您嘗試建立模型之前在**建置**頁面上警告您。

您可以選擇**驗證資料**以查看資料集中的問題清單。然後，您可以使用 SageMaker Canvas [Data Wrangler 資料準備功能](canvas-data-prep.md)或您自己的工具，在開始建置之前修正資料集。如果您未修正資料集的問題，則建置將會失敗。

如果您變更資料集以修正問題，則可以選擇在嘗試建置之前重新驗證資料集。建議您在建置之前重新驗證資料集。

下表顯示 SageMaker Canvas 在您的資料集中檢查的問題，以及如何解決這些問題。


| 問題 | Resolution | 
| --- | --- | 
|  資料的模型類型錯誤  |  請嘗試其他模型類型或使用不同的資料集。  | 
|  目標欄中缺少值  |  取代缺少值、刪除缺少值的資料列，或使用不同的資料集。  | 
|  目標欄中有太多唯一標籤  |  確認您已為目標欄使用正確的資料欄，或使用不同的資料集。  | 
|  目標欄中有太多非數值  |  選擇不同的目標欄、選取其他模型類型，或使用不同的資料集。  | 
|  一個或多個資料欄名稱包含兩個底線  |  重新命名資料欄，移除任何兩個底線，然後再試一次。  | 
|  資料集中的任何資料列都不完整  |  取代缺少值，或使用不同的資料集。  | 
|  資料中的列數有太多唯一的標籤  |  檢查您使用的是正確的目標欄、增加資料集中的列數、合併類似的標籤，或使用不同的資料集。  | 

# 隨機抽樣
<a name="canvas-random-sample"></a>

SageMaker Canvas 使用隨機抽樣方法來取樣您的資料集。隨機抽樣方法意味著每一列都有相同的機會被採樣。您可以在預覽中選擇資料欄以獲取隨機抽樣的總結統計，例如均值和模式。

SageMaker Canvas 根據預設會針對資料列超過 20,000 個的資料集使用 20,000 個資料列隨機抽樣大小。之對小於 20,000 列的資料集，預設抽樣大小是資料集中的列數。您可以在 SageMaker Canvas 應用程式的**建置**索引標籤中選擇**隨機抽樣**來增加或減少取樣大小。您可以使用滑桿選取所需的取樣大小，然後選擇**更新**以變更取樣大小。您可以針對一個資料集選擇的最大取樣大小為 40,000 列，最小範例大小為 500 列。如果您選擇較大的取樣大小，則資料集預覽和總結統計資料可能需要一些時間才能重新載入。

**建置**頁面會顯示資料集中 100 列的預覽。如果取樣大小與您的資料集大小相同，則預覽會使用資料集的前 100 列。否則，預覽會使用隨機抽樣的前 100 列。

# 建立模型
<a name="canvas-build-model-how-to"></a>

以下各節說明如何針對每個自訂模型的主要類型建立模型。
+ 若要建立數值預測、2 類別預測或 3\$1 類別預測模型，請參閱[建立自訂數值或分類預測模型](#canvas-build-model-numeric-categorical)。
+ 若要建立單一標籤影像預測模型，請參閱[建置自訂映像預測模型](#canvas-build-model-image)。
+ 若要建立多類別文字預測模型，請參閱[建置自訂文字預測模型](#canvas-build-model-text)。
+ 若要建置時間序列預測模型，請參閱[建置時間序列預測模型](#canvas-build-model-forecasting)。

**注意**  
如果您在建置後的分析期間遇到錯誤，告知您要增加 `ml.m5.2xlarge` 執行個體的配額，請參閱[要求增加配額](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-requesting-quota-increases.html)。

## 建立自訂數值或分類預測模型
<a name="canvas-build-model-numeric-categorical"></a>

數值和分類預測模型同時支援**快速建置**和**標準建置**。

若要建立數值或分類預測模型，請使用下列程序：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇**新模型**。

1. 在**建立新的模型**對話方塊中，執行下列動作：

   1. 在**模型名稱**欄位中輸入名稱。

   1. 選取**預測分析**問題類型。

   1. 選擇**建立**。

1. 針對**選取資料集**，請從資料集清單中選取您的資料集。如果您尚未匯入資料，請選擇**匯入**以轉向至匯入資料工作流程。

1. 當您準備好開始建置模型時，請選擇**選取資料集**。

1. 在**建置**索引標籤的**目標欄**下拉式清單中，選取您要預測的模型目標。

1. 針對**模型類型**，Canvas 會自動為您偵測問題類型。如果您想要變更類型或設定進階模型設定，請選擇**設定模型**。

   當**設定模型**對話方塊開啟時，請執行下列動作：

   1. 針對**模型類型**，選擇您要建置的模型類型。

   1. 選擇模型類型後，還有其他**進階設定**。如需每個進階設定的詳細資訊，請參閱 [進階模型建置組態](canvas-advanced-settings.md)。若要設定進階設定，請執行下列動作：

      1. (選用) 在**目標指標**下拉式清單中選取您要 Canvas 在建置模型時最佳化的指標。如果您未選取指標，Canvas 預設會為您選擇一個指標。如需可用指標的說明，請參閱 [指標參考](canvas-metrics.md)。

      1. 針對**訓練方法**，選擇**自動**、**整合**或**超參數最佳化 (HPO) 模式**。

      1. 針對**演算法**，選取您要包括以用於建置模型候選項目的演算法。

      1. 針對**資料分割**，以百分比指定您想要在**訓練集**與**驗證集**之間分割資料的方式。訓練集用於建置模型，而驗證集則用於測試模型候選項目的正確性。

      1. 針對**候選項目數和執行時間上限**，請執行下列動作：

         1. 設定**候選項目數上限**值，或 Canvas 可以產生的模型候選項目數量上限。請注意，**候選項目數上限**僅適用於 HPO 模式。

         1. 設定**任務執行時間上限**的小時和分鐘值，或 Canvas 建置模型所能花費的時間上限。在時間上限之後，Canvas 會停止建置並選取最佳模型候選項目。

   1. 設定進階設定後，選擇**儲存**。

1. 選取或取消選取資料中的資料欄，以將其包含在建置中或刪除。
**注意**  
如果您在建置後使用模型進行批次預測，Canvas 會在預測結果中新增刪除的資料欄。但是，Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

1. (選用) 使用 Canvas 提供的視覺化和分析工具來視覺化您的資料，並決定您想要在模型中包含哪些功能。如需更多資訊，請參閱[探索和分析您的資料](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-explore-data.html)。

1. (選用) 使用資料轉換來清理、轉換和準備用於模型建置的資料。如需更多資訊，請參閱[使用進階轉換準備資料](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-prepare-data.html)。您可以選擇**模型配方**以開啟**模型配方**側邊面板來檢視和移除轉換。

1. (選用) 如需其他功能，例如預覽模型的準確性、驗證資料集，以及變更 Canvas 從資料集取得的隨機範例大小，請參閱[預覽模型](canvas-preview-model.md)。

1. 檢閱資料並對資料集進行任何變更後，請選擇**快速建置**或**標準建置**以開始建置您的模型。下列螢幕擷取畫面顯示**建置**頁面和**快速建置**和**標準建置**選項。  
![\[2 類別模型的建置頁面會顯示快速建置和標準建置選項。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/build-page-tabular-quick-standard-options.png)

模型開始建置後，您可以離開此頁面。當模型在**我的模型**頁面上顯示為**就緒**時就可以進行分析和預測。

## 建置自訂映像預測模型
<a name="canvas-build-model-image"></a>

單一標籤影像預測模型同時支援**快速建置**和**標準建置**。

若要建立單一標籤影像預測模型，請遵循下列程序：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇**新模型**。

1. 在**建立新的模型**對話方塊中，執行下列動作：

   1. 在**模型名稱**欄位中輸入名稱。

   1. 選取**影像分析**問題類型。

   1. 選擇**建立**。

1. 針對**選取資料集**，請從資料集清單中選取您的資料集。如果您尚未匯入資料，請選擇**匯入**以轉向至匯入資料工作流程。

1. 當您準備好開始建置模型時，請選擇**選取資料集**。

1. 在**建置**索引標籤上，您會看到資料集中影像的**標籤分佈**。**模型類型**設定為**單一標籤影像預測**。

1. 在此頁面上，您可以預覽影像並編輯資料集。如果您有任何未標籤的影像，請選擇**編輯資料集**和[為未標籤的影像指派標籤](canvas-edit-image.md#canvas-edit-image-assign)。當您[編輯影像資料集](canvas-edit-image.md)時也可以執行其他任務，例如重新命名標籤，以及將影像新增至資料集。

1. 檢閱資料並對資料集進行任何變更後，請選擇**快速建置**或**標準建置**以開始建置您的模型。下列螢幕擷取畫面顯示已就緒，且可以建置的映像預測模型的**建置**頁面。  
![\[單一標籤影像預測模型的建置頁面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/build-page-image-model.png)

模型開始建置後，您可以離開此頁面。當模型在**我的模型**頁面上顯示為**就緒**時就可以進行分析和預測。

## 建置自訂文字預測模型
<a name="canvas-build-model-text"></a>

多類別文字預測模型同時支援**快速建置**和**標準建置**。

若要建立文字預測模型，請遵循下列程序：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇**新模型**。

1. 在**建立新的模型**對話方塊中，執行下列動作：

   1. 在**模型名稱**欄位中輸入名稱。

   1. 選取**文字分析**問題類型。

   1. 選擇**建立**。

1. 針對**選取資料集**，請從資料集清單中選取您的資料集。如果您尚未匯入資料，請選擇**匯入**以轉向至匯入資料工作流程。

1. 當您準備好開始建置模型時，請選擇**選取資料集**。

1. 在**建置**索引標籤的**目標欄**下拉式清單中，選取您要預測的模型目標。目標欄必須有二進位或分類資料類型，而且目標欄中的每個唯一標籤必須至少有 25 個項目 (或資料列)。

1. 針對**模型類型**，請確認模型類型已自動設定為 **多類別文字預測**。

1. 針對訓練資料欄，請選取文字資料的來源資料欄。這應該為包含您要分析的文字的資料欄。

1. 選擇**快速建置**或**標準建置**以開始建置模型。下列螢幕擷取畫面顯示已就緒，且可以建置的文字預測模型的**建置**頁面。  
![\[多類別文字預測模型的建置頁面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/build-page-text-model.png)

模型開始建置後，您可以離開此頁面。當模型在**我的模型**頁面上顯示為**就緒**時就可以進行分析和預測。

## 建置時間序列預測模型
<a name="canvas-build-model-forecasting"></a>

時間序列預測模型同時支援**快速建置**和**標準建置**。

若要建置時間序列預測模型，請使用下列程序：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇**新模型**。

1. 在**建立新的模型**對話方塊中，執行下列動作：

   1. 在**模型名稱**欄位中輸入名稱。

   1. 選取**時間序列預測**問題類型。

   1. 選擇**建立**。

1. 針對**選取資料集**，請從資料集清單中選取您的資料集。如果您尚未匯入資料，請選擇**匯入**以轉向至匯入資料工作流程。

1. 當您準備好開始建置模型時，請選擇**選取資料集**。

1. 在**建置**索引標籤的**目標欄**下拉式清單中，選取您要預測的模型目標。

1. 在**模型類型**區段中，選擇**設定模型**。

1. **設定模型**方塊隨即開啟。針對**時間序列組態**區段，填寫下列欄位：

   1. 針對**項目 ID 欄**，選擇資料集中唯一識別每一列的資料欄。資料欄的資料類型應為 `Text`。

   1. (選用) 針對**群組欄**，選擇您要用於分組預測值的一或多個分類欄 (資料類型為 `Text`)。

   1. 針對**時間戳記欄**，選取具有時間戳記的資料欄 (採用日期時間格式)。如需接受之日期時間格式的詳細資訊，請參閱[Amazon SageMaker Canvas 中的時間序列預測](canvas-time-series.md)。

   1. 針對**預測長度**欄位，輸入您要預測值的時段。Canvas 會自動偵測資料中的時間單位。

   1. (選用) 開啟**使用假日排程**切換以選取來自不同國家/地區的假日排程，並讓您使用假日資料的預測更準確。

1. 在**設定模型**方塊中，**進階**區段中還有其他設定。如需每個進階設定的詳細資訊，請參閱 [進階模型建置組態](canvas-advanced-settings.md)。若要設定**進階**設定，請執行下列動作：

   1. 針對**目標指標**下拉式清單，選取您要 Canvas 在建置模型時最佳化的指標。如果您未選取指標，Canvas 預設會為您選擇一個指標。如需可用指標的說明，請參閱 [指標參考](canvas-metrics.md)。

   1. 如果您正在執行標準建置，您會看到**演算法**區段。此區段用於選取您要用於建置模型的時間序列預測演算法。您可以選取可用演算法的子集，或者如果您不確定要嘗試哪些演算法，則可以選取所有演算法。

      當您執行標準建置時，Canvas 會建置整合模型，合併所有演算法以最佳化預測正確性。
**注意**  
如果您正在執行快速建置，Canvas 會使用單一樹狀學習演算法來訓練您的模型，而且您不需要選取任何演算法。

   1. 針對**預測分位數**，輸入最多 5 個逗號分隔分位數值，以指定預測的上限和下限。

   1. 設定**進階**設定後，選擇**儲存**。

1. 選取或取消選取資料中的資料欄，以將其包含在建置中或刪除。
**注意**  
如果您在建置後使用模型進行批次預測，Canvas 會在預測結果中新增刪除的資料欄。但是，Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

1. (選用) 使用 Canvas 提供的視覺化和分析工具來視覺化您的資料，並決定您想要在模型中包含哪些功能。如需更多資訊，請參閱[探索和分析您的資料](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-explore-data.html)。

1. (選用) 使用資料轉換來清理、轉換和準備用於模型建置的資料。如需更多資訊，請參閱[使用進階轉換準備資料](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-prepare-data.html)。您可以選擇**模型配方**以開啟**模型配方**側邊面板來檢視和移除轉換。

1. (選用) 如需其他功能，例如預覽模型的準確性、驗證資料集，以及變更 Canvas 從資料集取得的隨機範例大小，請參閱[預覽模型](canvas-preview-model.md)。

1. 檢閱資料並對資料集進行任何變更後，請選擇**快速建置**或**標準建置**以開始建置您的模型。

模型開始建置後，您可以離開此頁面。當模型在**我的模型**頁面上顯示為**就緒**時就可以進行分析和預測。

# 進階模型建置組態
<a name="canvas-advanced-settings"></a>

Amazon SageMaker Canvas 支援您可以在建置模型時設定的各種進階設定。以下頁面列出所有進階設定，以及有關其選項和組態的其他資訊。

**注意**  
目前僅數值、分類和時間序列預測模型類型支援下列進階設定。

## 進階數值和分類預測模型設定
<a name="canvas-advanced-settings-predictive"></a>

Canvas 支援下列數值和分類預測模型類型的進階設定。

### 目標指標
<a name="canvas-advanced-settings-predictive-obj-metric"></a>

目標指標是您想要 Canvas 在建置您模型時最佳化的指標。如果您未選取指標，Canvas 預設會為您選擇一個指標。如需可用指標的描述，請參閱[指標參考](canvas-metrics.md)。

### 訓練模式
<a name="canvas-advanced-settings-predictive-method"></a>

Canvas 可以根據資料集大小自動選取訓練方法，也可以手動選取訓練方法。下列訓練方法可供您選擇：
+ **整合** - SageMaker AI 利用 AutoGluon 程式庫來訓練數個基礎模型。為了找到適合您的資料集最佳組合，整合模式會以不同的模型與中繼參數設定來執行 5–10 次試驗。然後，會使用堆疊整合方法合併這些模型，以建立最佳的預測模型。如需表格式資料整合模式支援的演算法清單，請參閱下列[演算法](#canvas-advanced-settings-predictive-algos)一節。
+ **超參數最佳化 (HPO)** - SageMaker AI 在您的資料集執行訓練任務時，使用 Bayesian 最佳化或多逼真度最佳化調整超參數，找到模型的最佳版本。HPO 模式選擇與您的資料集最相關的演算法，並選擇最佳的超參數範圍來調整您的模型。若要調整模型，HPO 模式最多可執行 100 次試驗 (預設值)，以尋找所選範圍內的最佳超參數設定。如果您的資料集大小小於 100 MB，SageMaker AI 會使用 Bayesian 最佳化。如果您的資料集大於 100 MB，SageMaker AI 會選擇多逼真度最佳化。

  如需表格式資料 HPO 模式支援的演算法清單，請參閱下列[演算法](#canvas-advanced-settings-predictive-algos)一節。
+ **自動** - SageMaker AI 會根據您的資料集大小自動選擇整合模式或 HPO 模式。如果您的資料集大於 100 MB，SageMaker AI 會選擇 HPO。否則，它會選擇整合模式。

### 演算法
<a name="canvas-advanced-settings-predictive-algos"></a>

在**整合模式**下，Canvas 支援以下機器學習演算法：
+ [LightGbM](https://docs.aws.amazon.com/sagemaker/latest/dg/lightgbm.html)–使用具有梯度提升的樹型演算法的最佳化架構。該演算法使用在廣度而非深度上生長的樹，並且針對速度進行了高度最佳化。
+ [CatBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/catboost.html)–使用樹型演算法與梯度提升的架構。針對處理分類變數進行最佳化。
+ [XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html)–使用樹型演算法與梯度提升的架構，深度增長，而不是廣度。
+ [隨機樹系](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html)–在資料的隨機子樣本使用多個決策樹並進行取代的樹型演算法。這些樹在每個層級被分成最佳節點。每棵樹的決策被平均在一起，以防止過度學習並改善預測。
+ [Extra Tree](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.ExtraTreesClassifier.html#sklearn.ensemble.ExtraTreesClassifier)–在整個資料集使用多個決策樹的樹型演算法。樹在每個層級隨機分割。對每棵樹的決定進行平均，以防止過度學習並改善預測。與隨機樹系演算法相比，額外的樹會增加一定程度的隨機化。
+ [線性模型](https://scikit-learn.org/stable/modules/classes.html#module-sklearn.linear_model)–使用線性方程式對觀測資料中兩個變數之間關係進行建模的架構。
+ 神經網路火炬 – 使用 [Pytorch](https://pytorch.org/) 實作的神經網路模型。
+ 神經網路 fast.ai–使用 [fast.ai](https://www.fast.ai/) 實作的神經網路模型。

在 **HPO 模式**下，Canvas 支援下列機器學習演算法：
+ [XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html)–藉由結合一組較簡單且較脆弱的模型之預估值集合來嘗試精確預測目標變數的監督式學習演算法。
+ 深度學習演算法–多層感知器 (MLP) 和前饋人工神經網路。此演算法可以處理不可線性分隔的資料。

### 資料分割
<a name="canvas-advanced-settings-predictive-split"></a>

您可以選擇指定如何在訓練集 (用於建置模型的資料集部分) 與驗證集 (用於驗證模型正確性的資料集部分) 之間分割資料集。例如，常見的分割比率是 80% 訓練和 20% 驗證，其中 80% 資料用於建置模型，而 20% 是為了測量模型效能而保留的。如果您未指定自訂比率，則 Canvas 會自動分割您的資料集。

### 候選項目數上限
<a name="canvas-advanced-settings-predictive-candidates"></a>

**注意**  
這項功能僅適用於 HPO 訓練模式。

您可以指定 Canvas 在建置您模型時產生的模型候選項目數量上限。我們建議您使用預設的候選項目數量，也就是 100，來建置最正確的模型。您可以指定的數量上限為 250。減少模型候選項目的數量可能會影響您模型的正確性。

### 任務執行時間上限
<a name="canvas-advanced-settings-predictive-runtime"></a>

您可以指定任務執行時間上限，或 Canvas 建置您模型所花費的時間上限。在時間限制之後，Canvas 會停止建置並選取最佳模型候選項目。

您可以指定的時間上限是 720 小時。強烈建議您將任務執行時間上限保留在 30 分鐘以上，以確保 Canvas 有足夠的時間產生模型候選項目並完成建置模型。

## 進階時間序列預測模型設定
<a name="canvas-advanced-settings-time-series"></a>

對於時間序列預測模型，Canvas 支援目標指標，如上節所列。

時間序列預測模型也支援下列進階設定：

### 演算法選擇
<a name="canvas-advanced-settings-time-series-algos"></a>

當您建置時間序列預測模型時，Canvas 會使用統計和機器學習演算法的*整合* (或組合) 來提供高度正確的時間序列預測。根據預設，Canvas 會根據資料集中的時間序列，選取所有可用演算法的最佳組合。不過，您可以選擇指定一或多個演算法，以用於預測模型。在此情況下，Canvas 只會使用您選取的演算法來決定最佳混合。如果您不確定要選取哪個演算法訓練模型，建議您選擇所有可用的演算法。

**注意**  
只有標準建置才支援演算法選擇。如果您未在進階設定中選取任何演算法，則 SageMaker AI 預設會執行快速建置，並使用單一樹狀學習演算法訓練模型候選項目。如需快速建置與標準建置之間差異的詳細資訊，請參閱[自訂模型的運作方式](canvas-build-model.md)。

Canvas 支援下列時間序列預測演算法：
+ [ 自動迴歸整合移動平均 (ARIMA)](https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average) - 一種簡單的隨機時間序列模型，使用統計分析來解譯資料並做出未來的預測。此演算法適用於時間序列少於 100 個的簡單資料集。
+ [ 卷積神經網路 - 分位數迴歸 (CNN-QR)](https://docs.aws.amazon.com/forecast/latest/dg/aws-forecast-algo-cnnqr.html) - 一種專屬的監督式學習演算法，可從大型時間序列集合中訓練一個全域模型，並使用分位數解碼器進行預測。CNN-QR 最適用於包含數百個時間序列的大型資料集。
+ [ DeepAR\$1](https://docs.aws.amazon.com/forecast/latest/dg/aws-forecast-recipe-deeparplus.html) - 一種專屬的監督式學習演算法，用於使用遞迴神經網絡 (RNN) 來預測純量時間序列，在所有時間序列中共同訓練單一模型。DeepAR A\$1 最適合包含數百個特徵時間序列的大型資料集。
+ [ 非參數時間序列 (NPTS)](https://docs.aws.amazon.com/forecast/latest/dg/aws-forecast-recipe-npts.html) - 可擴展的機率基準預測器，透過從過去的觀察值中取樣來預測指定時間序列的未來值分佈。NPTS 在處理稀疏或間歇性時間序列時非常有用 (例如，預測時間序列有許多 0 或計數低的個別項目的需求)。
+ [指數平滑法 (ETS)](https://en.wikipedia.org/wiki/Exponential_smoothing) - 一種預測方法，其產生的預測是過去觀察值的加權平均值，其中較舊觀察值的權重呈指數減少。該演算法對於少於 100 個時間序列的簡單資料集以及具有季節性模式的資料集很有用。
+ [Prophet](https://facebook.github.io/prophet/) – 一種附加迴歸模型，最適合具有強烈季節性效果和數個季節歷史資料的時間序列。此演算法適用於其非線性成長趨勢接近限制的資料集。

### 預測分位數
<a name="canvas-advanced-settings-time-series-quantiles"></a>

對於時間序列預測，SageMaker AI 會使用您的目標時間序列訓練 6 個模型候選項目。然後，SageMaker AI 會使用堆疊整合方法來結合這些模型，為指定的目標指標建立最佳預測模型。每個預測模型都會透過在 P1 與 P99 之間的分位數產生預測來產生機率預測。這些分位數用於解釋預測的不確定性。根據預設，會針對 0.1 (`p10`)、0.5 (`p50`) 與 0.9 (`p90`) 產生預測。您可以選擇透過 0.01 或更高的增量，從 0.01 (`p1`) 到 0.99 (`p99`) 指定最多五個自己的分位數。

# 編輯影像資料集
<a name="canvas-edit-image"></a>

您可以在 Amazon SageMaker Canvas 中在建立模型之前，編輯影像資料集並檢閱標籤。您可能會想要執行諸如為未標籤的影像指派標籤，或將更多影像新增至資料集等任務。這些任務都可以在 Canvas 應用程式中完成，為您提供修改資料集和建立模型的單一位置。

**注意**  
在建立模型之前，您必須為資料集中的所有影像指派標籤。此外，每個標籤必須至少有 25 張影像，並且至少有兩個標籤。如需有關指派標籤的更多資訊，請參閱此頁面上名為**為未標籤的影像指派標籤**一節。如果您無法判斷影像的標籤，則應該將其從資料集中刪除。如需此關於刪除影像的更多資訊，請參閱此頁面[從資料集新增或刪除影像](#canvas-edit-image-add-delete)的章節。

若要開始編輯影像資料集，您應該在建置單一標籤映像預測模型時位於**建置**索引標籤。

新頁面隨即開啟，其中顯示資料集中的影像及其標籤。此頁面會將您的影像資料集分類為**影像總數**、**標籤的影像**以及**未標籤影像**。您也可以檢閱**資料集準備指南**，瞭解建置準確影像預測模型的最佳實務。

下列螢幕擷取畫面顯示編輯影像資料集的頁面。

![\[Canvas 中影像資料集管理頁面的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/dataset-management-page.png)


您可以在此頁面進行下列動作。

## 檢視每個影像的屬性 (標籤、大小、維度)
<a name="canvas-edit-image-view"></a>

若要檢視個別影像，您可以在搜尋列中依檔案名稱進行搜尋。然後選擇影像以開啟完整檢視。您可以檢視影像屬性並重新指派影像的標籤。檢視影像時，請選擇**儲存**。

## 在資料集中新增、重新命名或刪除標籤
<a name="canvas-edit-image-labels"></a>

Canvas 會在左側導覽窗格中列出資料集的標籤。您可以在**新增標籤**文字欄位中輸入標籤，將標籤新增至資料集。

若要重新命名或刪除資料集中的標籤，請選擇標籤旁的**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選取**重新命名**或**刪除**。如果重新命名標籤，您可以輸入新標籤名稱並選擇**確認**。如果您刪除標籤，該標籤會從資料集中所有具有該標籤的影像中移除。任何帶有該標籤的影像都將被取消標記。

## 為未標籤的影像指派標籤
<a name="canvas-edit-image-assign"></a>

若要檢視資料集中未標籤的影像，請選擇左側導覽窗格中的**未標籤**。針對各個影像，請選取該影像並開啟標題為**未標籤**的標籤，然後從下拉式清單中選取要指派給影像的標籤。您也可以選取多個影像並執行此動作，所有選取的影像都會指派您選擇的標籤。

## 重新指派標籤給影像
<a name="canvas-edit-image-reassign"></a>

您可以選取影像 (或一次多個影像)，然後開啟標題為目前標籤的下拉式清單，以重新指派影像的標籤。選取您想要的標籤，影像就會以新標籤更新。

## 按標籤排序影像
<a name="canvas-edit-image-sort"></a>

您可以在左側導覽窗格中選擇標籤，來檢視指定標籤的所有影像。

## 從資料集新增或刪除影像
<a name="canvas-edit-image-add-delete"></a>

您可以選擇上方導覽窗格中的**新增影像**，將更多影像新增至資料集。您會被導向至匯入更多影像的工作流程。您匯入的影像會新增至您現有的資料集。

您可以從資料集中刪除影像，方法是選取影像，然後在上方導覽窗格中選擇**刪除**。

**注意**  
對資料集進行任何變更後，請選擇**儲存資料集**，確保您不會遺失變更。

# 資料探索和分析
<a name="canvas-explore-data"></a>

**注意**  
您只能針對將 SageMaker Canvas 視覺效果和分析用於以表格式資料集建立的模型。也會排除多類別文字預測模型。

在 Amazon SageMaker Canvas 中，您可以使用視覺化和分析來探索資料集中的變數，並建立應用程式內視覺化和分析。在建置模型之前，您可以使用這些探索來瞭解變數之間的關係。

如需 Canvas 中視覺化技術的更多相關資訊，請參閱[使用視覺化技術探索您的資料](canvas-explore-data-visualization.md)。

如需 Canvas 中分析的更多相關資訊，請參閱[使用分析探索您的資料](canvas-explore-data-analytics.md)。

# 使用視覺化技術探索您的資料
<a name="canvas-explore-data-visualization"></a>

**注意**  
您只能針對將 SageMaker Canvas 視覺效果用於以表格式資料集建立的模型。也會排除多類別文字預測模型。

您可以使用 Amazon SageMaker Canvas 在建置機器學習 (ML) 模型之前，探索和視覺化資料，以取得資料的進階洞察。您可以使用散佈圖、長條圖和盒狀圖進行視覺化，協助您瞭解資料並探索可能影響模型準確度的功能之間的關係。

在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**資料視覺化工具**以開始建立視覺效果。

您可以變更視覺效果取樣大小，以調整從資料集擷取的隨機取樣大小。取樣大小過大可能會影響資料視覺化的效能，因此建議您選擇適當的取樣大小。若要變更取樣大小，請使用下列程序。

1. 選擇**視覺效果取樣**。

1. 使用滑桿選擇您想要的取樣大小。

1. 選擇**更新**以確認取樣大小的變更。

**注意**  
某些視覺化技術需要特定資料類型的資料欄。例如，散佈圖的 x 軸和 y 軸只能使用數值欄。

## 散佈圖
<a name="canvas-explore-data-scatterplot"></a>

若要使用資料集建立散佈圖，請在**視覺化**面板中選擇**散佈圖**。從**資料欄**區段中選擇要在 x 軸和 y 軸上繪製的特徵。您可以將資料欄拖放到軸上，或在放下軸後從支援的資料欄清單中選擇資料欄。

您可以使用**顏色顯示依據**，以第三個特徵為圖表上的資料點著色。您也可以使用**分組依據**，根據第四個特徵將資料分組為單獨的繪圖。

下列影像顯示使用**顏色顯示依據**和**分組依據**的散佈圖。在此範例中，每個資料點都由 `MaritalStatus` 特徵著色，並依 `Department` 特徵分組，並產生每個部門資料點的散佈圖。

![\[Canvas 應用程式的資料視覺化檢視中散佈圖螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-eda-scatter-plot.png)


## 長條圖
<a name="canvas-explore-data-barchart"></a>

若要使用資料集建立長條圖，請在**視覺化**面板中選擇**長條圖**。從**資料欄**區段中選擇要在 x 軸和 y 軸上繪製的特徵。您可以將資料欄拖放到軸上，或在放下軸後從支援的資料欄清單中選擇資料欄。

您可以使用**分組依據**一句第三個特徵對長條圖進行分組。您可以使用**堆疊依據**根據第四個特徵的唯一值來針對每個長條描繪垂直陰影。

下列影像顯示使用**分組依據**和**堆疊依據**的長條圖。在此範例中，長條圖會依 `MaritalStatus`特徵分組，並依 `JobLevel` 特徵堆疊。針對 x 軸上的每一個 `JobRole`，都有一個單獨的長條用於表示 `MaritalStatus` 特徵中的唯一類別，且每個長條都依據 `JobLevel` 特徵垂直堆疊。

![\[Canvas 應用程式的資料視覺化工具中的長條圖螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-eda-bar-chart.png)


## 盒狀圖
<a name="canvas-explore-data-boxplot"></a>

若要使用資料集建立盒狀圖，請在**視覺化**面板中選擇**盒狀圖**。從**資料欄**區段中選擇要在 x 軸和 y 軸上繪製的特徵。您可以將資料欄拖放到軸上，或在放下軸後從支援的資料欄清單中選擇資料欄。

您可以使用**分組依據**依據第三個特徵對盒狀圖進行分組。

下列影像顯示使用**分組依據**的盒狀圖。在此範例中，x 軸和 y 軸分別顯示 `JobLevel` 和 `JobSatisfaction`，彩色盒狀圖會依 `Department` 特徵分組。

![\[Canvas 應用程式的資料視覺化工具中的盒狀圖螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-eda-box-plot.png)


# 使用分析探索您的資料
<a name="canvas-explore-data-analytics"></a>

**注意**  
您只能針對將 SageMaker Canvas 分析用於以表格式資料集建立的模型。也會排除多類別文字預測模型。

透過 Amazon SageMaker Canvas 中的分析功能，您可以在建立模型之前探索資料集並深入分析所有變數。您可以使用相互關聯矩陣來決定資料集中特徵之間的關係。您可以使用此技巧將資料集摘要成矩陣，以顯示兩個或多個值之間的相互關聯。這可幫助您識別並視覺化指定資料集中的模式，以進行進階資料分析。

矩陣會將每個特徵之間的相互關聯性 顯示為正、負或中性。建置模型時，您可能會想要包括彼此之間相互關聯性高的特徵。幾乎沒有相互關聯的特徵可能與您的模型不相關，您可以在建置模型時放棄這些特徵。

若要開始使用 SageMaker Canvas 中的相互關聯性矩陣，請參閱下列章節。

## 建立相互關聯性矩陣
<a name="canvas-explore-data-analytics-correlation-matrix"></a>

當您準備在 SageMaker Canvas 應用程式的**建置**標籤中建立模型時，可以建立相互關聯性矩陣。

如需如何開始建立模型的指示，請參閱[建立模型](canvas-build-model-how-to.md)。

在 SageMaker Canvas 應用程式中開始準備模型之後，請執行下列操作：

1. 在**建置**索引標籤中，選擇**資料視覺化工具**。

1. 然後選擇**分析**。

1. 選擇**相互關聯性矩陣**。

您應該會看到類似下列螢幕擷取畫面的視覺效果，該螢幕擷取畫面顯示組織成相互關聯矩陣的資料集最多 15 個資料欄。

![\[Canvas 應用程式中相互關連矩陣的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-correlation-matrix-2.png)


建立相互關聯矩陣後，您可以藉由以下動作來自訂它：

### 1. 選擇您的資料欄
<a name="canvas-explore-data-analytics-correlation-matrix-columns"></a>

針對**資料欄**，您可以選取想要包含在矩陣中的欄。您最多可以比較資料集中的 15 個資料欄。

**注意**  
您可以針對相互關聯矩陣使用數值、分類或二進位資料欄類型。相互關聯矩陣不支援日期時間或文字資料欄類型。

若要在相互關聯矩陣中新增或移除資料欄，請從**資料欄**面板中選取並取消選取欄。您也可以將資料欄直接從面板拖放到矩陣上。如果資料集有很多資料欄，您可以在**搜尋欄位**中搜尋想要的資料欄。

若要依資料類型篩選資料欄，請選擇下拉式清單，然後選取**全部**、**數值**或**分類**。選取**全部**會顯示資料集中的所有資料欄，而**數值**和**分類**篩選只會顯示資料集中的數值或分類資料欄。請注意，二進位資料欄類型包含在數值或分類篩選條件中。

若要獲得最佳資料洞見，請在相互關聯矩陣中包含您的目標欄。當您將目標欄包括在相互關聯矩陣中時，它會在出現在矩陣中最後一個特徵，並包含一個目標符號。

### 2. 選擇相互關聯類型
<a name="canvas-explore-data-analytics-correlation-matrix-cor-type"></a>

SageMaker Canvas 支援不同的*相互關聯類型*或計算欄之間關聯性的方法。

若要變更相互關聯類型，請使用前一節中提到的**資料欄**篩選條件，篩選您想要的資料欄類型和資料欄。您應該會在側邊面板中看到**相互關聯類型**。針對數值比較，您可以選擇 **Pearson** 或 **Spearman**。針對分類比較，相互關聯類型會設定為 **MI**。針對分類與混合比較，相互關聯類型會設定為 **Spearman & MI**。

針對僅比較數值欄的矩陣，相互關聯類型是 Pearson 或 Spearman。Pearson 量值會評估兩個連續變數之間的線性關係。Spearman 量值會評估兩個變數之間的單調關係。對於 Pearson 與 Spearman，相互關聯性的規模範圍從 -1 到 1，規模的任一端表示一個完美的相關性 (直接 1:1 關係) 而 0 表示無相關性。如果您的資料具有更多線性關係 (如[散佈圖視覺效果](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-explore-data.html#canvas-explore-data-scatterplot)所顯示)，您可能會想要選取 Pearson。如果您的資料並非線性的，或者混合了包含線性和單調關係，那麼您可能需要選擇 Spearman。

針對只比較分類資料欄的矩陣，相互關聯類型會設定為相互資訊分類 (MI)。MI 值是兩個隨機變數之間相互相依性的量值。MI 量值的範圍為 0 到 1，0 表示無相互關聯，1 表示完美相互關聯。

針對比較數值和分類資料欄的混合矩陣，相互關聯類型 **Spearman & MI** 是 Spearman 和 MI 相互關聯類型的組合。針對兩個數值欄之間的相互關聯，矩陣會顯示 Spearman 值。針對數值和分類欄或兩個分類欄之間的相互關聯，矩陣會顯示 MI 值。

最後請記住，相互關聯不一定表示因果關係。強相互關聯值僅表示兩個變數之間存在關係，但這些變數可能沒有因果關係。請仔細檢閱您感興趣的資料欄，以避免在建置模型時出現偏差。

### 3. 篩選您的相互關聯
<a name="canvas-explore-data-analytics-correlation-matrix-filter"></a>

在側邊面板中，您可以使用**篩選相互關聯**功能來篩選要包含在矩陣中的相關值範圍。例如，如果您要篩選僅具有正或中性相互關聯的特徵，您可以將**下限**設定為 0，將**上限**設定為 1 (有效值為 -1 到 1)。

針對 Spearman 和 Pearson 比較，您可以在 -1 到 1 範圍之間的任何地方設定**篩選相互關聯**，0 表示沒有相互關聯，-1 和 1 表示變數分別具有強的負或正相互關聯。

針對 MI 比較，相互關聯範圍僅從 0 到 1，0 表示沒有相互關聯，1 表示變數具有很強的相互關聯，無論是正或負。

每個特徵都與本身具有完美的相互關聯 (1)。因此您可能會注意到相互關聯矩陣的第一列永遠為 1。如果要排除這些值，可以使用篩選器將**上限**設定為小於 1。

請記住，如果您的矩陣比較了數字和分類欄的混合，並使用 **Spearman & MI** 相互關聯類型，則*分類 x 數值*和*分類 x 分類*相互關聯 (使用 MI 量值) 的範圍為 0 到 1，而*數值 x 數值*關聯 (使用 Spearman 量值) 的範圍為 -1 到 1。仔細檢閱您感興趣的相互關聯，以確保您知道用於計算每個值的相互關聯類型。

### 4. 選擇視覺化方法。
<a name="canvas-explore-data-analytics-correlation-matrix-viz-method"></a>

在側邊面板中，您可以使用**視覺化依據**來變更矩陣的視覺化方法。選擇**數值**視覺化方法以顯示相互關聯 (Pearson、Spearman 或 MI) 值，或選擇**大小**視覺化方法，來視覺化與不同大小和顏色點的相互關聯。如果您選擇**大小**，您可以將游標暫留在矩陣的特定點上，以查看實際的相互關聯值。

### 5. 選擇調色盤
<a name="canvas-explore-data-analytics-correlation-matrix-color"></a>

在側邊面板中，您可以使用**顏色選取**來變更用於矩陣中負至正相互關聯的調色盤。選取其中一個替代調色盤，以變更矩陣中使用的顏色。

# 準備用於模型建置的資料
<a name="canvas-prepare-data"></a>

**注意**  
您現在可以使用 Data Wrangler，在 SageMaker Canvas 中執行進階資料準備，Data Wrangler 為您提供自然語言介面和超過 300 個內建轉換。如需詳細資訊，請參閱[資料準備](canvas-data-prep.md)。

您的機器學習資料集可能需要資料準備才能建立模型。由於各種問題 (可能包括缺少值或極端值)，您可能希望清理資料，並執行特徵工程以提高模型的準確性。Amazon SageMaker Canvas 提供機器學習 (ML) 資料轉換，您可以使用這些清理、轉換和準備資料以建立模型。您可以在資料集上使用這些轉換，而不需要任何程式碼。SageMaker Canvas 會將您使用的轉換新增至**模型配方**，這是在建置模型之前對資料進行的資料準備記錄。您使用的任何資料轉換只會修改用於模型建置的輸入資料，而不會修改原始資料來源。

資料集的預覽會顯示資料集的前 100 列。如果資料集的列數超過 20,000 個，Canvas 會隨機取樣 20,000 列的樣本，並預覽該樣本中的前 100 列。您只能搜尋和指定預覽資料列中的數值，而篩選功能只會篩選預覽的資料列，而不非整個資料集。

SageMaker Canvas 中提供了以下轉換，以便您準備建置的資料。

**注意**  
您只能針對以表格式資料集建立的模型使用進階轉換。也會排除多類別文字預測模型。

## 卸除資料欄
<a name="canvas-prepare-data-drop"></a>

您可以將欄放置在 SageMaker Canvas 應用程式的**建置**索引標籤中，從模型建置中排除該欄。取消選取要放置的資料欄柱，建置模型時不會包含該資料欄。

**注意**  
如果您放置資料欄，然後使用模型進行[批次預測](canvas-make-predictions.md)，SageMaker Canvas 會將放置的資料欄新增回輸出資料集，可供您下載。但是，SageMaker Canvas 不會將放置除的資料欄新增回時間序列模型中。

## 篩選資料列
<a name="canvas-prepare-data-filter"></a>

篩選功能會根據您指定的條件篩選預覽的資料列 (資料集的前 100 個資料列)。篩選列可建立資料的暫時預覽，不會影響模型建置。您可以篩選以預覽缺少值、包含極端值或符合所選欄中的自訂條件的列。

### 依缺少值篩選資料列
<a name="canvas-prepare-data-filter-missing"></a>

缺少值是機器學習資料集中常見的情況。如果某些欄中有 Null 或空值的資料列，您可能會想要篩選並預覽這些資料列。

若要從預覽資料中篩選缺少值，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**依資料列篩選** (![\[Filter icon in the SageMaker Canvas application.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/filter-icon.png))。

1. 選擇要確認缺少值的**資料欄**。

1. 針對**作業**，選擇**遺失**。

SageMaker Canvas 篩選器適用於在您選取的**資料欄**中包含缺少值的資料列，並提供篩選列的預覽。

![\[SageMaker Canvas 應用程式中缺少值作業的篩選器螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-filter-missing.png)


### 依極端值篩選資料列
<a name="canvas-prepare-data-filter-outliers"></a>

極端值或資料分佈和範圍中的罕見值可能會對模型準確性產生負面影響，並導致更長的建置時間。SageMaker Canvas 可讓您偵測和篩選數值欄中包含極端值的資料列。您可以選擇使用標準偏差或自訂範圍來定義極端值。

若要篩選資料中的極端值，請執行以下操作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**依資料列篩選** (![\[Filter icon in the SageMaker Canvas application.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/filter-icon.png))。

1. 選擇您要檢查極端值的**資料欄**。

1. 針對**作業**，選擇**遺失**。

1. 將**極端值範圍**設定為**標準偏差**或**自訂範圍**。

1. 如果您選擇**標準偏差**，請指定從 1 - 3 開始的 **SD** (標準偏差) 值。如果您選擇**自訂範圍**，請選取**百分位數**或**數字**，然後指定**下限**和**上限**。

**標準偏差**選項會使用平均值和標準偏差來偵測並篩選數值欄中的極端值。您也可以指定標準偏差的數值，其值必須與平均值不同，才能被視為極端值。例如，如果您指定 `3` 為 **SD**，則值必須與平均值的標準偏差必須超過 3，才能被視為極端值。

**自訂範圍**選項會使用最小值和最大值偵測並篩選數值欄中的極端值。如果您知道可分隔極端值的閾值，請使用此方法。您可以將範圍的**類型**設定為**百分位數**或**數字**。如果您選擇**百分位數**，則 **下限**與**上限**值應為您要允許的百分位數範圍 (0-100) 的最小值和最大值。如果您選擇**數字**，則**下限**和**上限**值應為您要在資料中篩選的最小和最大數值。

![\[SageMaker Canvas 應用程式中依據極端值作業篩選的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-filter-outlier.png)


### 按自訂值篩選資料列
<a name="canvas-prepare-data-filter-custom"></a>

您可以篩選具有符合自訂條件數值的資料列。例如，您可能希望在刪除之前預覽價格值大於 100 的資料列。您可以使用此功能，篩選超出所設定閾值的列，並預覽所篩選的資料。

若要使用自訂篩選器功能，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**依資料列篩選** (![\[Filter icon in the SageMaker Canvas application.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/filter-icon.png))。

1. 選擇您要檢查的**資料欄**。

1. 選取您要使用的**作業**類型，然後指定選取條件的數值。

針對**作業**，您可以選擇以下其中一個選項。請注意，可用的作業取決於您選擇的資料欄的資料類型。例如，您無法為包含文字值的資料欄建立 `is greater than` 作業。


| 作業 | 支援的資料類型 | 支援的功能類型 | 函式 | 
| --- | --- | --- | --- | 
|  等於  |  數值、文字  | 二進位、分類 |  篩選**資料欄**中數值等於您指定數值的資料列。  | 
|  不等於  |  數值、文字  | 二進位、分類 |  篩選**資料欄**中數值不等於您指定數值的資料列。  | 
|  少於  |  數值  | N/A |  篩選**資料欄**中數值少於您指定數值的資料列。  | 
|  小於或等於  |  數值  | N/A |  篩選**資料欄**中數值小於或等於您指定數值的資料列。  | 
|  大於  |  數值  | N/A |  篩選**資料欄**中數值大於您指定數值的資料列。  | 
|  大於或等於  |  數值  | N/A |  篩選**資料欄**中數值大於或等於您指定數值的資料列。  | 
|  介於  |  數值  | N/A |  篩選**資料欄**中數值介於您指定的兩個數值之間的資料列。  | 
|  Contains  |  文字  | 分類 |  篩選**資料欄**中數值包含您指定數值的資料列。  | 
|  開頭為  |  文字  | 分類 |  篩選**資料欄**中數值開始於您指定數值的資料列。  | 
|  Ends with  |  分類  | 分類 |  篩選**資料欄**中數值結尾為您指定數值的資料列。  | 

設定篩選作業後，SageMaker Canvas 會更新資料集的預覽，以向您顯示篩選的資料。

![\[SageMaker Canvas 應用程式中自訂值作業的篩選器螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-filter-custom.png)


## 函式和運算子
<a name="canvas-prepare-data-custom-formula"></a>

您可以使用數學函式和運算子來探索和發佈資料。您可以使用 SageMaker Canvas 支援的函式，或使用現有資料建立自己的公式，並使用公式的結果建立新資料欄。例如，您可以新增兩欄的對應值，並將結果儲存至新資料欄。

您可以巢狀化陳述式來建立更複雜的函式。以下是一些您可能使用的巢狀化函式範例。
+ 若要計算 BMI，您可以使用 `weight / (height ^ 2)` 函式。
+ 若要分類年齡，您可以使用 `Case(age < 18, 'child', age < 65, 'adult', 'senior')` 函式。

您可以在建置模型之前，在資料準備階段指定函式。若要使用函式，請執行下列動作。
+ 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**檢視全部**，然後選擇**自訂公式**以開啟**自訂公式**面板。
+ 在**自訂公式**面板中，您可以選擇要新增至**模型配方**的**公式**。每個公式都會套用至您指定的欄中的所有值。針對接受兩個或多個資料欄作為引數的公式，請使用具有相符資料類型的資料欄；否則您會在新資料欄中收到錯誤或 `null` 值。
+ 指定**公式**後，請在**新資料欄名稱**中新增資料欄名稱。SageMaker Canvas 會將此名稱用於所建立的新資料欄。
+ (選用) 選擇**預覽**以預覽轉換。
+ 若要將函式新增至**模型配方**，請選擇**新增**。

SageMaker Canvas 會使用您在**新資料欄名稱**中指定的名稱，將函式的結果儲存至新資料欄。您可以從**模型配方**面板中檢視或移除函式。

SageMaker Canvas 支援下列運算子的函式。您可以使用文字格式或內嵌格式來指定函式。


| 運算子 | Description | 支援的資料類型 | 文字格式 | 內嵌格式 | 
| --- | --- | --- | --- | --- | 
|  加  |  傳回值的總和  |  數值  | Add(sales1, sales2) | sales1 \$1 sales2 | 
|  減  |  傳回值之間的差異  |  數值  | Subtract(sales1, sales2) | sales1 ‐ sales2 | 
|  乘  |  傳回值的產品  |  數值  | Multiply(sales1, sales2) | sales1 \$1 sales2 | 
|  除  |  傳回值的商數  |  數值  | Divide(sales1, sales2) | sales1 / sales2 | 
|  MOD  |  傳回模數運算子的結果 (除以兩個值後的餘數)  |  數值  | Mod(sales1, sales2) | sales1 % sales2 | 
|  Abs  | 傳回數值的絕對值。 |  數值  | Abs(sales1) | N/A | 
|  負  | 傳回值的負數 |  數值  | Negate(c1) | -c1 | 
|  EXP  |  傳回 e (尤拉數) 的該值次方  |  數值  | Exp(sales1) | N/A | 
|  Log  |  傳回值的對數 (以 10 為底)  |  數值  | Log(sales1) | N/A | 
|  Ln  |  傳回值的自然對數 (以 e 為底)  |  數值  | Ln(sales1) | N/A | 
|  Pow  |  傳回值的冪  |  數值  | Pow(sales1, 2) | sales1 ^ 2 | 
|  If  |  根據您指定的條件傳回真或偽標籤  |  布林值、數值、文字  | If(sales1>7000, 'truelabel, 'falselabel') | N/A | 
|  或  |  傳回指定值或條件之一是否為真的布林值  |  Boolean  | Or(fullprice, discount) | fullprice \$1\$1 discount | 
|  及  |  傳回兩個指定值或條件之一是否為真的布林值  |  Boolean  | And(sales1,sales2) | sales1 && sales2 | 
|  Not  |  傳回一個與指定值或條件相反的布林值  |  Boolean  | Not(sales1) | \$1sales1 | 
|  案例  |  傳回基於條件描述的布林值 (若 cond1 為真則傳回 c1，若 cond2 為真則傳回 c2，否則傳回 c3)  |  布林值、數值、文字  | Case(cond1, c1, cond2, c2, c3) | N/A | 
|  等於  |  傳回兩個值是否相等的布林值  |  布林值、數值、文字  | N/A | C1 = C2C1 == C2 | 
|  不等於  |  傳回兩個值不相等的布林值  |  布林值、數值、文字  | N/A | c1 \$1= c2 | 
|  Less than  |  傳回 c1 是否小於 c2 的布林值  |  布林值、數值、文字  | N/A | c1 < c2 | 
|  Greater than  |  傳回 c1 是否大於 c2 的布林值  |  布林值、數值、文字  | N/A | c1 > c2 | 
|  Less than or equal  |  傳回 c1 是否小於或等於 c2 的布林值  |  布林值、數值、文字  | N/A | c1 <= c2 | 
|  Greater than or equal  |  傳回 c1 是否大於或等於 c2 的布林值  |  布林值、數值、文字  | N/A | c1 >= c2 | 

SageMaker Canvas 也支援彙總運算子，這些運算子可以執行諸如計算所有值的總和或在資料欄中尋找最小值之類的作業。您可以將彙總運算子與函式中的標準運算子結合使用。例如要計算與平均值的差異，您可以使用該 `Abs(height – avg(height))` 函式。SageMaker Canvas 支援下列彙總運算子。


| 彙總運算子 | Description | 格式 | 範例 | 
| --- | --- | --- | --- | 
|  sum  |  傳回資料欄中所有值的總和  | sum | sum(c1) | 
|  minimum  |  傳回資料欄的最小值  | min | min(c2) | 
|  maximum  |  傳回資料欄的最大值  | max | max(c3) | 
|  average  |  傳回資料欄的平均值  | avg | avg(c4) | 
|  std  | 傳回資料欄的範例標準偏差 | std | std(c1) | 
|  stddev  | 傳回資料欄值的標準偏差 | stddev | stddev(c1) | 
|  variance  | 傳回資料欄中的無偏差變異數 | variance | variance(c1) | 
|  approx\$1count\$1distinct  | 傳回資料欄中不同項目的近似數 | approx\$1count\$1distinct | approx\$1count\$1distinct(c1) | 
|  count  | 傳回資料欄中項目的數字 | count | count(c1) | 
|  first  |  傳回資料欄的第一個值  | first | first(c1) | 
|  last  |  傳回資料欄的最後一個值  | last | last(c1) | 
|  stddev\$1pop  | 傳回資料欄的人口標準偏差 | stddev\$1pop | stddev\$1pop(c1) | 
|  variance\$1pop  |  傳回資料欄中值的人口變異數  | variance\$1pop | variance\$1pop(c1) | 

## 管理資料列
<a name="canvas-prepare-data-manage"></a>

透過管理資料列轉換，您可以執行排序、隨機顯示，以及從資料集中移除資料列。

### 排序列
<a name="canvas-prepare-data-manage-sort"></a>

若要依指定資料欄排序資料集中的資料列，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料列**，然後選擇**排序資料列**。

1. 在**對資料欄進行排序**中，選擇要當作排序依據的資料欄。

1. 針對**排序順序**，請選取**遞增**或**遞減**。

1. 選擇**新增**，將轉換新增至**模型配方**。

### 隨機顯示資料列
<a name="canvas-prepare-data-manage-shuffle"></a>

若要隨機顯示資料集中的資料列，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料列**，然後選擇**隨機顯示資料列**。

1. 選擇**新增**，將轉換新增至**模型配方**。

### 捨棄重複的資料列
<a name="canvas-prepare-data-manage-drop-duplicate"></a>

若要移除資料集中重複的資料列，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料列**，然後選擇**捨棄重複的資料列**。

1. 選擇**新增**，將轉換新增至**模型配方**。

### 按缺少值刪除資料行
<a name="canvas-prepare-data-remove-missing"></a>

缺少值是機器學習資料集中常見的情況，且會影響模型準確度。如果您想要捨棄特定資料欄中含有 Null 或空值的資料列，請使用此轉換。

若要移除指定欄中包含缺少值的列，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料列**。

1. 選擇**按缺少值刪除資料行**。

1. 選擇**新增**，將轉換新增至**模型配方**。

SageMaker Canvas 會在您選取的**資料欄**中刪除包含缺少值的列。從資料集中移除資料列之後，SageMaker Canvas 會在**模型配方**區段中新增轉換。如果您從**模型配方**區段移除轉換，則資料列會傳回資料集。

![\[SageMaker Canvas 應用程式中缺少值作業移除列的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-remove-missing.png)


### 按極端值刪除資料行
<a name="canvas-prepare-data-remove-outliers"></a>

極端值或資料分佈和範圍中的罕見值可能會對模型準確性產生負面影響，並導致更長的建置時間。使用 SageMaker Canvas 您可以偵測和移除數值欄中包含極端值的資料列。您可以選擇使用標準偏差或自訂範圍來定義極端值。

若要移除資料中的極端值，請執行以下操作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料列**。

1. 選擇**按極端值刪除資料列**。

1. 選擇您要檢查極端值的**資料欄**。

1. 將**運算子**設定為**標準偏差**、**自訂數值範圍**或**自訂分位數範圍**。

1. 如果您選擇 **Standard deviation** (標準偏差)，請指定從 1 - 3 開始的 **Standard deviations** (標準偏差) 值。如果您選擇 **Custom numeric range** (自訂數值範圍) 或 **Custom quantile range** (自訂分位數範圍)，請指定 **Min** (下限) 與 **Max** (上限) (數值範圍的數字，或若為分位數範圍，則指定介於 0 - 100% 之間的百分位數)。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

**Standard deviation** (標準偏差) 選項會使用平均值和標準偏差來偵測並移除數值欄中的極端值。您也可以指定標準偏差的數值，其值必須與平均值不同，才能被視為極端值。例如，如果您指定 `3` 為**標準偏差**，則該值必須與平均值的標準偏差必須超過 3，才能被視為極端值。

**Custom numeric range** (自訂數值範圍) 和 **Custom quantile range** (自訂分位數範圍) 選項會使用最小值和最大值偵測並移除數值欄中的極端值。如果您知道可分隔極端值的閾值，請使用此方法。如果您選擇數值範圍，則** Min** (下限) 和 **Max** (上限) 值應為您要在資料中允許的最小和最大數值。如果您選擇分位數範圍，則 **Min** (下限) 與 **Max** (上限) 值應為您要允許的百分位數範圍 (0-100) 的最小值和最大值。

從資料集中移除資料列之後，SageMaker Canvas 會在 **Model recipe** (模型配方) 區段中新增轉換。如果您從 **Model recipe** (模型配方) 區段移除轉換，則資料列會傳回資料集。

![\[SageMaker Canvas 應用程式中依據極端值作業移除資料列的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-remove-outlier.png)


### 依自訂值刪除資料列
<a name="canvas-prepare-data-remove-custom"></a>

您可以移除 具有符合自訂條件數值的資料列。例如建置模型時，您可能想要排除價格值大於 100 的所有列。透過此轉換，您可以建立一個規則，以移除超出所設定閾值的所有資料列。

若要使用自訂移除轉換，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料列**。

1. 選擇 **Drop rows by formula** (按公式捨棄資料列)。

1. 選擇您要檢查的 **Column** (資料欄)。

1. 選取您要使用的 **Operation** (作業) 類型，然後指定選取條件的數值。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

針對 **Operation** (作業)，您可以選擇以下其中一個選項。請注意，可用的作業取決於您選擇的資料欄的資料類型。例如，您無法為包含文字值的資料欄建立 `is greater than` 作業。


| 作業 | 支援的資料類型 | 支援的功能類型 | 函式 | 
| --- | --- | --- | --- | 
|  等於  |  數值、文字  |  二進位、分類  |  移除 **Column** (資料欄) 中數值等於您指定數值的資料列。  | 
|  不等於  |  數值、文字  |  二進位、分類  |  移除 **Column** (資料欄) 中數值不等於您指定數值的資料列。  | 
|  少於  |  數值  | N/A |  移除 **Column** (資料欄) 中數值少於您指定數值的資料列。  | 
|  小於或等於  |  數值  | N/A |  移除 **Column** (資料欄) 中數值小於或等於您指定數值的資料列。  | 
|  大於  |  數值  | N/A |  移除 **Column** (資料欄) 中數值大於您指定數值的資料列。  | 
|  大於或等於  | 數值 | N/A |  移除 **Column** (資料欄) 中數值大於或等於您指定數值的資料列。  | 
|  介於  | 數值 | N/A |  刪除 **Column** (資料欄) 中數值介於您指定的兩個數值之間的資料列。  | 
|  Contains  |  文字  | 分類 |  移除 **Column** (資料欄) 中數值包含您指定數值的資料列。  | 
|  開頭為  |  文字  | 分類 |  移除 **Column** (資料欄) 中數值開始於您指定數值的資料列。  | 
|  Ends with  |  文字  | 分類 |  移除 **Column** (資料欄) 中數值結尾為您指定數值的資料列。  | 

從資料集中移除資料列之後，SageMaker Canvas 會在 **Model recipe** (模型配方) 區段中新增轉換。如果您從 **Model recipe** (模型配方) 區段移除轉換，則資料列會傳回資料集。

![\[SageMaker Canvas 應用程式中自訂值作業移除列的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-remove-custom.png)


## 重新命名欄
<a name="canvas-prepare-data-rename"></a>

透過重新命名資料欄轉換，您可以重新命名資料中的欄。當您重新命名資料欄時，SageMaker Canvas 會變更模型輸入中的欄位名稱。

您可以在 SageMaker Canvas 應用程式的**建置**索引標籤中按兩下資料欄名稱，然後輸入新名稱，即可重新命名資料集中的資料欄。按 **Enter Key** (輸入索引鍵) 可提交變更，按一下輸入外的任意位置可取消變更。您也可以按一下位於清單檢視中列末端或在網格檢視中標題儲存格結尾處的的 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選擇 **Rename** (重新命名) 來重新命名資料欄。

您的資料欄名稱不得超過 32 個字元，或有雙底線 (\$1\$1)，也無法將資料欄重新命名為與另一資料欄相同的名稱。您也無法重新命名捨棄的資料欄。

下列螢幕擷取畫面顯示如何按兩下欄位名稱來重新命名資料欄。

![\[在 SageMaker Canvas 應用程式按兩下重新命名資料欄方法的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-rename-column.png)


當您重新命名資料欄時，SageMaker Canvas 會在 **Model recipe** (模型配方) 區段中新增轉換。如果您從 **Model recipe** (模型配方) 區段中移除轉換，則該欄會還原為其原始名稱。

## 管理欄
<a name="canvas-prepare-data-manage-cols"></a>

透過下列轉換，您可以變更資料欄的資料類型，並取代特定資料欄的遺失值或極端值。SageMaker Canvas 會在建置模型時使用更新的資料類型或值，但不會變更原始資料集。請注意，如果您使用 [卸除資料欄](#canvas-prepare-data-drop) 轉換從資料集中捨棄資料欄，就無法取代該資料欄中的值。

### 取代遺失值
<a name="canvas-prepare-data-replace-missing"></a>

缺少值是機器學習資料集中常見的情況，且會影響模型準確度。您可以選擇捨棄具有缺少值的列，但如果您選擇取代遺失值，則模型會更準確。透過此轉換，您可以將數值欄中遺失值取代為欄中資料的平均值或中間值，或者可以指定自訂值取代遺失值。針對非數字欄，您可以使用欄的模式 (最常用的值) 或自訂值來取代遺失值。

如果您想要取代特定資料欄中含有的 Null 或空值，請使用此轉換。若要在指定欄中取代遺失值，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇 **Manage columns** (管理資料欄)。

1. 選擇 **Replace missing values** (取代遺失值)。

1. 選擇要取代遺失值的 **Column** (資料欄)。

1. 將 **Mode** (模式) 設定為 **Manual** (手動)，以您指定的值取代遺失值。使用 **Automatic (default)** (自動(預設)) 設定，SageMaker Canvas 會以最適合您資料的推算值取代遺失值。除非您指定 **Manual** (手動) 模式，否則每個模型建置都會自動完成此推算方法。

1. 設定**取代為**值：
   + 如果您的欄是數值，請選取 **Mean **(平均值)、**Median** (中間值) 或 **Custom** (自訂)。**Mean** (平均值) 會以欄的平均值取代遺失值，而 **Median** (中間值) 則以欄的中間值取代遺失值。如果您選擇 **Custom** (自訂)，則必須指定要用來取代遺失值的自訂值。
   + 如果您的欄是數值，請選取 **Mode** (模式) 或 **Custom** (自訂)。**Mode** (模式) 會以資料欄的模式或最常用的值取代遺失值。針對 **Custom** (自訂)，則請指定要用來取代遺失值的自訂值。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

從資料集中取代缺少值之後，SageMaker Canvas 會在 **Model recipe** (模型配方) 區段中新增轉換。如果您從 **Model recipe** (模型配方) 區段移除轉換，則缺少值會傳回資料集。

![\[SageMaker Canvas 應用程式中取代遺失值作業的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-replace-missing.png)


### 取代極端值
<a name="canvas-prepare-data-replace-outliers"></a>

極端值或資料分佈和範圍中的罕見值可能會對模型準確性產生負面影響，並導致更長的建置時間。SageMaker Canvas 可讓您偵測數值欄中的極端值，並以資料中可接受範圍內的值取代極端值。您可以選擇使用標準偏差或自訂範圍來定義極端值，也可以使用接受範圍內的最小值和最大值來取代極端值。

若要取代資料中的極端值，請執行以下操作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇**管理資料欄**。

1. 選擇 **Replace outlier values** (取代極端值)。

1. 選擇要取代極端值的 **Column** (資料欄)。

1. 針對 **Define outliers** (定義極端值)，請選擇 **Standard deviation** (標準偏差)、**Custom numeric range** (自訂數值範圍) 或 **Custom quantile range** (自訂分位數範圍)。

1. 如果您選擇 **Standard deviation** (標準偏差)，請指定從 1 - 3 開始的 **Standard deviations** (標準偏差) 值。如果您選擇 **Custom numeric range** (自訂數值範圍) 或 **Custom quantile range** (自訂分位數範圍)，請指定 **Min** (下限) 與 **Max** (上限) (數值範圍的數字，或若為分位數範圍，則指定介於 0 - 100% 之間的百分位數)。

1. 針對 **Replace with** (取代為)，選取 **Min/max range** (最小/最大範圍)。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

**Standard deviation** (標準偏差) 選項會使用平均值和標準偏差來偵測數值欄中的極端值。您也可以指定標準偏差的數值，其值必須與平均值不同，才能被視為極端值。例如，如果您指定 3 為**標準偏差**，則值必須與平均值的標準偏差必須超過 3，才能被視為極端值。SageMaker Canvas 會以接受的範圍內的最小值或最大值取代極端值。例如，如果您將標準偏差設定為僅包含 200 - 300 之間的值，則 SageMaker Canvas 會將 198 的值變更為 200 (最小值)。

**Custom numeric range** (自訂數值範圍) 和 **Custom quantile range** (自訂分位數範圍)選項會使用最小值和最大值偵測數值欄中的極端值。如果您知道可分隔極端值的閾值，請使用此方法。如果您選擇數值範圍，則** Min** (下限) 和 **Max** (上限) 值應為您想允許的最小和最大數值。SageMaker Canvas 會將任何超出最小值和最大值的任何值取代為最小值與最大值。例如，如果您的範圍僅允許 1 - 100 之間的值，則 SageMaker Canvas 會將數值 102 變更為 100 (最大值)。如果您選擇分位數範圍，則 **Min** (下限) 與 **Max** (上限) 值應為您要允許的百分位數範圍 (0-100) 的最小值和最大值。

從資料集中取代數值之後，SageMaker Canvas 會在 **Model recipe** (模型配方) 區段中新增轉換。如果您從 **Model recipe** (模型配方) 區段移除轉換，則原始值會傳回資料集。

![\[SageMaker Canvas 應用程式中移除極端值作業的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-replace-outlier.png)


### 變更資料類型
<a name="canvas-prepare-data-change-type"></a>

SageMaker Canvas 可讓您在數值、文字和日期時間之間變更欄的*資料類型*，同時還能顯示該資料類型的關聯*功能類型*。*資料類型*是指資料的格式及其儲存方式，而*特徵類型*則是指機器學習演算法 (例如二進位或分類) 中所使用之資料的特性。這使您可以有彈性地根據功能手動更改資料欄中的資料類型。在建置模型之前，選擇正確的資料類型可確保資料完整性和準確性。建置模型時會使用這些資料類型。

**注意**  
目前不支援變更功能類型 (例如從二進位變更為分類)。

下表列出了所有 Canvas 支援的資料類型。


| 資料類型 | Description | 範例 | 
| --- | --- | --- | 
| 數值 | 數字資料代表數值 | 1、2、31.1、1.2。1.3 | 
| 文字 | 文字資料代表字元序列，如名稱或描述 | A, B, C, D蘋果，香蕉，柳橙1A\$1, 2A\$1, 3A\$1 | 
| 日期時間 | 日期時間資料代表時間戳記格式格式的日期和時間 | 2019-07-01 01:00:00, 2019-07-01 02:00:00, 2019-07-01 03:00:00 | 

下表列出了所有 Canvas 支援的特徵類型。


| 特徵類型 | Description | 範例 | 
| --- | --- | --- | 
| 二進位 | 二進位特徵代表兩個可能的值 | 0, 1, 0, 1, 0 (2 個相異值)真，偽，真 (2 個相異值) | 
| 分類 | 分類特徵代表不同的類別或群組 | 蘋果，香蕉，柳橙，蘋果 (3 個相異值)A，B，C，D，E，A，D，C (5 個相異值) | 

若要修改資料集中資料欄的資料類型，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的建置****索引標籤中，前往 **Column view** (欄位檢視) 或 **Grid view** (網格檢視)，然後針對特定欄選取 **Data type** (資料類型) 下拉式清單。

1. 在 **資料類型** (資料類型) 下拉式清單中，選擇要轉換的目的資料類型。下列螢幕擷取畫面顯示下拉式清單功能表。  
![\[資料欄的資料類型轉換下拉式清單功能表，顯示在建置索引標籤中。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-prepare-data-change.png)

1. 在 **Column** (資料欄)，選擇或驗證您要變更其資料類型的欄。

1. 針對 **New data type** (新資料類型)，選擇或驗證要轉換成的新資料類型。

1. 如果 **New data type** (新資料類型) 為 `Datetime` 或 `Numeric`，請在 **Handle invalid values** (處理無效值)下選擇下列其中一個選項：

   1. **Replace with empty value** (以空白值取代) - 將無效值取代為空值

   1. **Delete rows** (刪除列) - 具有無效值的資料列會從資料集中移除

   1. **Replace with custom value** (以自訂值取代) - 無效值會以您指定的 **Custom Value** (自訂值) 取代。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

您的資料欄資料類型現在應該被更新。

## 準備時間序列資料
<a name="canvas-prepare-data-timeseries"></a>

使用下列功能來準備時間序列資料，以建立時間序列預測模型。

### 重新取樣時間序列資料
<a name="canvas-prepare-data-resample"></a>

透過重新取樣時間序列資料，您可以為時間序列資料集中的觀察建立固定的間隔。這在處理包含不規則間隔觀察值的時間序列資料時特別有用。例如您可以使用重新取樣，將每隔一小時、兩小時和三小時間隔記錄一次觀察值的資料集，轉換為每次觀測之間固定一小時間隔。預測演算法需要定期取樣觀察值。

若要重新取樣時間序列資料，請執行下列動作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤中，選擇 **Time series** (時間序列)。

1. 選擇 **Resample** (重新取樣)。

1. 在 **Timestamp column** (時間戳記欄)，選擇要套用轉換作業的資料欄。您只能選取 **Datetime** (日期時間) 類型的資料欄。

1. 在 **Frequency settings** (頻率設定) 區段中，選擇 **Frequency** (頻率) 和 **Rate** (比率)。**Frequency** (頻率) 是頻率的單位，**Rate** (比率) 是要套用至資料欄的頻率單位的間隔。例如，在 **Frequency value** (頻率值) 選擇 `Calendar Day`，在 **Rate** (比率) 選擇 `1` 會設定每 1 個行事曆日增加的間隔，例如 `2023-03-26 00:00:00`、`2023-03-27 00:00:00`、`2023-03-28 00:00:00`。如需 **Frequency value** (頻率值) 的完整清單，請參閱此程序之後的資料表。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

下表列出重新取樣時間序列資料時可選取的所有 **Frequency** (頻率) 類型。


| Frequency (頻率) | Description | 範例值 (假設比率為 1) | 
| --- | --- | --- | 
|  工作日  |  將日期時間資料欄中的觀察重新採樣為一週的 5 個工作日 (星期一、星期二、星期三、星期四、星期五)  |  2023-03-24 00：00：00 2023-03-27 00：00：00 2023-03-28 00：00：00 2023-03-29 00：00：00 2023-03-30 00：00：00 2023-03-31 00：00：00 2023-04-03 00：00：00  | 
|  行事曆日  |  將日期時間資料欄中的觀察重新採樣為一週的 7 個工作日 (星期一、星期二、星期三、星期四、星期五、星期六、星期日)  |  2023-03-26 00：00：00 2023-03-27 00：00：00 2023-03-28 00：00：00 2023-03-29 00：00：00 2023-03-30 00：00：00 2023-03-31 00：00：00 2023-04-01 00：00：00  | 
|  週  |  將日期時間欄中的觀察重新採樣到每週的第一天  |  2023-03-13 00：00：00 2023-03-20 00：00：00 2023-03-27 00：00：00 2023-04-03 00：00：00  | 
|  月  |  將日期時間欄中的觀察重新採樣到每月的第一天  |  2023-03-01 00：00：00 2023-04-01 00：00：00 2023-05-01 00：00：00 2023-06-01 00：00：00  | 
|  每年季度  |  將日期時間欄中的觀察重新採樣到每季的最後一天  |  2023-03-31 00：00：00 2023-06-30 00：00：00 2023-09-30 00：00：00 2023-12-31 00：00：00  | 
|  年  |  將日期時間欄中的觀察重新採樣到每年的最後一天  |  2022-12-31 0：00：00 2023-12-31 00：00：00 2024-12-31 00：00：00  | 
|  小時  |  將日期時間欄中的觀察重新採樣到每天的每小時  |  2023-03-24 00：00：00 2023-03-24 01：00：00 2023-03-24 02：00：00 2023-03-24 03：00：00  | 
|  分鐘  |  將日期時間欄中的觀察重新採樣到每小時的每分鐘  |  2023-03-24 00：00：00 2023-03-24 00：01：00 2023-03-24 00：02：00 2023-03-24 00：03：00  | 
|  秒  |  將日期時間欄中的觀察重新採樣到每分鐘的每秒  |  2023-03-24 00：00：00 2023-03-24 00：00：01 2023-03-24 00：00：02 2023-03-24 00：00：03  | 

套用重新取樣轉換時，您可以使用**進階**選項，指定如何修改資料集中其餘資料欄 (時間戳記欄除外) 的結果值。這可以透過指定重新取樣方法來實現，該方法可以是數值和非數值欄的縮減取樣或向上取樣。

*縮減取樣*會增加資料集中觀察值取樣的間隔時間。例如，如果您縮減取樣每小時或每兩個小時取樣一次的觀察值，則資料集中的每個觀察值會每兩小時取樣一次。每小時觀察值的其他資料欄的值使用組合方法，被彙總為單一值。下表顯示使用均值作為組合方法以縮減取樣時間序列資料的範例。資料會從每兩個小時縮減取樣到每小時一次。

下表顯示縮減取樣前一天的每小時溫度讀數。


| 時間戳記 | 溫度 (攝氏) | 
| --- | --- | 
| 12:00 PM | 30 | 
| 1:00 am | 32 | 
| 2:00 am | 35 | 
| 3:00 am | 32 | 
| 4:00 am | 30 | 

下表顯示縮減取樣至每兩小時的溫度讀數。


| 時間戳記 | 溫度 (攝氏) | 
| --- | --- | 
| 12:00 PM | 30 | 
| 2:00 am | 33.5 | 
| 2:00 am | 35 | 
| 4:00 am | 32.5 | 

若要縮減時間序列資料的取樣，請執行下列動作：

1. 展開 **Resample** (重新取樣) 轉換下的 **Advanced** (進階) 區段。

1. 選擇 **Non-numeric combination** (非數值組合)，以指定非數值資料欄的組合方式。如需組合方法的完整清單，請參閱下列資料表。

1. 選擇 **Numeric combination** (數值組合)，以指定數值資料欄的組合方式。如需組合方法的完整清單，請參閱下列資料表。

如果未指定組合方法，則 **Non-numeric combination** (非數字組合) 為 `Most Common` 和 **Numeric combination** (數字組合) 為 `Mean`。下表列出了數值和非數值組合的方法清單。


| 縮減取樣方法 | 組合方法 | Description | 
| --- | --- | --- | 
| 非數字組合 | 最常見 | 依最常見的數值彙總非數值資料欄中的值 | 
| 非數字組合 | Last | 依資料欄最後一個值彙總非數值資料欄中的值 | 
| 非數字組合 | First | 依資料欄第一個值彙總非數值資料欄中的值 | 
| 數字組合 | Mean | 透過取資料欄中所有值的平均值，來彙總數值列中的值 | 
| 數字組合 | Median | 透過取資料欄中所有值的中間值，來彙總數值列中的值 | 
| 數字組合 | 最少 | 透過取資料欄中所有值的最小值，來彙總數值列中的值 | 
| 數字組合 | 最多 | 透過取資料欄中所有值的最大值，來彙總數值列中的值 | 
| 數字組合 | 總和 | 將資料欄所有值相加，彙總數值資料欄中的值 | 
| 數字組合 | 分位數 | 透過取資料欄中所有值的分位數值，來彙總數值列中的值 | 

*擴大取樣*會縮減資料集中觀察取樣的間隔時間。例如，如果您將每兩個小時採樣一次的觀測值擴大取樣為每一小時取樣一次，則每小時觀察的其他資料欄的值是從每兩小時獲得的值內插入的。

若要向上取樣時間序列資料，請執行下列動作：

1. 展開 **Resample** (重新取樣) 轉換下的 **Advanced** (進階) 區段。

1. 選擇 **Non-numeric estimation** (非數值估算)，以指定非數值欄的估算方法。如需方法的完整清單，請參閱此程序之後的資料表。

1. 選擇 **Numeric estimation** (數值估算)，以指定數值欄的估算方法。如需方法的完整清單，請參閱下列資料表。

1. (選用) 選擇 **ID Column** (ID 欄) 以指定具有時間序列觀察 ID 的資料欄。如果您的資料集有兩個時間序列，請指定此選項。如果您的資料欄僅代表一個時間序列，請不要指定此欄位的值。例如，您可以擁有包含資料欄 `id` 和 `purchase` 的資料集。該 `id` 資料欄列具有以下值：`[1, 2, 2, 1]`。該 `purchase` 資料欄列具有以下值 `[$2, $3, $4, $1]`。因此該資料集有兩個時間序列 - 一個時間序列是：`1: [$2, $1]`，另一個時間序列為 `2: [$3, $4]`。

如果未指定估算方法，則預設值 `Forward Fill`適用於 **Non-numeric estimation** (非數值估算) 和 `Linear`適用於 **Numeric estimation** (數值估算)。下表會列出用於估算的方法。


| 向上取樣方法 | 估算方法 | Description | 
| --- | --- | --- | 
| 非數值估算 | 向前填充 | 透過在欄中的所有值之後取連續值，在非數字資料欄中插入數值 | 
| 非數值估算 | 向後填充 | 透過在欄中的所有值之前取連續值，在非數字資料欄中插入數值 | 
| 非數值估算 | 保持缺少 | 藉由顯示空值，在非數值資料欄中插入數值 | 
| 數值估算 | Linear, Time, Index, Zero, S-Linear, Nearest, Quadratic, Cubic, Barycentric, Polynomial, Krogh, Piecewise Polynomial, Spline, P-chip, Akima, Cubic Spline, From Derivatives | 使用指定的插補器在數值欄中插入值。如需有關插補方法的資訊，請參閱 pandas 文件中的 [pandas.DataFrame.interpolate](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.interpolate.html)。 | 

下列螢幕擷取畫面顯示 **Advanced** (進階) 設定，其中已填寫縮減取樣和向上取樣欄位。

![\[Canvas 應用程式，其時間序列重新取樣側邊面板顯示進階選項。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-prepare-data-resampling.png)


### 使用日期時間擷取
<a name="canvas-prepare-data-datetime"></a>

透過日期時間擷取轉換，您可以將日期時間資料欄中的值擷取至不同的資料欄。例如，如果您有一個包含購買日期的欄，則可以將月份值擷取至單獨的欄，並在建置模型時使用新欄。您也可以透過單一轉換來擷取多個值至不同的資料欄。

您的日期時間欄必須使用支援的時間戳記格式。如需 SageMaker Canvas 支援的格式清單，請參閱[Amazon SageMaker Canvas 中的時間序列預測](canvas-time-series.md)。如果您的資料集未使用其中一種支援的格式，請在建立模型之前更新資料集以使用支援的時間戳記格式，並將其重新匯入 Amazon SageMaker Canvas。

要執行日期時間擷取，請執行以下操作。

1. 在 SageMaker Canvas 應用程式的**建置**索引標籤的在轉換列上選擇**檢視全部**。

1. 選擇 **Extract features** (擷取功能)。

1. 選擇要從中擷取值的 **Timestamp column** (時間戳記欄)。

1. 針對 **Values** (值)，選取一個或多個要從欄擷取的值。您可以從時間戳記欄擷取的值包括 **Year** (年)、**Month** (月)、**Day** (日)、**Hour** (小時)、**Week of year** (年份中的週數)、**Day of year** (該年的第幾日) 以及 **Quarter** (季)。

1. (選用) 選擇 **Preview** (預覽) 以預覽轉換結果。

1. 選擇 **Add** (新增)，將轉換新增至 **Model recipe** (模型配方)。

SageMaker Canvas 會在資料集中為您擷取的每個值建立一個新資料欄。除了**年**值之外，SageMaker Canvas 對擷取的值使用以 0 為基礎的編碼。例如，如果您擷取 **Month** (月) 值，則一月會擷取為 0，而二月則為 1。

![\[SageMaker Canvas 應用程式中日期時間擷取方塊的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-datetime-extract.png)


您可以在 **Model recipe** (模型配方) 區段中看到列出的轉換。如果您從 **Model recipe** (模型配方) 區段移除轉換，則新資料欄會從資料集中移除。

# 模型評估
<a name="canvas-evaluate-model"></a>

建立模型之後，您可以先評估模型在資料上執行的效能，然後再使用模型進行預測。您可以使用資訊 (例如預測標籤和進階指標時模型的準確性)，來判斷模型是否可以針對資料進行足夠準確的預測。

[評估評估您的模型效能](canvas-scoring.md)一節描述如何檢視和解譯模型**分析**頁面上的資訊。[在分析中使用進階指標](canvas-advanced-metrics.md)一節包含有關用來量化模型正確性的**進階指標**的更詳細資訊。

您也可以檢視特定*模型候選項目*的更進階資訊，這些是 Canvas 在建置模型時執行的所有模型迭代。根據指定模型候選項目的進階指標，您可以選擇不同的候選項目做為預設值，或是用於進行預測和部署的版本。對於每個模型候選項目，您可以檢視**進階指標**資訊，以協助您決定要選取哪個模型候選項目做為預設值。您可以從**模型排行榜**中選取模型候選項目來檢視此資訊。如需詳細資訊，請參閱[在模型排行榜中檢視模型候選項目](canvas-evaluate-model-candidates.md)。

Canvas 也提供下載 Jupyter 筆記本的選項，讓您可以檢視和執行用來建置模型的程式碼。如果您想要調整程式碼或進一步了解模型的建置方式，這會很有用。如需詳細資訊，請參閱[下載模型筆記本](canvas-notebook.md)。

# 評估評估您的模型效能
<a name="canvas-scoring"></a>

Amazon SageMaker Canvas 為不同類型的模型提供概觀和評分資訊。模型分數可協助您判斷模型進行預測時的準確度。額外的評分洞察可以幫助您量化實際值和預測值之間的差異。

若要檢視模型的分析，請執行下列操作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇您建立的模型。

1. 在頂部導覽窗格中，選擇**分析**索引標籤。

1. 在**分析**索引標籤中，您可以檢視模型的概觀和評分資訊。

以下章節描述如何解譯每個模型類型的評分。

## 評估分類預測模型
<a name="canvas-scoring-categorical"></a>

**概觀**索引標籤會顯示每個資料欄的資料欄影響。**Column impact** (資料欄影響) 是一個百分比分數，用於表示資料欄在進行預測方面，相對於其他資料欄具有多少權重。針對 25% 的資料欄影響，Canvas 將該欄位的預測權重設為 25%，將其他欄位的預測權重設為 75%。

下列螢幕擷取畫面顯示模型的 **Accuracy** (準確度) 分數，以及 **Optimization metric** (最佳化指標)，這是您在建置模型時選擇最佳化的指標。在此情況下，**最佳化指標**為**正確性**。如果您建置模型的新版本，則可以指定不同的最佳化指標。

![\[Canvas 中 Analyze (分析) 索引標籤上的準確度分數和最佳化指標的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/analyze-tab-2-category.png)


分類預測模型的 **Scoring** (評分) 索引標籤使您能夠視覺化所有預測。線段會從頁面左側延伸，表示模型所做的所有預測。線段會在頁面中間聚合在一個垂直的區段上，以表示每個預測與單一類別的比例。從預測的類別中，區段分支至實際類別。您可以透過跟隨預測類別的每個線段到實際類別，從而獲得預測的準確性的視覺理解。

下列影像為您提供 **3\$1 類別預測**模型的 **Scoring section** (評分區段) 範例。

![\[3+ 類別預測模型的 Scoring (評分) 索引標籤螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-analyze/canvas-multiclass-classification.png)


您也可以檢視**進階指標**索引標籤，以取得模型效能的詳細資訊，例如進階指標、錯誤密度圖或混淆矩陣。若要進一步了解**進階指標**，請參閱[在分析中使用進階指標](canvas-advanced-metrics.md)。

## 評估數值預測模型
<a name="canvas-scoring-numeric"></a>

**Overview** (概觀) 索引標籤會顯示每個資料欄的資料欄影響。**Column impact** (資料欄影響) 是一個百分比分數，用於表示資料欄在進行預測方面，相對於其他資料欄具有多少權重。針對 25% 的資料欄影響，Canvas 將該欄位的預測權重設為 25%，將其他欄位的預測權重設為 75%。

下列螢幕擷取畫面顯示 **Overview** (概觀) 索引標籤上模型的 **RMSE** 分數，在此情況下為 **Optimization metric** (最佳化指標)。**Optimization metric** (最佳化指標) 是您在建置模型時選擇最佳化的指標。如果您建置模型的新版本，則可以指定不同的最佳化指標。

![\[Canvas 中 Analyze (分析) 索引標籤上的 RMSE 最佳化指標的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/analyze-tab-2-numeric.png)


用於數值預測的 **Scoring** (評分) 標籤會顯示一條線，以指出模型的預測值與用於進行預測資料的關係。數值預測的值通常為 \$1/- RMSE (均方根誤差值)。該模型預測的值通常是在 RMSE 的範圍內。該行周圍的紫色帶寬度表示 RMSE 範圍。預測值通常落在範圍內。

下列影像顯示了用於數值預測的 **Scoring** (評分) 區段。

![\[數值預測模型的 Scoring (評分) 索引標籤螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-analyze/canvas-analyze-regression-scoring.png)


您也可以檢視**進階指標**索引標籤，以取得模型效能的詳細資訊，例如進階指標、錯誤密度圖或混淆矩陣。若要進一步了解**進階指標**，請參閱[在分析中使用進階指標](canvas-advanced-metrics.md)。

## 評估時間序列預測模型
<a name="canvas-scoring-time-series"></a>

在時間序列預測模型的 **Analyze** (分析) 頁面上，您可以查看模型指標的概觀。您可以將滑鼠懸停在每個指標上方以取得詳細資訊，也可以參閱[在分析中使用進階指標](canvas-advanced-metrics.md)以取得每個指標的詳細資訊。

在**資料欄影響**區段，您可以看到各欄的分數。**資料欄影響**是一個百分比分數，用於表示資料欄在進行預測方面，相對於其他資料欄具有多少權重。針對 25% 的資料欄影響，Canvas 將該欄位的預測權重設為 25%，將其他欄位的預測權重設為 75%。

下列螢幕擷取畫面顯示模型的時間序列指標分數，以及 **Optimization metric** (最佳化指標)，這是您在建置模型時選擇最佳化的指標。在此情況下，**Optimization metric** (最佳化指標) 為 **RMSE**。如果您建置模型的新版本，則可以指定不同的最佳化指標。這些指標分數取自您的回溯測試結果，可在**成品**索引標籤中下載。

![\[Canvas 中 Analyze (分析) 索引標籤上的 RMSE 最佳化指標的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/analyze-tab-2-time-series.png)


**成品**索引標籤可讓您存取數個關鍵資源，您可以用來深入討模型的效能並繼續將其迭代：
+ **隨機訓練和驗證分割** - 本節包含將資料集分割為訓練和驗證集時產生的成品連結，可讓您檢閱資料分佈和潛在偏差。
+ **回溯測試結果** - 本節包含驗證資料集的預測值連結，用來為您的模型產生正確性指標和評估資料。
+ **正確性指標** - 本節列出評估模型效能的進階指標，例如均方根誤差 (RMSE)。如需每個指標的詳細資訊，請參閱[時間序列預測的指標](canvas-metrics.md#canvas-time-series-forecast-metrics)。
+ **可解釋性報告** - 本節提供下載可解釋性報告的連結，其會提供模型決策程序的洞見，以及輸入欄的相對重要性。此報告可協助您識別潛在區域以進行改進。

在**分析**頁面上，您也可以選擇**下載**按鈕，將回溯測試結果、正確性指標和可解釋性報告成品直接下載至本機電腦。

## 評估影像預測模型
<a name="canvas-scoring-image"></a>

**Overview** (概觀) 索引標籤會顯示 **Per label performance** (每個標籤效能)，為您提供每個標籤所預測影像的整體精確度分數。您可以選擇標籤來查看更具體的詳細資訊，例如標籤的 **Correctly predicted** (預測正確) 和 **Incorrectly predicted** (預測不正確) 的影像。

您可以開啟 **Heatmap** (熱度圖) 切換開關，查看每個影像的熱度圖。熱度圖會顯示模型進行預測時影響最大的感興趣區域。如需有關熱度圖以及如何使用熱度圖改善模型的更多相關資訊，請選擇 **Heatmap** (熱度圖) 切換開關旁邊的 **More info** (更多資訊) 圖示。

單一標籤影像預測模型的 **Scoring** (評分) 索引標籤會顯示模型預測為標籤與實際標籤的比較。您一次最多可以選取 10 個標籤。您可以透過選擇標籤下拉式清單功能表，並選取或取消選取標籤來變更視覺效果中的標籤。

您也可以在 **Model accuracy insights** (模型準確度洞察 ) 區段中選擇 **View scores for** (檢視分數) 下拉式清單，檢視個別標籤或標籤群組的深入分析，例如精確度最高或最低的三個標籤。

下列螢幕擷取畫面顯示單一標籤影像預測模型的**評分**資訊。

![\[評分頁面上多類別文字預測模型的實際標籤與預測標籤。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/analyze-image-scoring.png)


## 評估文字預測模型
<a name="canvas-scoring-text"></a>

**Overview** (概觀) 索引標籤會顯示 **Per label performance** (每個標籤效能)，為您提供每個標籤所預測文字段落的整體精確度分數。您可以選擇標籤來查看更具體的詳細資訊，例如標籤的 **Correctly predicted** (預測正確) 和 **Incorrectly predicted** (預測不正確) 的段落。

多類別文字預測模型的 **Scoring** (評分) 索引標籤會顯示模型預測為標籤與實際標籤的比較。

在 **Model accuracy insights** (模型精確度洞察) 區段中，您可以看到 **Most frequent category** (最常見類別)，告訴您模型預測中最頻繁出現的類別，以及這些預測的準確度。如果您的模型在 99% 的次數將標籤預測為 **Positive** (正)，那麼您可以對模型保持高度信心，您的模型擅長預測文字中的正面情緒。

下列螢幕擷取畫面顯示多類別文字預測模型的**評分**資訊。

![\[評分頁面上單一標籤影像預測模型的實際標籤與預測標籤。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/analyze-text-scoring.png)


# 在分析中使用進階指標
<a name="canvas-advanced-metrics"></a>

下節描述如何在 Amazon SageMaker Canvas 中尋找和解譯模型的進階指標。

**注意**  
進階指標目前僅適用於數值和分類預測模型。

若要尋找**進階指標**索引標籤，請執行下列動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇您建立的模型。

1. 在頂部導覽窗格中，選擇**分析**索引標籤。

1. 在**分析**索引標籤內，選擇**進階指標**索引標籤。

在**進階指標**索引標籤中，您可以找到**效能**索引標籤。頁面看起來像是下列螢幕擷取畫面。

![\[分類預測模型進階指標索引標籤的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-analyze-performance.png)


在頂端，您可以看到指標分數的概觀，包括**最佳化指標**，這是您在建置模型時選取要最佳化的指標 (或 Canvas 預設選取的指標)。

下列各節描述**進階指標**內**效能**索引標籤的更詳細資訊。

## 效能
<a name="canvas-advanced-metrics-performance"></a>

在**效能**索引標籤中，您會看到**指標資料表**，以及 Canvas 根據您的模型類型建立的視覺化。對於分類預測模型，Canvas 提供*混淆矩陣*，而對於數值預測模型，Canvas 為您提供*殘差*和*誤差密度*圖。

在**指標資料表**中，會提供您每個進階指標的模型分數完整清單，這比頁面頂端的分數概觀更全面。這裡顯示的指標取決於您的模型類型。如需協助您了解和解譯每個指標的參考，請參閱[指標參考](canvas-metrics.md)。

若要了解根據您的模型類型可能出現的視覺化，請參閱下列選項：
+ **混淆矩陣** - Canvas 使用混淆矩陣在模型正確進行預測時，來協助您進行視覺化。在混淆矩陣中，您的結果會被加以排列，以比較預測值與實際值。下列範例解釋混淆矩陣如何在預測正面和負面標籤的 2 類別預測模型中運作：
  + 相符 - 當真標籤為正數時，模型正確地預測正值。
  + 不相符 — 當真標籤為負值時，模型正確地預測負值。
  + 誤報 - 當真標籤為負值時，模型錯誤地預測正數。
  + 漏報 - 當真標籤為正數時，模型錯誤地預測負值。
+ **精確度召回曲線** - 精確度召回曲線是針對模型召回分數繪製之模型精確度分數的視覺化。一般而言，可以進行完美預測的模型，其精確度和召回分數皆為 1。準確模型的精確度回收曲線在精確度和回收率方面都相當高。
+ **殘差** - 殘差是實際值與模型預測值之間的差異。殘差圖會針對對應的值繪製殘差，以視覺化其分佈和任何模式或極端值。殘差在零附近的常態分佈表示模型與資料非常吻合。不過，如果殘差明顯偏斜或有極端值，可能表示模型過度擬合資料，或有其他需要解決的問題。
+ **誤差密度** - 錯誤密度圖表示模型誤差的分佈。它會顯示每個點的誤差機率密度，從而協助您識別模型可能過度擬合或造成系統性誤差的任何區域。

# 在模型排行榜中檢視模型候選項目
<a name="canvas-evaluate-model-candidates"></a>

當您在 Amazon SageMaker Canvas 中為表格式和時間序列預測模型執行[標準建置](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-build-model.html)時，SageMaker AI 會訓練多個*模型候選項目* (模型的不同迭代)，且預設會選取最佳化指標最高值的模型。對於表格式模型，Canvas 會使用各種演算法和超參數設定，來建置最多 250 個不同的模型候選項目。對於時間序列預測模型，Canvas 會建置 7 個不同的模型 - 每個[支援的預測演算法](canvas-advanced-settings.md#canvas-advanced-settings-time-series)各一個，且有一個整體模型會平均其他模型的預測，以嘗試最佳化正確性。

預設模型候選項目是您可以在 Canvas 中用於預測、註冊至模型註冊庫或部署至端點等動作的唯一版本。不過，您可能想要檢閱所有模型候選項目，然後選取不同的候選項目成為預設模型。您可以在 Canvas 的**模型排行榜**上檢視所有模型候選項目和每個候選項目的更多詳細資訊。

若要檢視**模型排行榜**，請執行下列動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇您建立的模型。

1. 在頂部導覽窗格中，選擇**分析**索引標籤。

1. 在**分析**索引標籤中，選擇**模型排行榜**。

**模型排行榜**頁面隨即開啟，表格式模型的排行榜頁面看起來就像下列螢幕擷取畫面。

![\[模型排行榜，其中列出 Canvas 已訓練的所有模型候選項目。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-model-leaderboard.png)


對於時間序列預測模型，您會看到 7 個模型，其中包括 Canvas 支援的每個時間序列預測演算法各一個，以及一個整合模型。如需演算法的詳細資訊，請參閱[進階時間序列預測模型設定](canvas-advanced-settings.md#canvas-advanced-settings-time-series)。

在上述螢幕擷取畫面中，您可以看到列出的第一個模型候選項目標記為**預設模型**。這是您可以進行預測或部署到端點的模型候選項目。

若要檢視模型候選項目的更詳細指標資訊以比較這些模型候選項目，您可以選擇**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選擇**檢視模型詳細資訊**。

**重要**  
 載入非預設模型候選項目的模型詳細資訊可能需要幾分鐘 (通常少於 10 分鐘)，且需支付 SageMaker AI 託管費用。如需詳細資訊，請參閱 [SageMaker AI 定價](https://aws.amazon.com/sagemaker/pricing/)。

模型候選項目會在**分析**索引標籤中開啟，而顯示的指標專屬於該模型候選項目。檢閱完模型候選項目的指標後，您可以返回或結束檢視以返回**模型排行榜**。

如果想要將**預設模型**設定為不同的候選項目，您可以選擇**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選擇**變更為預設模型**。變更使用 HPO 模式訓練之模型的預設模型可能需要幾分鐘的時間。

**注意**  
如果您的模型已在生產環境中部署、[已註冊至模型註冊庫](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-register-model.html)，或已設定[自動化](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-manage-automations.html)，則您必須在變更預設模型之前刪除部署、模型註冊或自動化。

# 指標參考
<a name="canvas-metrics"></a>

下列各節描述每個模型類型在 Amazon SageMaker Canvas 中可用的指標。

## 數值預測的指標
<a name="canvas-numeric-metrics"></a>

以下清單定義 SageMaker Canvas 中數值預測的指標，並提供有關如何使用它們的資訊。
+ InferenceLatency - 提出模型預測請求後，到從部署模型的即時端點接收模型預測之間的大約時間。此指標以秒為單位進行測量，僅適用於使用 **Ensembling** 模式建置的模型。
+ MAE - 絕對平均值錯誤。平均而言，目標欄的預測與實際值相比為 \$1/-\$1MAE\$1。

  測量預測值和實際值在所有值上取平均值時的差異。MAE 常用於數值預測，以了解模型預測誤差。如果預測為線性，MAE 表示從預測線到實際值的平均距離。MAE 被定義為絕對值誤差的總和，除以觀測值的數量。其數值範圍從 0 到無限大，數字越小，表示模型越適合資料。
+ MAPE - 平均絕對百分比誤差。平均而言，目標欄的預測與實際值相比為 \$1/- \$1MAPE\$1 %。

  MAPE 是實際值與預測或預估值之間絕對差的平均值，除以實際值並以百分比表示。較低的 MAPE 表示更好的效能，因為它表示預測值或預估值更接近實際值。
+ MSE - 均方誤差 (MSE) 是預測值與實際值之間平方差的平均值。

  MSE 值始終為正值。MSE 值越小，模型預測實際值的能力越好。
+ R2 - 目標欄中的差異百分比，可由輸入目標欄說明。

  量化模型可以解釋相依變數的變異程度。數值的範圍從一 (1) 到負一 (-1)。數字越高表示解釋變異性的分數越高。接近零 (0) 的值表示模型只能解釋極少的相依變數。負值表示與資料契合度不佳，且常數函式 (或水平線) 的效能優於模型。
+ RMSE – 均方根誤差或誤差的標準差。

  測量預測值與實際值之間平方差的平方根，並對所有值進行平均。它是用來了解模型預測誤差，也是指出是否存在較大模型誤差與極端值的重要指標。其數值範圍從零 (0) 到無限大，數字越小，表示模型越適合資料。RMSE 取決於規模，不應用來比較不同類型的資料集。

## 用於分類預測的指標
<a name="canvas-categorical-metrics"></a>

本節定義 SageMaker Canvas 中分類預測的指標，並為您提供如何使用它們的相關資訊。

以下是 2 類別預測的可用指標清單。
+ 準確性 - 正確預測的百分比。

  或者，正確預測項目數與總預測數的比率。準確性衡量預測的類別值與實際值的接近程度。準確性指標的值在零 (0) 和一 (1) 之間變化。值 1 表示完美的準確性，0 表示完全不準確。
+ AUC - 介於 0 到 1 之間的值，表示您的模型能夠在資料集中分隔類別的程度。值 1 表示它能夠完美地分隔類別。
+ BalancedAccuracy - 測量準確預測與所有預測的比率。

  這個比率是把真陽性 (TP) 和真陰性 (TN)，按照陽性 (P) 和陰性 (N) 的總數標準化之後計算出來的。其定義如下：`0.5*((TP/P)+(TN/N))`，值範圍從 0 到 1。當不平衡資料集中的正值或負值數量彼此相差很大時，例如只有 1% 的電子郵件是垃圾郵件時，平衡的準確性指標可提供更好的準確性測量。
+ F1 - 準確度的平衡衡量，其會考慮類別平衡。

  這是精確度和召回分數的調和平均值，定義如下：`F1 = 2 * (precision * recall) / (precision + recall)`。F1 評分在 0 和 1 之間變化。評分 1 表示效能已達可能性的上限，0 表示最差。
+ InferenceLatency - 提出模型預測請求後，到從部署模型的即時端點接收模型預測之間的大約時間。此指標以秒為單位進行測量，僅適用於使用 **Ensembling** 模式建置的模型。
+ LogLoss - 對數損失，也稱為跨熵損失，是一種用於評估機率輸出品質的指標，而不是輸出本身。對數損失是一項重要指標，能指出模型何時有高機率發生錯誤預測。其數值介於 0 到無限大之間。如數值為 0，代表完美預測資料的模型。
+ 精確度 - 在預測 \$1category x\$1 的所有時間中，預測正確的時間為 \$1precision\$1%。

  精確度衡量演算法在所有找到的陽性結果中，預測出真陽性 (TP) 的成效。其定義如下：`Precision = TP/(TP+FP)`，其值範圍從零 (0) 到一 (1)。當假陽性的成本高時，精確度是一個重要的指標。舉例來說，一個飛機安全系統被錯誤地判定為可安全飛行，這個假陽性的成本就非常高。假陽性 (FP) 反映了資料中實際上是陰性的陽性預測。
+ 召回率 - 當 \$1target\$1column\$1 實際上是 \$1category x\$1 時，模型正確預測為 \$1category x\$1 的比率為 \$1recall\$1%。

  召回率衡量演算法在資料集內，正確預測所有的真陽性 (TP) 的表現。真陽性代表其為一個陽性預測，同時也是資料中的實際陽性。召回率定義如下：`Recall = TP/(TP+FN)`，值範圍從 0 到 1。分數越高，代表模型在資料中預測出真陽性 (TP) 的能力越好。請注意，通常只測量召回率是不夠的，因為只要預測每個輸出都是真陽性，就能獲得完美的召回率分數。

以下是 3\$1 類別預測的可用指標清單。
+ 準確性 - 正確預測的百分比。

  或者，正確預測項目數與總預測數的比率。準確性衡量預測的類別值與實際值的接近程度。準確性指標的值在零 (0) 和一 (1) 之間變化。值 1 表示完美的準確性，0 表示完全不準確。
+ BalancedAccuracy - 測量準確預測與所有預測的比率。

  這個比率是把真陽性 (TP) 和真陰性 (TN)，按照陽性 (P) 和陰性 (N) 的總數標準化之後計算出來的。其定義如下：`0.5*((TP/P)+(TN/N))`，值範圍從 0 到 1。當不平衡資料集中的正值或負值數量彼此相差很大時，例如只有 1% 的電子郵件是垃圾郵件時，平衡的準確性指標可提供更好的準確性測量。
+ F1macro - F1macro 分數透過計算精確度和召回率來套用 F1 評分，然後取其諧波平均值來計算每個類別的 F1 分數。然後，F1macro 會平均個別分數以取得 F1macro 分數。F1macro 在 0 與 1 之間變化。評分 1 表示效能已達可能性的上限，0 表示最差。
+ InferenceLatency - 提出模型預測請求後，到從部署模型的即時端點接收模型預測之間的大約時間。此指標以秒為單位進行測量，僅適用於使用 **Ensembling** 模式建置的模型。
+ LogLoss - 對數損失，也稱為跨熵損失，是一種用於評估機率輸出品質的指標，而不是輸出本身。對數損失是一項重要指標，能指出模型何時有高機率發生錯誤預測。其數值介於 0 到無限大之間。如數值為 0，代表完美預測資料的模型。
+ PrecisionMacro - 測量精確度，方法是計算每個類別的精確度，並平均分數來取得數個類別的精確度。分數範圍從零 (0) 到一 (1)。分數高表示這個模型在所有找到的陽性結果中，預測出真陽性 (TP) 的成效顯著，而且是在好幾個類別裡平均算出來的。
+ RecallMacro - 測量召回率，方法是計算每個類別的召回率，並平均分數來取得數個類別的召回率。分數範圍從 0 到 1。分數越高，就表示這模型預測出資料集裡的真陽性 (TP) 能力越強。真陽性指的是其預測是陽性，而在資料裡實際上也是陽性。通常只測量召回率是不夠的, 因為只要預測每個輸出都是真陽性，就能獲得完美的召回率分數。

請注意，對於 3\$1 類別預測，您也會收到平均 F1、準確性、精確度和召回率指標。這些指標的分數只是所有類別的平均指標分數。

## 用於影像和文字預測的指標
<a name="canvas-cv-nlp-metrics"></a>

以下是影像預測與文字預測的可用指標清單。
+ 準確性 - 正確預測的百分比。

  或者，正確預測項目數與總預測數的比率。準確性衡量預測的類別值與實際值的接近程度。準確性指標的值在零 (0) 和一 (1) 之間變化。值 1 表示完美的準確性，0 表示完全不準確。
+ F1 - 準確度的平衡衡量，其會考慮類別平衡。

  這是精確度和召回分數的調和平均值，定義如下：`F1 = 2 * (precision * recall) / (precision + recall)`。F1 評分在 0 和 1 之間變化。評分 1 表示效能已達可能性的上限，0 表示最差。
+ 精確度 - 在預測 \$1category x\$1 的所有時間中，預測正確的時間為 \$1precision\$1%。

  精確度衡量演算法在所有找到的陽性結果中，預測出真陽性 (TP) 的成效。其定義如下：`Precision = TP/(TP+FP)`，其值範圍從零 (0) 到一 (1)。當假陽性的成本高時，精確度是一個重要的指標。舉例來說，一個飛機安全系統被錯誤地判定為可安全飛行，這個假陽性的成本就非常高。假陽性 (FP) 反映了資料中實際上是陰性的陽性預測。
+ 召回率 - 當 \$1target\$1column\$1 實際上是 \$1category x\$1 時，模型正確預測為 \$1category x\$1 的比率為 \$1recall\$1%。

  召回率衡量演算法在資料集內，正確預測所有的真陽性 (TP) 的表現。真陽性代表其為一個陽性預測，同時也是資料中的實際陽性。召回率定義如下：`Recall = TP/(TP+FN)`，值範圍從 0 到 1。分數越高，代表模型在資料中預測出真陽性 (TP) 的能力越好。請注意，通常只測量召回率是不夠的，因為只要預測每個輸出都是真陽性，就能獲得完美的召回率分數。

請注意，對於預測 3 個或更多類別的影像和文字預測模型，您也會收到*平均* F1、準確性、精確度和召回率指標。這些指標的分數只是所有類別的指標分數平均值。

## 時間序列預測的指標
<a name="canvas-time-series-forecast-metrics"></a>

以下內容定義 Amazon SageMaker Canvas 中時間序列預測的進階指標，並提供有關如何使用它們的資訊。
+ 平均加權分位數損失 (WQL) - 透過平均 P10、P50 和 P90 分位數的準確度來評估預測。較低的值表示較精確的模型。
+ 加權絕對誤差百分比 (WAPE) – 絕對誤差的總和，由絕對目標的總和標準化，測量預測值與觀測值的整體偏差。較低的值表示更精確的模型，其中 WAPE = 0 是沒有錯誤的模型。
+ 均方根誤差 (RMSE) - 平均平方誤差的平方根。較低的 RMSE 表示更精確的模型，其中 RMSE = 0 是沒有錯誤的模型。
+ 平均絕對百分比誤差 (MAPE) - 所有時間點的平均誤差百分比 (平均預測值與實際值的百分比差異)。較低的值表示更精確的模型，其中 MAPE = 0 是沒有錯誤的模型。
+ 平均絕對縮放誤差 (MASE) - 由簡單基準預測方法的平均絕對誤差標準化的預測的平均絕對誤差。值越低表示模型越準確，其中 MASE < 1 估計值比基準更好，MASE > 1 估計值比基準較差。

# 使用自訂模型進行預測
<a name="canvas-make-predictions"></a>

使用您在 SageMaker Canvas 建立的模型來預測您的資料。以下各節說明如何針對數值和分類預測模型、時間序列預測、影像預測模型，以及文字預測模型進行預測。

數值和分類預測、影像預測和文字預測自訂模型支援針對您的資料進行以下類型的預測：
+ **單一預測** - **單一預測**是指您只需要進行一項預測的時候。例如，您有一個要分類的影像或文字段落。
+ **批次預測** - **批次預測**是指您想要對整個資料集進行預測的時候。您可以對 1 TB\$1 的資料集進行批次預測。例如，您有一個客戶評論的 CSV 檔案，您想要分析客戶情緒，或者您可能有要分類的影像檔案資料夾。您應該使用與輸入資料集相符的資料集進行預測。Canvas 可讓您執行手動批次預測，或者您可以設定每當您更新資料集時就會執行的自動批次預測。

針對每個預測或一組預測，SageMaker Canvas 會傳回下列資訊：
+ 預測的值
+ 預測值正確的機率

**開始使用**

選擇以下其中一個工作流程以您的自訂模型進行預測：
+ [SageMaker Canvas 中的批次預測](canvas-make-predictions-batch.md)
+ [進行單一預測](canvas-make-predictions-single.md)

使用模型產生預測之後，您也可以執行下列操作：
+ [新增版本以更新您的模型。](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-update-model.html)如果您想要嘗試改善模型的預測準確度，您可以建立模型的新版本。您可以選擇複製原始模型建置組態和資料集，也可以變更您的組態並選取不同的資料集。新增版本後，您可以檢閱和比較版本，以選擇最佳版本。
+ [在 SageMaker AI 模型註冊庫中註冊模型版本。](canvas-register-model.md)。您可以將模型的版本註冊到 SageMaker 模型註冊庫，這是追蹤和管理模型版本和機器學習管道狀態的功能。可以存取 SageMaker 模型註冊庫的資料科學家或 MLOps 團隊使用者可以檢閱您的模型版本，並在將模型版本部署到生產環境之前核准或拒絕這些版本。
+ [將您的批次預測傳送至 Quick。](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-send-predictions.html)在 Quick 中，您可以使用批次預測資料集來建置和發佈儀表板。這可以幫助您分析和分享自訂模型產生的結果。

# 進行單一預測
<a name="canvas-make-predictions-single"></a>

**注意**  
本節描述如何從 Canvas 應用程式中的模型取得單一預測。如需透過將模型部署到端點來在生產環境中進行即時調用的相關資訊，請參閱[將模型部署到端點](canvas-deploy-model.md)。

如果您要取得單一資料點的預測，請進行單一預測。您可以使用此功能取得即時預測，或嘗試變更個別值，以瞭解它們如何影響預測結果。請注意，單一預測依賴於非同步推論端點，該端點會在閒置 (或未收到任何預測請求) 兩個小時後關閉。

基於您的模型類型，選擇下列其中一個程序。

## 使用數值和分類預測模型進行單一預測
<a name="canvas-make-predictions-numeric-categorical"></a>

若要針對數值或分類預測模型進行單一預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 在 **Run predictions** (執行預測) 頁面上，選擇 **Single prediction** (單一預測)。

1. 對於代表輸入資料欄的每個 **Column** (資料欄) 欄位，您可以變更 **Value** (值)。從下拉式清單功能表選取您要變更的 **Value** (值)。針對數值欄位，您可以輸入新數值。針對具有標籤的欄位，您可以選取不同的標籤。

1. 當您準備好產生預測時，請在右側的 **Prediction** (預測) 窗格中選擇 **Update** (更新)。

在右側的 **Prediction** (預測) 窗格中，您將看到預測結果。您可以 **Copy** (複製) 預測結果圖表，或者也可以選擇 **Download** (下載) 將預測結果圖表下載為影像，或將值和預測下載為 CSV 檔案。

## 使用時間序列預測模型進行單一預測
<a name="canvas-make-predictions-forecast"></a>

若要對時間序列預測模型進行單一預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 選擇**單一預測**。

1. 針對**項目**，選取您要預測其值的項目。

1. 如果您已使用依資料欄分組來訓練模型，請為項目選取依類別分組。

預測結果會在以下窗格中載入，為您顯示每個分位數的預測圖表。選擇**結構描述檢視**以查看數值預測值。您也可以選擇**下載**，將預測結果下載為影像或 CSV 檔案。

## 使用影像預測模型進行單一預測
<a name="canvas-make-predictions-image"></a>

若要針對單一標籤影像預測模型進行單一預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 在 **Run predictions** (執行預測) 頁面上，選擇 **Single prediction** (單一預測)。

1. 選擇 **Import package** (匯入影像)。

1. 系統會提示您上傳影像。您可以從本機電腦或 Amazon S3 儲存貯體上傳影像。

1. 選擇 **Import** (匯入) 以匯入影像並產生預測。

在右側的 **Prediction results** (預測結果) 窗格中，模型列出了影像的可能標籤，以及每個標籤的 **Confidence** (可信度分數)。例如，模型可以預測影像的標籤**大海**，可信度分數為 96%。該模型可能已將影像預測為**冰河**，其可信度分數僅為 4％。因此您可以判斷您的模型在預測海洋的影像方面是否可信。

## 使用文字預測模型進行單一預測
<a name="canvas-make-predictions-text"></a>

若要針對多類別文字預測模型進行單一預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 在 **Run predictions** (執行預測) 頁面上，選擇 **Single prediction** (單一預測)。

1. 在 **Text field** (文字欄位) 中，輸入您要取得預測的文字。

1. 選擇 **Generate prediction results** (產生預測結果) 以取得您的預測。

在右側窗格 **Prediction results** (預測結果) 中，除了每個可能標籤的 **Confidence** (可信度分數) 之外，您還會獲得文字的分析。例如，如果您針對某項產品輸入了正面評論，您可能會得到 **Positive** (正數) 的可信度分數 85%，而 **Neutral** (中性) 的可信度分數可能是 10%，而 **Negative** (負值) 的可信度分數則只有 5%。

# SageMaker Canvas 中的批次預測
<a name="canvas-make-predictions-batch"></a>

當您擁有要產生預測的整個資料集時，請進行批次預測。Amazon SageMaker Canvas 支援針對大小高達數 PB 的資料集進行批次預測。

您可以使用兩種類型的批次預測：
+ [手動](canvas-make-predictions-batch-manual.md)批次預測是指您有要進行一次性預測的資料集時。
+ [自動批次預測](canvas-make-predictions-batch-auto.md)是當您設定每當更新特定資料集都會執行的組態時。例如，如果您已設定每週更新 SageMaker Canvas 資料集的庫存資料，則可以設定每次更新資料集時執行的自動批次預測。設定自動批次預測工作流程後，請參閱以[如何管理自動化](canvas-manage-automations.md)取得有關檢視和編輯組態詳細資訊的更多相關資訊。如需設定自動資料集更新的更多相關資訊，請參閱[設定資料集的自動更新](canvas-update-dataset-auto.md)。

**注意**  
時間序列預測模型不支援自動批次預測。  
您僅可針對透過本機上傳或 Amazon S3 匯入的資料集設定自動批次預測。此外，自動批次預測只會在您登入 Canvas 應用程式時執行。如果您登出 Canvas，則當您重新登入時，自動批次預測任務便會繼續。

若要開始使用，請檢閱[批次預測資料集需求](canvas-make-predictions-batch-preqreqs.md)，然後選擇下列其中一個手動或自動批次預測工作流程。

**Topics**
+ [批次預測資料集需求](canvas-make-predictions-batch-preqreqs.md)
+ [進行手動批次預測](canvas-make-predictions-batch-manual.md)
+ [進行自動批次預測](canvas-make-predictions-batch-auto.md)
+ [編輯自動批次預測設定](canvas-make-predictions-batch-auto-edit.md)
+ [刪除自動批次預測設定](canvas-make-predictions-batch-auto-delete.md)
+ [檢視您的批次預測任務](canvas-make-predictions-batch-auto-view.md)

# 批次預測資料集需求
<a name="canvas-make-predictions-batch-preqreqs"></a>

針對批次預測，請確定您的資料集符合[建立資料集](canvas-import-dataset.md)中所述的需求。如果您的資料集大於 5 GB，則 Canvas 會使用 Amazon EMR Serverless，來處理您的資料並將其分割成較小的批次。在您分割資料之後，Canvas 會使用 SageMaker AI 批次轉換進行預測。執行批次預測後，您可能會看到來自這兩個服務的費用。如需詳細資訊，請參閱 [Canvas 定價](https://aws.amazon.com/sagemaker/canvas/pricing/)。

您可能無法對某些資料集進行預測，如果它們具有不相容的*結構描述*的話。*結構描述*是一種組織結構。針對表格式資料集，結構描述是資料欄的名稱和資料欄中資料的資料類型。不相容的結構描述可能的發生原因如下：
+ 您用來進行預測的資料集具有的資料欄少於您用來建立模型的資料集。
+ 您用來建立資料集的資料欄資料類型，可能與您用來進行預測的資料集中的資料類型不同。
+ 您用來進行預測的資料集，以及用來建置模型的資料集中資料欄名稱不相符。欄位名稱區分大小寫，`Column1` 不同於 `column1`。

為了確保您可以成功產生批次預測，請比對批次預測資料集的結構描述與用於訓練模型的資料集。

**注意**  
針對批次預測，如果您在建置模型時捨棄任何欄，Canvas 會將捨棄的欄新增回預測結果。但是，Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

# 進行手動批次預測
<a name="canvas-make-predictions-batch-manual"></a>

基於您的模型類型，選擇下列其中一個程序用於手動批次預測。

## 使用數值、分類和時間序列預測模型進行手動批次預測
<a name="canvas-make-predictions-batch-numeric-categorical"></a>

若要對數值、分類和時間序列預測模型類型進行手動批次預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 在 **Run predictions** (執行預測) 頁面上，選擇 **Batch prediction** (批次預測)。

1. 選擇**選取資料集**以挑選用於產生預測的資料集。

1. 從可用資料集清單中，選取您的資料集，然後選擇**開始預測**以取得您的預測。

在預測任務完成執行之後，**預測**區段的相同頁面上會列出輸出資料集。此資料集包含您的結果，且如果您選取了 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，則您可以選擇 **Preview** (預覽) 來預覽輸出資料。您可以看到與預測相符的輸入資料以及預測正確的機率。然後您可以選擇 **Download prediction** (下載預測) 並將結果下載檔案。

## 使用影像預測模型進行手動批次預測
<a name="canvas-make-predictions-batch-image"></a>

若要針對單一標籤影像預測模型進行手動批次預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 在 **Run predictions** (執行預測) 頁面上，選擇 **Batch prediction** (批次預測)。

1. 如果您已匯入您的資料集，請選擇** Select dataset** (選取資料集)。如果沒有，請選擇 **Import new dataset** (匯入新的資料集)，然後系統將導引您完成匯入資料工作流程。

1. 從可用資料集清單中，選取您的資料集，然後選擇 **Generate predictions** (產生預測) 以取得您的預測。

預測工作完成執行後，在 **Run predictions** (執行預測) 頁面上，您會看到 **Predictions** (預測) 下方列出的輸出資料集。此資料集包含您的結果，且如果您選取了 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，則您可以選擇 **View prediction results** (檢視預測結果) 來檢視輸出資料。您可以檢視影像及其預測的標籤和可信度分數。然後您可以選擇 **Download prediction** (下載預測) 將結果下載為 CSV 或 ZIP 檔案。

## 使用文字預測模型進行手動批次預測
<a name="canvas-make-predictions-batch-text"></a>

若要針對多類別文字預測模型進行手動批次預測，請執行下列動作：

1. 在 Canvas 應用程式左側導覽窗格中選擇 **My models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 開啟模型後，選擇 **Predict** (預測) 分頁標籤。

1. 在 **Run predictions** (執行預測) 頁面上，選擇 **Batch prediction** (批次預測)。

1. 如果您已匯入您的資料集，請選擇** Select dataset** (選取資料集)。如果沒有，請選擇 **Import new dataset** (匯入新的資料集)，然後系統將導引您完成匯入資料工作流程。您選擇的資料集必須具有與建立模型時所使用的資料集相同的來源資料欄。

1. 從可用資料集清單中，選取您的資料集，然後選擇 **Generate predictions** (產生預測) 以取得您的預測。

預測工作完成執行後，在 **Run predictions** (執行預測) 頁面上，您會看到 **Predictions** (預測) 下方列出的輸出資料集。此資料集包含您的結果，且如果您選取了 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，則您可以選擇 **Preview** (預覽) 來檢視輸出資料。您可以檢視影像及其預測的標籤和可信度分數。然後您可以選擇 **Download prediction** (下載預測) 來下載結果。

# 進行自動批次預測
<a name="canvas-make-predictions-batch-auto"></a>

**注意**  
時間序列預測模型不支援自動批次預測。

若要設定自動批次預測的排程，請執行以下動作：

1. 在 Canvas 左側導覽窗格中選擇 **My Models** (我的模型)。

1. 選擇您的模型。

1. 選擇 **Predict** (預測) 標籤。

1. 選擇 **Batch prediction** (批次預測)。

1. 針對 **Generate predictions** (產生預測)，選擇 **Automatic** (自動)。

1. **Automate batch predictions** (自動批次預測) 對話方塊隨即彈出。選擇 **Select dataset** (選取資料集)，然後選擇您要自動執行預測的資料集。請注意，您只能選取透過本機上傳或 Amazon S3 匯入的資料集。

1. 選取資料集之後，請選擇 **Set up** (設定)。

Canvas 在您設定組態之後，會針對資料集執行批次預測工作。然後，每當您[更新資料集](canvas-update-dataset.md)時，會手動或自動執行另一個批次預測工作。

預測工作完成執行後，在 **Run predictions** (執行預測) 頁面上，您會看到 **Predictions** (預測) 下方列出的輸出資料集。此資料集包含您的結果，且如果您選取了 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，則您可以選擇 **Preview** (預覽) 來預覽輸出資料。您可以看到與預測相符的輸入資料以及預測正確的機率。然後，您可以選擇 **Download** (下載) 資源下載結果。

以下各節描述如何透過 Canvas 應用程式中的 **Datasets** (資料集) 頁面檢視、更新及刪除自動批次預測組態。您最多只能在 Canvas 中設定 20 個自動組態。如需透過 Canvas 應用程式中的 **Automations** (自動化) 頁面檢視自動更新批次預測作業歷史記錄或變更自動更新組態的更多相關資訊，請參閱 [如何管理自動化](canvas-manage-automations.md)。

# 編輯自動批次預測設定
<a name="canvas-make-predictions-batch-auto-edit"></a>

您可能想要變更資料集的自動更新組態，例如變更更新頻率。您也可能希望關閉自動更新組態，以暫停資料集的更新。

當您編輯批次預測設定時，您可以變更目標資料集，但無法變更頻率 (因為每當資料集更新時，都會自動進行批次預測)。

若要編輯自動更新組態，請執行下列動作：

1. 前往模型的 **Predict** (預測) 索引標籤。

1. 在 **Predictions** (預測) 下，選擇 **Configuration** (組態) 索引標籤。

1. 尋找您的組態並選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 從下拉式清單功能表選擇 **Update configuration** (更新組態)。

1. **Automate batch prediction** (自動批次預測) 對話方塊隨即彈出。您可以選取其他資料集，然後選擇 **Set up** (設定) 以儲存變更。

您的自動批次預測設定現已更新。

若要暫停自動批次預測，請執行下列動作來關閉自動設定：

1. 前往模型的 **Predict** (預測) 索引標籤。

1. 在 **Predictions** (預測) 下，選擇 **Configuration** (組態) 索引標籤。

1. 從清單中尋找您的組態，然後關閉 **Auto update** (自動更新) 切換開關。

自動批次預測現已暫停。您可以隨時重新開啟切換，以繼續更新排程。

# 刪除自動批次預測設定
<a name="canvas-make-predictions-batch-auto-delete"></a>

若要了解如何刪除自動批次預測設定，請參閱 [刪除自動組態](canvas-manage-automations-delete.md)。

您也可以刪除組態，請執行下列動作：

1. 前往模型的 **Predict** (預測) 索引標籤。

1. 在 **Predictions** (預測) 下，選擇 **Configuration** (組態) 索引標籤。

1. 從清單中尋找您的組態並選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 從下拉式清單功能表選擇 **Delete configuration** (刪除組態)。

您的組態現在應該已刪除。

# 檢視您的批次預測任務
<a name="canvas-make-predictions-batch-auto-view"></a>

若要檢視批次預測任務的狀態和歷程記錄，請前往模型的**預測**索引標籤。

每個自動批次預測任務都會顯示在模型的**預測**索引標籤中。在 **Predictions** (預測) 下，您可以看到 **All jobs** (所有工作) 索引標籤和 **Configuration** (組態) 索引標籤：
+ **所有任務** - 在此索引標籤中，您可以查看此模型的所有手動和自動批次預測任務。您可以依組態名稱篩選工作。對於每個任務，您可以看到下列欄位：
  + **狀態** - 批次預測任務的目前狀態。如果狀態為**失敗**或**部分失敗**，您可以將滑鼠懸停在狀態上方，以檢視更詳細的錯誤訊息來協助您進行故障診斷。
  + **輸入資料集** - Canvas 輸入資料集的名稱，包括資料集版本。
  + **預測類型** - 預測任務是自動還是手動。
  + **資料列** - 預測的資料列數量。
  + **組態名稱** - 批次預測任務組態的名稱。
  + **QuickSight** – 說明您是否已將批次預測傳送至 Quick。
  + **已建立** - 批次預測任務的建立時間。

  如果您選擇**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，您可以選擇**檢視詳細資訊**、**預覽預測**、**下載預測**或**傳送至快速**。如果您選擇**檢視詳細資訊**，頁面即會開啟，其中為您顯示批次預測任務的完整詳細資訊，包括狀態、輸入和輸出資料組態、用來完成任務的執行個體相關資訊，以及 Amazon CloudWatch logs 的存取權。頁面看起來像是下列螢幕擷取畫面。  
![\[批次預測任務詳細資訊頁面，其中顯示任務的所有其他詳細資訊。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-view-batch-prediction-job-details.png)
+ **Configuration** (組態) - 在此索引標籤中，您可以檢視為此模型建立的所有自動批次預測組態。針對每個組態，您都可以看到**已建立**組態的時間戳記、追蹤其更新的**輸入資料集**，以及**下一個排程任務**等欄位，而這個排程是下一個自動預測任務排定要開始的時間。如果您選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，您可以選擇 **View all jobs** (檢視所有工作)來查看組態的作業歷史記錄和進行中的工作。



# 將預測傳送至 Quick
<a name="canvas-send-predictions"></a>

**注意**  
您可以將批次預測傳送至 Quick，以取得數值和分類預測和時間序列預測模型。不包括單一標籤影像預測和多類別文字預測模型。

在 SageMaker Canvas 中使用自訂表格式模型產生批次預測後，您可以將這些預測做為 CSV 檔案傳送至 Quick，這是用於建置和發佈預測儀表板的商業智慧 (BI) 服務。

例如，如果您建立 2 類別預測模型來判斷客戶是否會流失，您可以在 Quick 中建立視覺化的預測儀表板，以顯示預期流失的客戶百分比。若要進一步了解 Quick，請參閱 [Quick 使用者指南](https://docs.aws.amazon.com/quicksight/latest/user/welcome.html)。

下列各節說明如何將批次預測傳送至 Quick 進行分析。

## 開始之前
<a name="canvas-send-predictions-prereqs"></a>

您的使用者必須擁有必要的 AWS Identity and Access Management (IAM) 許可，才能將預測傳送至 Quick。您的管理員可以為您的使用者設定 IAM 許可。如需詳細資訊，請參閱[授予您的使用者將預測傳送至快速的許可](canvas-quicksight-permissions.md)。

您的快速帳戶必須包含`default`命名空間，該命名空間會在您第一次建立快速帳戶時設定。請聯絡您的管理員，以協助您存取 Quick。如需詳細資訊，請參閱《 [快速使用者指南》中的設定](https://docs.aws.amazon.com/quicksight/latest/user/setting-up.html)*快速*。

您的快速帳戶必須在與 Canvas 應用程式相同的區域中建立。如果您 Quick 帳戶的所在區域與 Canvas 應用程式的區域不同，您必須[關閉](https://docs.aws.amazon.com/quicksight/latest/user/closing-account.html)並重新建立您的 Quick 帳戶，或在與 Quick 帳戶相同的區域中[設定 Canvas 應用程式](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html#canvas-prerequisites)。您可以執行下列動作來檢查快速主要區域 （假設您已擁有快速帳戶）：

1. 開啟您的 [Quick 主控台](https://quicksight.aws.amazon.com/)。

1. 當頁面載入時，您的快速主區域會以下列格式附加至 URL：`https://<your-home-region>.quicksight.aws.amazon.com/`。

您必須知道要向其傳送預測之 Quick 使用者的使用者名稱。您可以將預測發送給自己或具有正確許可的其他使用者。您傳送預測的任何使用者都必須位於 Quick 帳戶的`default`[命名空間](https://docs.aws.amazon.com/quicksight/latest/user/namespaces.html)中，並在 Quick 中具有 `Author`或 `Admin`角色。

此外，Quick 必須能夠存取您網域的 SageMaker AI 預設 Amazon S3 儲存貯體，其命名格式如下：`sagemaker-{REGION}-{ACCOUNT_ID}`。區域應與快速帳戶的主區域和 Canvas 應用程式的區域相同。若要了解如何快速存取存放在 Amazon S3 儲存貯體中的批次預測，請參閱《 快速*使用者指南*》中的[我無法連線至 Amazon S3](https://docs.aws.amazon.com/quicksight/latest/user/troubleshoot-connect-S3.html) 的主題。

## 支援的資料格式
<a name="canvas-send-predictions-formatting"></a>

傳送預測之前，請檢查批次預測的資料格式是否與 Quick 相容。
+ 若要進一步了解時間序列資料接受的資料格式，請參閱《 *快速使用者指南*》中的[支援的日期格式](https://docs.aws.amazon.com/quicksight/latest/user/supported-date-formats.html)。
+ 若要進一步了解可能使您無法傳送至 Quick 的資料值，請參閱*《Quick 使用者指南*》中的[資料中不支援的值](https://docs.aws.amazon.com/quicksight/latest/user/unsupported-data-values.html)。

另請注意，Quick 使用 字元`"`做為文字限定詞，因此如果您的 Canvas 資料包含任何`"`字元，請確定您關閉所有相符的引號。任何不相符的引號都可能導致將資料集傳送至 Quick 時發生問題。

## 將批次預測傳送至 Quick
<a name="canvas-send-predictions-send"></a>

使用下列程序將您的預測傳送至 Quick：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇 **My Models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。

1. 選擇 **Predict** (預測) 標籤。

1. 在 **Predictions** (預測) 下，選取您要共用的批次預測資料集 (或多個資料集)。您一次最多可以共用 5 個批次預測資料集。

1. 選取資料集後，選擇**傳送至快速**。
**注意**  
除非您選取一或多個資料集，否則**傳送至快速**按鈕不會啟用。

   或者您也可以選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選擇 **View prediction results** (檢視預測結果) 來預覽預測。從資料集預覽中，您可以選擇**傳送至快速**。下列螢幕擷取畫面顯示資料集預覽中的**「傳送至快速**」按鈕。  
![\[資料集預覽的螢幕擷取畫面，其中包含底部的「傳送至快速」按鈕。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/send-to-quicksight-preview.png)

1. 在**傳送至快速**對話方塊中，執行下列動作：

   1. 對於 **QuickSight 使用者**，輸入您要向其傳送預測的 Quick 使用者名稱。如果您想將它們發送給自己，請輸入您自己的使用者名稱。您只能將預測傳送給 Quick 帳戶`default`命名空間中的使用者，而且使用者必須在 Quick 中具有 `Author`或 `Admin`角色。

   1. 選擇**傳送**。

   下列螢幕擷取畫面顯示**「傳送至快速**」對話方塊：  
![\[傳送至快速對話方塊。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/send-to-quicksight.png)

傳送批次預測後，您傳送之資料集的 **QuickSight** 欄位會顯示為 `Sent`。在確認預測已傳送的確認方塊中，您可以選擇**開啟快速**以開啟您的快速應用程式。如果您已完成使用 Canvas，則應[登出](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-log-out.html) Canvas 應用程式。

您已將資料集傳送到 的快速使用者可以開啟其快速應用程式，並檢視已與其共用的 Canvas 資料集。然後，他們可以使用資料建立預測儀表板。如需詳細資訊，請參閱《 [快速使用者指南》中的快速資料分析入門](https://docs.aws.amazon.com/quicksight/latest/user/getting-started.html)。 **

根據預設，您傳送預測的所有使用者都具有 Quick 中資料集的擁有者許可。擁有者可以建立分析、重新整理、編輯、刪除和重新共用資料集。擁有者對資料集所做的變更會變更所有具有存取權的使用者的資料集。若要變更許可，請前往 Quick 中的資料集並管理其許可。如需詳細資訊，請參閱[《 快速使用者指南》中的檢視和編輯與資料集共用的許可使用者](https://docs.aws.amazon.com/quicksight/latest/user/sharing-data-sets.html#view-users-data-set)。 **

# 下載模型筆記本
<a name="canvas-notebook"></a>

**注意**  
模型筆記本功能適用於快速建置和標準建置表格式模型，以及微調基礎模型。影像預測、文字預測或時間序列預測模型不支援模型筆記本。  
如果您想要為此功能啟動之前建置的表格式模型產生模型筆記本，則必須重新建置模型以產生筆記本。

對於您在 Amazon SageMaker Canvas 中成功建置的合格模型，會產生一個包含所有模型建置步驟報告的 Jupyter 筆記本。此 Jupyter 筆記本包含 Python 程式碼，您可以在本機執行或在 Amazon SageMaker Studio Classic 等環境中執行該程式碼，以複寫建置模型所需的步驟。如果您想要試驗程式碼或參閱 Canvas 如何建置模型的後端詳細資訊，筆記本會很有用。

若要存取模型筆記本，請執行下列動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇**我的模型**。

1. 選擇您已建置的模型和版本。

1. 在模型版本的頁面上，選擇標頭中的**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 從下拉式功能表中，選擇**檢視筆記本**。

1. 隨即出現快顯視窗，其中含有筆記本內容。您可以選擇**下載**，然後執行下列其中一個動作：

   1. 選擇**下載**，將筆記本內容儲存到您的本機裝置。

   1. 選擇**複製 S3 URI** 以複製存放筆記本的 Amazon S3 位置。筆記本存放在 **Canvas 儲存組態**中指定的 Amazon S3 儲存貯體中，該組態是在[設定 Amazon SageMaker Canvas 的先決條件](canvas-getting-started.md#canvas-prerequisites)一節中設定的。

您現在應該能夠在本機或以 Amazon S3 中的物件形式檢視筆記本。您可以將筆記本上傳至 IDE 以編輯和執行程式碼，也可以與組織中的其他人共用筆記本以供檢閱。

# 將您的模型傳送至 Quick
<a name="canvas-send-model-to-quicksight"></a>

如果您使用 Quick，並想要在 Quick 視覺化中利用 SageMaker Canvas，您可以建置 Amazon SageMaker Canvas 模型，並將其用作 Quick 資料集中的*預測欄位*。*預測欄位*是快速資料集中的欄位，可以對資料集中的指定資料欄進行預測，類似於 Canvas 使用者如何使用模型進行單一或批次預測。若要進一步了解如何將 Canvas 預測功能整合到您的快速資料集，請參閱《 [快速使用者指南](https://docs.aws.amazon.com/quicksight/latest/user/welcome.html)》中的 [SageMaker Canvas 整合](https://docs.aws.amazon.com/quicksight/latest/user/sagemaker-canvas-integration.html)。

下列步驟說明如何使用 Canvas 模型將預測欄位新增至快速資料集：

1. 開啟 Canvas 應用程式並使用資料集建立模型。

1. 在 Canvas 中建置模型之後，請將模型傳送至 Quick。當您將模型傳送至 Quick 時，結構描述檔案會自動下載到您的本機電腦。您可以在下一個步驟中將此結構描述檔案上傳至 Quick。

1. 開啟快速，然後選擇與用來建置模型的資料集具有相同結構描述的資料集。在資料集中新增預測欄位，並執行下列動作：

   1. 指定從 Canvas 傳送的模型。

   1. 上傳在步驟 2 中下載的結構描述檔案。

1. 儲存並發佈變更，然後產生新資料集的預測。Quick 使用模型以預測填入目標資料欄。

若要將模型從 Canvas 傳送至 Quick，您必須符合下列先決條件：
+ 您必須同時設定 Canvas 和 Quick。您的快速帳戶必須在與 Canvas 應用程式 AWS 區域 相同的 中建立。如果您 Quick 帳戶的所在區域與 Canvas 應用程式的區域不同，您必須[關閉](https://docs.aws.amazon.com/quicksight/latest/user/closing-account.html)並重新建立您的 Quick 帳戶，或在與 Quick 帳戶相同的區域中[設定 Canvas 應用程式](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html#canvas-prerequisites)。您的快速帳戶也必須包含您在第一次建立快速帳戶時設定的預設命名空間。請聯絡您的管理員，以協助您存取 Quick。如需詳細資訊，請參閱《 [快速使用者指南》中的設定](https://docs.aws.amazon.com/quicksight/latest/user/setting-up.html)*快速*。
+ 您的使用者必須擁有必要的 AWS Identity and Access Management (IAM) 許可，才能將預測傳送至 Quick。您的管理員可以為您的使用者設定 IAM 許可。如需詳細資訊，請參閱[授予使用者將預測傳送至 Quick 的許可](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-quicksight-permissions.html)。
+ Quick 必須能夠存取您為 Canvas 應用程式儲存體指定的 Amazon S3 儲存貯體。如需詳細資訊，請參閱[設定您的 Amazon S3 儲存](canvas-storage-configuration.md)。

# Amazon SageMaker Canvas 中的時間序列預測
<a name="canvas-time-series"></a>

**注意**  
時間序列預測模型僅支援表格式資料集。

Amazon SageMaker Canvas 可讓您使用機器學習時間序列預測。時間序列預測使您能夠進行可能隨時間變化的預測。

您可以針對下列範例進行時間序列預測：
+ 預測您在未來幾個月內的庫存。
+ 未來四個月售出的物品數量。
+ 節日期間降低價格對銷售的影響。
+ 接下來 12 個月的物品庫存。
+ 接下來幾個小時內進入商店的客戶人數。
+ 預測產品價格降低 10％ 如何影響時段內的銷售。

若要進行時間序列預測，您的資料集必須具備下列項目：
+ 一個時間戳欄，其中所有值包含 `datetime` 類型。
+ 目標欄，其中包含您用來預測未來值的值。
+ 項目 ID 欄，其中包含資料集中每個項目的唯一識別碼，例如 SKU 號碼。

時間戳記欄的 `datetime` 值必須使用下列其中一種格式：
+ `YYYY-MM-DD HH:MM:SS`
+ `YYYY-MM-DDTHH:MM:SSZ`
+ `YYYY-MM-DD`
+ `MM/DD/YY`
+ `MM/DD/YY HH:MM`
+ `MM/DD/YYYY`
+ `YYYY/MM/DD HH:MM:SS`
+ `YYYY/MM/DD`
+ `DD/MM/YYYY`
+ `DD/MM/YY`
+ `DD-MM-YY`
+ `DD-MM-YYYY`

您可以針對下列間隔進行預測：
+ 1 分鐘
+ 5 分鐘。
+ 15 分鐘。
+ 30 分鐘。
+ 1 小時
+ 1 天
+ 1 週
+ 1 個月
+ 1 年

## 輸入資料集中的未來值
<a name="canvas-time-series-future"></a>

Canvas 會自動偵測資料集中可能包含未來值的資料欄。如果存在，這些值可以增強預測的準確性。Canvas 用 `Future values` 標籤來標籤這些特定的資料欄。Canvas 會推論這些欄中的資料與您嘗試預測的目標欄之間的關係，並利用該關係來產生更準確的預測。

例如，您可以預測雜貨店出售的冰淇淋數量。要進行預測，您必須有一個時間戳記欄，以及表示雜貨店售出了多少冰淇淋的資料欄。為了獲得更準確的預測，您的資料集還可以包括價格、環境溫度、冰淇淋的口味或冰淇淋的唯一識別碼。

當天氣變熱時，冰淇淋銷量可能會增加。冰淇淋價格下降可能會銷售的單位提高。有一個包含環境溫度資料的欄和一個包含定價料欄，可以提高預測雜貨店銷售的冰淇淋單位數量的能力。

雖然提供未來值是選擇性的，但它可以幫助您直接在 Canvas 應用程式中執行模擬分析，向您展示未來值的變化如何改變您的預測。

## 處理缺少值
<a name="canvas-time-series-missing"></a>

您可能由於不同的原因而遺失資料。遺失資料的原因可能會讓 Canvas 知道如何估算。例如，您的組織可能會使用在銷售發生時間加以追蹤的自動系統。如果您使用的是來自這種自動系統類型的資料集，表示目標欄中會有缺少值。

**重要**  
如果目標欄中有缺少值，建議您使用沒有這些值的資料集。SageMaker Canvas 使用目標欄來預測未來值。目標欄中的缺少值會大幅降低預測的準確性。

針對資料集中的缺少值，Canvas 會自動把 `0` 填入目標欄，並在其他數值資料欄填入資料欄的中間值數值，來自動為您輸入缺少的值。

不過，您可以為資料集中的目標欄和其他數值資料欄選取自己的填入邏輯。與其他數值資料欄相比，目標欄的填入準則和限制有所不同。目標欄位會填滿至歷史週期結束，而數值欄位會填入至歷史週期與未來週期一直到預測總時程結束。如果您的資料至少有一筆具有未來時間戳記和且該特定欄具有數值的記錄，則 Canvas 僅填入數字欄中的未來值。

您可以選擇下列其中一個填入邏輯選項，來輸入資料中的缺少值：
+ `zero` - 填入 `0`。
+ `NaN` - 填入 NaN，或不是數字。只有目標欄才支援此選項。
+ `mean` - 填入資料序列中的平均值。
+ `median` - 填入資料序列中的中間值。
+ `min` - 填入資料序列中的最小數值。
+ `max` - 填入充資料序列中的最大值。

選擇填入邏輯時，您應考慮模型將會如何解讀邏輯。例如，在零售案例中，記錄供應商品的 0 銷售量會不同於記錄無法供應之商品的 0 銷售量，因為後者並不一定表示客戶對該無法供應商品缺乏興趣。在此情況下，在資料集的目標欄填入 `0` 可能會導致模型在預測中偏差不足，並推論客戶對無法供應的項目缺乏興趣。相反地，填入 `NaN` 可能會導致模型忽略銷售商品中出售零商品的真實情況。

## 預測類型
<a name="canvas-time-series-types"></a>

您可以進行下列預測之一：
+ **單一項目**
+ **所有項目**

針對資料集中所有項目的預測，SageMaker Canvas 會傳回資料集中每個項目未來值的預測。

針對單一項目預測，您可以指定項目，SageMaker Canvas 會傳回未來值的預測。預測包括一個折線圖，繪製了一定時間內的預測值。

**Topics**
+ [輸入資料集中的未來值](#canvas-time-series-future)
+ [處理缺少值](#canvas-time-series-missing)
+ [預測類型](#canvas-time-series-types)
+ [用於預測洞見的其他選項](canvas-additional-insights.md)

# 用於預測洞見的其他選項
<a name="canvas-additional-insights"></a>

在 Amazon SageMaker Canvas 中您可以使用下列方法，從預測中取得更多深入分析：
+ 群組欄
+ 假日排程
+ 模擬情況

您可以將資料集中的資料欄指定為 **Group column** (群組欄)。Amazon SageMaker Canvas 會按照欄中的每個值來分組預測。例如，您可以將預測根據包含價格資料或項目識別符的欄位進行分組。依欄位將預測分組，可讓您進行更具體的預測。例如，如果您將預測根據包含項目識別符的欄位進行分組，則可以查看每個項目的預測。

項目的整體銷售可能會受到假日存在的影響。例如，在美國，十一月和十二月售出的商品數量可能與一月售出的商品數量有很大的不同。如果您使用十一月和十二月的資料來預測一月份的銷售額，結果可能不正確。使用假日排程可必避免您獲得不正確的結果。您可以使用 251 個國家/地區的假日排程。

針對資料集中單一項目的預測，您可以使用模擬情況。模擬情況可讓您變更資料中的值並變更預測。例如您可以使用模擬情況來回答下列問題：“如果我降低價格將會如何？ 將如何影響出售的物品數量？”

# 在 Amazon SageMaker Canvas 中新增模型版本
<a name="canvas-update-model"></a>

在 Amazon SageMaker Canvas 中，您可以透過新增*版本*來更新已建立的模型。您建立的每個模型都有一個版本編號。第一個模型是版本 1 或 `V1`。當您更新資料或使用[進階轉換](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-prepare-data.html)時，您可以使用模型版本查看預測準確度的變化。

檢視您的模型時，SageMaker Canvas 會為您顯示模型歷程記錄，以便您可以比較已建置的所有模型版本。您也可以刪除對您不再有用的版本。透過建立多個模型版本並評估其準確性，您可以迭代地改善模型效能。

**注意**  
文字預測和影像預測模型僅支援一個模型版本。

若要新增模型版本，您可以複製現有版本或建立新版本。

複製目前模型組態的現有版本副本，包括模型配方和輸入資料集。或者，如果您想要設定新的模型配方或選擇不同的資料集，則可以建立新的版本。

如果您建立新的版本並選取不同的資料集，則必須選擇與第 1 版資料集具有相同目標欄和結構描述的資料集。

您必須先成功建置至少一個模型版本，然後才能新增版本。然後，您可以[在 SageMaker 模型註冊庫中註冊模型版本](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-register-model.html)。將註冊庫用於追蹤模型版本，以及用於與生產模型核准上的 Studio Classic 使用者協作。

如果您為第一個模型版本進行了快速建置，則可以在新增版本時選擇執行標準建置。標準建置通常具有更高的準確性。因此，如果您對快速建置組態有信心，您可以執行標準建置來建立模型的最終版本。若要進一步了解快速建置與標準建置之間的差異，請參閱[自訂模型的運作方式](canvas-build-model.md)。

下列程序說明如何新增模型版本；程序會有所不同，取決於您要新增的是相同建置類型還是不同建置類型的版本 (快速與標準)。使用**新增模型版本**程序，以新增相同建置類型的版本。若要在執行快速建置之後新增標準建置模型版本，請遵循**執行標準建置**程序。

**新增模型版本**

1. 開啟您的 SageMaker Canvas 應用程式。如需詳細資訊，請參閱[Amazon Sagemaker Canvas 使用入門](canvas-getting-started.md)。

1. 在左側導覽窗格中選擇 **My Models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。若要尋找您的模型，您可以選擇**依問題類型進行篩選**。

1. 開啟您的模型後，請選擇頂端面板中的**新增版本**按鈕。

1. 從下拉式功能表中，選擇下列其中一個選項：

   1. **從頭開始新增版本** - 當您選取此選項時，**建置**標籤即會開啟，其中包含新模型版本的草稿。您可以選取不同的資料集 (只要結構描述符合第一個模型版本的資料集結構描述)，並設定新的模型配方。如需建置模型的詳細資訊，請參閱[建立模型](canvas-build-model-how-to.md)。

   1. **複製現有版本與組態** - 有一個對話方塊會提示您選取要複製的版本。選取所需版本後，請選擇**複製**。**建置**索引標籤隨即開啟，其中包含新模型版本的草稿。任何模型配方組態都會從複製的版本複製。如需建置模型的詳細資訊，請參閱[建立模型](canvas-build-model-how-to.md)。

**執行標準建置**

1. 開啟您的 SageMaker Canvas 應用程式。如需詳細資訊，請參閱[Amazon Sagemaker Canvas 使用入門](canvas-getting-started.md)。

1. 在左側導覽窗格中選擇 **My Models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。您可以選擇**依問題類型進行篩選**，更輕鬆地找到您的模型。

1. 開啟您的模型後，選擇**分析**索引標籤。

1. 選擇**標準建置**。  
![\[Canvas 模型的分析索引標籤，其中顯示標準建置按鈕。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-add-version-quick-to-standard.png)

   在開啟至**建置**索引標籤的模型草稿頁面上，您可以修改模型組態並啟動建置。如需建置模型的詳細資訊，請參閱[建立模型](canvas-build-model-how-to.md)。

您現在應該正在進行新的模型版本建置。如需建立模型的更多相關資訊，請參閱[自訂模型的運作方式](canvas-build-model.md)。

建置模型版本後，您可以隨時返回模型詳細資訊頁面，以檢視所有版本或新增更多版本。下圖顯示模型的**版本**頁面。

![\[Canvas 中模型的模型版本頁面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/model-versions.png)


在 **Versions** (版本) 頁面上，您可以檢視每個模型版本的下列資訊：
+ **Status** (狀態) - 此欄位告訴您模型目前是正在建置 (`In building`)、已完成建置 (`Ready`)、無法建置 (`Failed`)，還是仍在編輯 (`In draft`)。
+ **Model score** (模型分數)、**F1**、**Precision** (精確度)、**Recall** (重新呼叫) 和 **AUC** - 如果您開啟此頁面上的 **Show advanced metrics** (顯示進階指標) 切換開關，就可以看到這些模型指標。這些指標表示模型的準確性和效能。如需更多資訊，請參閱[評估您的模型](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-evaluate-model.html)。
+ **共用** - 此欄位指出您是否已與 SageMaker Studio Classic 使用者共用模型版本。
+ **模型註冊庫** - 此欄位指出您是否已將版本註冊至模型註冊庫。如需詳細資訊，請參閱[在 SageMaker AI 模型註冊庫中註冊模型版本。](canvas-register-model.md)。

# MLOps
<a name="canvas-mlops"></a>

在 SageMaker Canvas 中建立您有信心的模型之後，您可能會想要將模型與您的組織中的機器學習作業 (MLOps) 程序整合。MLOps 包含常見任務，例如部署模型以供生產環境使用，或設定持續整合與持續部署 (CI/CD) 管道。

下列主題描述如何使用 Canvas 中的功能，在生產環境中使用 Canvas 建置的模型。

**Topics**
+ [在 SageMaker AI 模型註冊庫中註冊模型版本。](canvas-register-model.md)
+ [將模型部署到端點](canvas-deploy-model.md)
+ [檢視您的部署](canvas-deploy-model-view.md)
+ [更新部署組態](canvas-deploy-model-update.md)
+ [測試您的部署](canvas-deploy-model-test.md)
+ [調用您的端點](canvas-deploy-model-invoke.md)
+ [刪除模型部署](canvas-deploy-model-delete.md)

# 在 SageMaker AI 模型註冊庫中註冊模型版本。
<a name="canvas-register-model"></a>

您可以使用 SageMaker Canvas 建立模型的多個迭代或版本，以隨著時間改進模型。如果您獲得更好的訓練資料，或者想要嘗試提高模型的準確度，則可能需要建立新版本的模型。如需有關將版本新增至模型的更多相關資訊，請參閱[更新模型](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-update-model.html)。

在您[建置好有信心的模型](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-build-model.html)之後，您可能會想要評估其效能，並先由您的組織中的資料科學家或 MLOps 工程師檢閱，然後再將其用於生產環境。若要執行此操作，您可以將模型版本註冊到 [SageMaker 模型註冊庫](https://docs.aws.amazon.com/sagemaker/latest/dg/model-registry.html)。SageMaker 模型註冊庫是資料科學家或工程師可用來編目機器學習 (ML) 模型的儲存庫，以及管理模型版本及其相關中繼資料，例如訓練指標。他們也可以管理和記錄模型的核准狀態。

在您將模型版本註冊到 SageMaker 模型註冊庫之後，資料科學家或您的 MLOps 團隊可以透過 [SageMaker Studio Classic](https://docs.aws.amazon.com/sagemaker/latest/dg/studio.html) 存取 SageMaker 模型註冊庫；這是一個用於處理機器學習模型的 Web 型整合式開發環境 (IDE)。在 Studio Classic 的 SageMaker 模型註冊庫介面中，資料科學家或 MLOps 團隊可以評估您的模型並更新其核准狀態。如果模型無法執行其需求，資料科學家或 MLOps 團隊可以將狀態更新為 `Rejected`。如果模型可以執行其需求，資料科學家或 MLOps 團隊可以將狀態更新為 `Approved`。然後，他們可以將[您的模型部署到端點](https://docs.aws.amazon.com/sagemaker/latest/dg/deploy-model.html#deploy-model-prereqs)，或使用 CI/CD 管道[自動化模型部署](https://aws.amazon.com/blogs/machine-learning/building-automating-managing-and-scaling-ml-workflows-using-amazon-sagemaker-pipelines/)。您可以使用 SageMaker AI 模型註冊庫功能，將 Canvas 中建置的模型與您組織中的 MLOps 程序無縫整合。

下圖摘要說明將 Canvas 中建置的模型版本註冊至 SageMaker 模型註冊庫以整合至 MLOps 工作流程的範例。

![\[註冊 Canvas 中建置的模型版本以整合至 MLOps 工作流程的步驟。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-model-registration-diagram.jpg)


您可以將表格式、影像和文字模型版本註冊到 SageMaker 模型註冊庫。這包括時間序列預測模型和 JumpStart 型[微調基礎模型](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-fm-chat-fine-tune.html)。

**注意**  
目前，您無法將 Canvas 中建置的 Amazon Bedrock 型微調基礎模型註冊到 SageMaker 模型註冊庫。

以下各節展示如何從 Canvas 將模型版本註冊至 SageMaker 模型註冊庫。

## 許可管理
<a name="canvas-register-model-prereqs"></a>

根據預設，您具有將模型版本註冊到 SageMaker 模型註冊庫的許可。SageMaker AI 透過連接至 AWS IAM 執行角的 [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html) 政策，為所有新的與現有 Canvas 使用者設定檔授與託管 Canvas 應用程式的 SageMaker AI 網域許可。

如果 Canvas 管理員正在設定新網域或使用者設定檔，當他們設定網域並遵循[入門指南](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html#canvas-prerequisites)中的先決條件指示時，SageMaker AI 會透過預設為啟用的 **ML Ops 許可組態**選項開啟模型註冊許可。

Canvas 管理員也可以在使用者設定檔等級上管理模型註冊許可。例如，如果管理員想要將模型註冊許可授予某些使用者設定檔，但要移除其他使用者的許可，則他們可以編輯特定使用者的許可。以下程序示範如何關閉特定使用者設定檔的模型註冊許可：

1. 開啟位在 [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) 的 SageMaker AI 主控台。

1. 在左側導覽窗格中，選擇**管理員組態**。

1. 在**管理員組態**下，選擇**網域**。

1. 從網域清單中選取使用者設定檔的網域。

1. 在**網域詳細資訊**頁面上，選擇您要編輯其許可的**使用者設定檔**。

1. 在** User Details** (使用者詳細資訊) 頁面選擇 **Edit (編輯)**。

1. 在左側導覽窗格中，選擇** Canvas settings** (Canvas 設定)。

1. 在**機器學習 (ML) 作業許可組態**區段中，關閉**啟用模型註冊表註冊許可**切換開關。

1. 選擇**提交**，將變更儲存至您的網域設定。

使用者設定檔應該不再具有模型註冊許可。

## 將模型版本註冊到 SageMaker AI 模型註冊庫。
<a name="canvas-register-model-register"></a>

SageMaker 模型註冊庫會追蹤您建置的所有模型版本，以解決*模型群組*中的特定問題。當您建置 SageMaker Canvas 模型並將其註冊至 SageMaker 模型註冊庫時，該模型會以新的模型版本新增至模型群組。例如，如果您建置並註冊四個版本的模型，則在 SageMaker 模型註冊庫介面中工作的資料科學家或 MLOps 團隊可以檢視模型群組，並在單一位置檢閱模型的全部四個版本。

將 Canvas 模型註冊到 SageMaker 模型註冊庫時，會自動建立模型群組並以 Canvas 模型命名。或者，您可以將其重新命名為您自選的名稱，或使用 SageMaker 模型註冊庫中的現有模型群組名稱。如需建立模型群組的更多相關資訊，請參閱[建立模型群組](https://docs.aws.amazon.com/sagemaker/latest/dg/model-registry-model-group.html)。

**注意**  
目前您只能將 Canvas 中建置的模型註冊至相同帳戶中的 SageMaker 模型註冊庫。

若要從 Canvas 應用程式將模型版本註冊至 SageMaker 模型註冊庫，請使用下列程序：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中選擇 **My Models** (我的模型)。

1. 在 **My models** (我的模型) 頁面中，選擇您的模型。您可以 **Filter by problem type** (按問題類型進行篩選)，更輕鬆地找到您的模型。

1. 選擇您的模型後會開啟 **Versions** (版本) 頁面，列出模型的所有版本。您可以開啟 **Show advanced metrics** (顯示進階指標) 切換開關，以檢視進階指標，諸如 **Recall** (重新呼叫) 和 **Precision** (精確度)，以比較模型版本並決定要註冊的模型版本。

1. 從模型版本清單中，針對您要註冊的版本，選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。或者，您可以連按兩下您需要註冊的版本，然後在版本詳細資訊頁面上，選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 在下拉式清單中，選擇 **Add to Model Registry** (新增至模型註冊表)。**Add to Model Registry** (新增至模型註冊表) 對話方塊隨即開啟。

1. 在 **Add to Model Registry** (新增至模型註冊表) 對話方塊中，執行下列操作：

   1. (選用) 在 **SageMaker Studio Classic 模型群組**區段中，針對**模型群組名稱**欄位，輸入您要將版本註冊至其中的模型群組名稱。您可以針對 SageMaker AI 為您建立的新模型群組指定名稱，也可以指定現有模型群組。如果您未指定此欄位，Canvas 會將您的版本註冊到與模型相同名稱的預設模型群組中。

   1. 選擇**新增**。

您的模型版本現在應該已註冊到 SageMaker 模型註冊庫中的模型群組。將模型版本註冊到 SageMaker 模型註冊庫中的模型群組時，Canvas 模型的所有後續版本都會註冊到相同的模型群組 (如果您選擇註冊它們)。如果您將版本註冊到不同的模型群組，則需要前往 SageMaker 模型註冊庫並[刪除模型群組](https://docs.aws.amazon.com/sagemaker/latest/dg/model-registry-delete-model-group.html)。然後，您可以將模型版本重新註冊到新的模型群組。

若要檢視模型的狀態，您可以返回 Canvas 應用程式中模型的 **Versions** (版本) 頁面。此頁面顯示每個版本的 **Model Registry** (模型註冊表) 狀態。如果狀態為 `Registered`，則表示已成功註冊模型。

如果您想要檢視已註冊模型版本的詳細資訊，則針對** Model Registry** (模型註冊表) 狀態，您可以將游標暫留在 **Registered** (已註冊) 欄位上，以查看 **Model registry details** (模型登錄檔詳細資訊) 快顯方塊。這些詳細資訊包含更多資訊，例如：
+ **模型套件群組名稱**是您版本在 SageMaker 模型註冊庫中註冊的模型群組。
+ **Approval status** (核准狀態)，可以是 `Pending Approval`、`Approved` 或 `Rejected`。如果 Studio Classic 使用者在 SageMaker 模型註冊庫中核准或拒絕您的版本，則當您重新整理頁面時，模型版本頁面上會更新此狀態。

下列螢幕擷取畫面顯示 **Model registry details** (模型登錄檔詳細資訊) 方塊，以及此特定模型版本 `Approved`的 **Approval status** (核准狀態)。

![\[Canvas 應用程式中 SageMaker 模型註冊庫詳細資訊方塊的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/approved-mr.png)


# 將模型部署到端點
<a name="canvas-deploy-model"></a>

您可以在 Amazon SageMaker Canvas 中將模型部署到端點以進行預測。SageMaker AI 提供 ML 基礎設施，讓您可以在自己所選且具有運算執行個體的端點上託管模型。然後您可以*調用*端點 (發送預測請求) 並從模型中獲取即時預測。您可以透過此功能在生產環境中使用模型來回應傳入請求，並且可以將模型與現有應用程式和工作流程整合。

若要開始使用，您應該具有一個您想要部署的模型。您可以部署已建置的自訂模型版本、Amazon SageMaker JumpStart 基礎模型，以及微調的 JumpStart 基礎模型。如需在 Canvas 中建立模型的更多相關資訊，請參閱[自訂模型的運作方式](canvas-build-model.md)。如需 Canvas 中 JumpStart 基礎模型的詳細資訊，請參閱 [SageMaker Canvas 中的生成式 AI 基礎模型](canvas-fm-chat.md)。

檢閱下列**許可管理**章節，然後在**部署模型**區段中開始建立新的部署。

## 許可管理
<a name="canvas-deploy-model-prereqs"></a>

根據預設，您具有將模型部署到 SageMaker AI 託管端點的許可。SageMaker AI 透過連接至 AWS IAM 執行角的 [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html) 政策，為所有新的與現有 Canvas 使用者設定檔授與託管 Canvas 應用程式的 SageMaker AI 網域許可。

如果 Canvas 管理員正在設定新網域或使用者設定檔，當他們設定網域並遵循[設定 Amazon SageMaker Canvas 的先決條件](canvas-getting-started.md#canvas-prerequisites)中的先決條件指示時，SageMaker AI 會透過預設為啟用的**啟用 Canvas 模型直接部署**選項，開啟模型註冊許可。

Canvas 管理員也可以在使用者設定檔等級上管理模型部署許可。例如，如果管理員在設定網域時不想要將模型部署許可授予所有使用者設定檔，他們可以在建立網域之後將許可授予特定使用者。

以下程序展示如何修改特定使用者設定檔的模型部署許可：

1. 開啟位在 [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) 的 SageMaker AI 主控台。

1. 在左側導覽窗格中，選擇**管理員組態**。

1. 在 **Admin configurations** (管理員組態) 下，選擇 **Domains** (網域)。

1. 從網域清單中選取使用者設定檔的網域。

1. 在**網域詳細資訊**頁面上，選擇**使用者設定檔**索引標籤。

1. 選擇您的**使用者設定檔**。

1. 在使用者設定檔的頁面上，選取**應用程式組態**索引標籤。

1. 在 **Canvas** 區段中，選擇**編輯**。

1. 在 **ML Ops 組態**區段中，開啟**啟用 Canvas 模型直接部署**切換，以啟用部署許可。

1. 選擇**提交**，將變更儲存至您的網域設定。

使用者設定檔現在應該具有模型部署許可。

將許可授予網域或使用者設定檔後，請確定使用者登出其 Canvas 應用程式，然後重新登入以套用許可變更。

## 部署模型
<a name="canvas-deploy-model-deploy"></a>

若要開始部署模型，請在 Canvas 中建立新部署，並指定要與機器學習 (ML) 基礎設施一起部署的模型版本，例如您想要用來託管模型的運算執行個體的類型和數目。

Canvas 會根據您的模型類型建議預設類型和執行個體數目，或者您也可以在 [Amazon SageMaker 定價頁面](https://aws.amazon.com/sagemaker/pricing/)上進一步了解各種 SageMaker AI 執行個體類型。在端點處於作用中狀態時，系統會根據 SageMaker AI 執行個體定價向您收費。

部署 JumpStart 基礎模型時，您也可以選擇指定部署時間的長度。您可以無限期地將模型部署到端點 (表示端點在您刪除部署之前一直處於作用中狀態)。或者，如果您只需要短暫使用端點並希望降低成本，則可以將模型部署到端點一段指定的時間，之後 SageMaker AI 會為您關閉該端點。

**注意**  
如果部署模型一段指定的時間，請在端點持續時間內保持登入 Canvas 應用程式。如果您登出或刪除應用程式，則 Canvas 無法在指定的時間關閉端點。

將模型部署到 SageMaker AI 託管[即時推論端點](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html)後，您可以透過*調用*端點開始進行預測。

有幾種不同的方法可讓您從 Canvas 應用程式部署模型。您可以透過下列任一種方法來存取模型部署選項：
+ 在 Canvas 應用程式的**我的模型**頁面上，選擇您要部署的模型。然後，從模型的**版本**面中，選擇模型版本旁邊的**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選取**部署**。
+ 在模型版本的詳細資訊頁面上，請在**分析**索引標籤上選擇**部署**選項。
+ 在模型版本的詳細資訊頁面上，請在**預測**索引標籤上選擇頁面頂端的**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選取**部署**。
+ 在 Canvas 應用程式的 **ML Ops** 頁面上，選擇**部署**索引標籤，然後選擇**建立部署**。
+ 對於 JumpStart 基礎模型和微調基礎模型，請前往 Canvas 應用程式的**即用型模型**頁面。選擇**產生、擷取與摘要內容**。然後，尋找您要部署的 JumpStart 基礎模型或微調基礎模型。選擇模型，然後在模型的聊天頁面上，選擇**部署**按鈕。

這些方法都會開啟 **Deploy model** (部署模型) 側邊面板，您可以在其中指定模型的部署組態。若要從此面板部署模型，請執行下列動作：

1. (選用) 如果您要從 **ML Ops** 頁面建立部署，則可以選擇**選取模型和版本**。使用下拉式清單功能表選取您要部署的模型和模型版本。

1. 在 **Deployment Name** (部署名稱) 欄位中輸入名稱。

1. (僅適用於 JumpStart 基礎模型和微調基礎模型) 選擇**部署長度**。選取**無限期**以讓端點保持作用中狀態，直到您將其關閉為止，或選取**指定長度**，然後輸入您要讓端點保持作用中狀態的時段。

1. 針對**執行個體類型**，SageMaker AI 會偵測適合您模型的預設執行個體類型和數量。但是，您可以變更想要用於託管模型的執行個體類型。
**注意**  
如果 AWS 您的帳戶上所選執行個體類型的執行個體配額用盡，您可以請求增加配額。如需預設配額以及如何請求提高配額的詳細資訊，請參閱《AWS 一般參考指南》**中的 [Amazon SageMaker AI 端點和配額](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)。

1. 針對**Instance count** (執行個體計數)，您可以設定用於端點的作用中執行個體數目。SageMaker AI 會偵測適合您模型的預設數目，但您可以變更此數字。

1. 當您準備好部署模型時，請選擇 **Deploy** (部署)。

您的模型現在應該部署到端點。

# 檢視您的部署
<a name="canvas-deploy-model-view"></a>

您可能想要在 Amazon SageMaker Canvas 中檢查模型部署的狀態或詳細資訊。例如如果您的部署失敗，您可能想要檢查詳細資訊以進行故障診斷。

您可以從 Canvas 應用程式或從 Amazon SageMaker AI 主控台檢視 Canvas 模型部署。

若要從 Canvas 檢視部署詳細資訊，請選擇下列其中一個程序：

若要從 **ML Ops** 頁面檢視您的部署詳細資訊，請執行下列動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中，選擇 **ML Ops**。

1. 選擇 **Deployment** (部署) 索引標籤。

1. 從清單中選擇您的部署階段名稱。

若要從 model version (模型版本) 頁面檢視您的部署詳細資訊，請執行下列動作：

1. 在 SageMaker Canvas 應用程式中，前往模型版本詳細資訊頁面。

1. 選擇 **Deploy** (部署) 索引標籤。

1. 在列出與該模型版本相關的所有部署組態的 **Deployments** (部署) 區段中，尋找您的部署。

1. 選擇 **More options** (更多選項) 圖示 (![\[More options icon for the output CSV file.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選取 **View details** (檢視詳細資訊) 以開啟詳細資訊頁面。

部署的詳細資訊頁面隨即開啟，您可以檢視最近預測的時間、端點狀態和組態，以及目前部署至端點的模型版本等資訊。

您也可以從 [SageMaker AI 主控台](https://console.aws.amazon.com/sagemaker/)中的 **SageMaker AI 儀表板**檢視目前作用中的 Canvas 工作區執行個體和作用中的端點。您的 Canvas 端點會與您建立的任何其他 SageMaker AI 託管端點一起列出，您可以使用 Canvas 標籤搜尋端點來篩選這些端點。

下列螢幕擷取畫面顯示 SageMaker AI 儀表板。在 **Canvas** 區段中，您可以看到一個工作區執行個體正在服務中，而且四個端點處於作用中狀態。

![\[顯示作用中 Canvas 工作區執行個體和端點的 SageMaker AI 儀表板的螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-sagemaker-dashboard.png)


# 更新部署組態
<a name="canvas-deploy-model-update"></a>

您可以更新已部署到 Amazon SageMaker Canvas 中端點之模型的部署組態。例如，您可以將更新的模型版本部署到端點，也可以根據您的容量需求，更新端點後面的執行個體類型或執行個體數目。

有幾種不同的方法可讓您從 Canvas 應用程更新式部署。您可以使用下列任意方法：
+ 在 Canvas 應用程式的 **ML Ops** 頁面上，您可以選擇**部署**索引標籤，然後選取您要更新的部署。選擇 **Update configuration** (更新組態)。
+ 在模型版本的詳細資訊頁面上，您可以在 **Deploy** (部署) 索引標籤上檢視該版本的部署。在部署旁邊，選擇 **More options** (更多選項) 圖示 (![\[More options icon for the output CSV file.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然後選擇 **Update configuration** (更新組態)。

上述兩種方法都會開啟 **Update configuration** (更新組態) 側邊面板，您可以在其中變更部署組態。若要更新組態，請執行以下步驟：

1. 在 **Select version** (選取版本) 下拉式清單功能表，您可以選取要部署到端點的不同模型版本。
**注意**  
在更新部署組態時，您只能選擇要部署的不同模型版本。若要部署不同的模型，請建立新部署。

1. 您可以在 **Instance type** (執行個體類型) 選取不同的執行個體類型來託管您的模型。

1. 針對 **Instance count** (執行個體計數)，您可以變更用於端點的作用中執行個體數目。

1. 選擇**儲存**。

您的部署組態現在應該已更新。

# 測試您的部署
<a name="canvas-deploy-model-test"></a>

您可以透過 Amazon SageMaker Canvas 應用程式調用端點或提出單一預測請求來測試模型部署。在生產環境中以程式設計方式調用端點之前，您可以使用此功能來確認端點是否回應請求。

## 測試自訂模型部署
<a name="canvas-deploy-model-test-custom"></a>

您可以測試自訂模型部署，方法是透過 **ML Ops** 頁面存取該部署並進行單一調用，這會傳回預測以及預測正確的機率。

**注意**  
執行長度是在 Canvas 中調用和從端點獲取回應所花費的時間的估計值。如需詳細的延遲指標，請參閱 [SageMaker AI 端點調用指標](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html#cloudwatch-metrics-endpoint-invocation)。

若要透過 Canvas 應用程式測試端點，請執行以下動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中，選擇 **ML Ops**。

1. 選擇 **Deployment** (部署) 索引標籤。

1. 從部署清單中選擇具有您要調用之端點的部署。

1. 在部署詳細資料頁面上，選擇 **Test deployment** (測試部署) 索引標籤。

1. 在部署測試頁面上，您可以修改 **Value** (值) 欄位以指定新資料點。對於時間序列預測模型，您可以指定要對其進行預測的**項目 ID**。

1. 修改值後，選擇 **Update** (更新) 以取得預測結果。

預測會連同以及 **Invocation result** (調用結果) 欄位一同載入，這些欄位指出調用是否成功，以及要求處理請求所花費的時間。

下列螢幕擷取畫面顯示在 **Test deployment** (測試部署) 索引標籤的 Canvas 應用程式中執行的預測。

![\[Canvas 應用程式，其中顯示已部署模型的測試預測。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/canvas-test-deployments.png)


針對除了數值預測和時間序列預測以外的所有模型類型，預測會傳回下列欄位：
+  **predicted\$1label** - 預測的輸出
+  **機率** - 預測標籤正確的概率
+  **標籤** - 所有可能的標籤清單
+  **概率** - 與每個標籤對應的概率 (此清單的順序與標籤的順序符合)

針對數字預測模型，預測僅包含**分數**欄位，即模型的預測輸出，例如房屋的預測定價。

對於時間序列預測模型，預測是依分位數顯示預測的圖表。您可以選擇**結構描述檢視**來查看每個分位數的預測數值。

您可以透過部署測試頁面繼續進行單一預測，或者您可以檢視下方[調用您的端點](canvas-deploy-model-invoke.md)區段，了解如何以程式設計方式從應用程式調用端點。

## 測試 JumpStart 基礎模型部署
<a name="canvas-deploy-model-test-js"></a>

您可以透過 Canvas 應用程式與部署的 JumpStart 基礎模型聊天，以在透過程式碼調用該模型之前測試其功能。

若要與部署的 JumpStart 基礎模型聊天，請執行下列動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中，選擇 **ML Ops**。

1. 選擇 **Deployment** (部署) 索引標籤。

1. 從部署清單中，尋找您要調用的部署，然後選擇其**更多選項**圖示 (![\[More options icon for a model deployment.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 從內容功能表中，選擇**測試部署**。

1. 新的**產生、擷取和摘要說明內容**聊天會搭配 JumpStart 基礎模型開啟，而且您可以開始輸入提示。請注意，來自此聊天的提示會以請求的形式傳送至 SageMaker AI 託管端點。

# 調用您的端點
<a name="canvas-deploy-model-invoke"></a>

**注意**  
建議您先在 [Amazon SageMaker Canvas 中測試模型部署](canvas-deploy-model-test.md)，再以程式設計方式調用 SageMaker AI 端點。

您可以使用已部署到生產環境中 SageMaker AI 端點的 Amazon SageMaker Canvas 模型搭配您的應用程式。採用您調用任何其他 [SageMaker AI 即時端點](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html)的同一方式，以程式設計方式調用端點。以程式設計方式調用端點會傳回一個回應物件，其中包含[測試您的部署](canvas-deploy-model-test.md)所述的相同欄位。

如需如何以程式設計方式調用端點的詳細資訊，請參閱[調用模型以進行即時推論](realtime-endpoints-test-endpoints.md)。

以下 Python 範例向您展示如何根據模型類型調用端點。

## JumpStart 基礎模型
<a name="canvas-invoke-js-example"></a>

下列範例展示如何調用已部署至端點的 JumpStart 基礎模型。

```
import boto3
import pandas as pd

client = boto3.client("runtime.sagemaker")
body = pd.DataFrame(
    [['feature_column1', 'feature_column2'], 
    ['feature_column1', 'feature_column2']]
).to_csv(header=False, index=False).encode("utf-8")
    
response = client.invoke_endpoint(
    EndpointName="endpoint_name",
    ContentType="text/csv",
    Body=body,
    Accept="application/json"
)
```

## 數值和分類預測模型
<a name="canvas-invoke-tabular-example"></a>

下列範例展示如何調用數值或類別預測模型。

```
import boto3
import pandas as pd

client = boto3.client("runtime.sagemaker")
body = pd.DataFrame(['feature_column1', 'feature_column2'], ['feature_column1', 'feature_column2']).to_csv(header=False, index=False).encode("utf-8")
    
response = client.invoke_endpoint(
    EndpointName="endpoint_name",
    ContentType="text/csv",
    Body=body,
    Accept="application/json"
)
```

## 時間序列預測模型
<a name="canvas-invoke-forecast-example"></a>

下列範例展示如何調用時間序列預測模型。如需如何測試調用時間序列預測模型的完整範例，請參閱[使用 Amazon SageMaker Autopilot 進行時間序列預測](https://github.com/aws/amazon-sagemaker-examples/blob/eef13dae197a6e588a8bc111aba3244f99ee0fbb/autopilot/autopilot_time_series.ipynb)。

```
import boto3
import pandas as pd

csv_path = './real-time-payload.csv'
data = pd.read_csv(csv_path)

client = boto3.client("runtime.sagemaker")

body = data.to_csv(index=False).encode("utf-8")
    
response = client.invoke_endpoint(
    EndpointName="endpoint_name",
    ContentType="text/csv",
    Body=body,
    Accept="application/json"
)
```

## 影像預測模型
<a name="canvas-invoke-cv-example"></a>

下列範例展示如何調用影像預測模型。

```
import boto3
client = boto3.client("runtime.sagemaker")
with open("example_image.jpg", "rb") as file:
    body = file.read()
    response = client.invoke_endpoint(
        EndpointName="endpoint_name",
        ContentType="application/x-image",
        Body=body,
        Accept="application/json"
    )
```

## 文字預測模型
<a name="canvas-invoke-nlp-example"></a>

下列範例展示如何調用文字預測模型。

```
import boto3
import pandas as pd

client = boto3.client("runtime.sagemaker")
body = pd.DataFrame([["Example text 1"], ["Example text 2"]]).to_csv(header=False, index=False).encode("utf-8")
    
response = client.invoke_endpoint(
    EndpointName="endpoint_name",
    ContentType="text/csv",
    Body=body,
    Accept="application/json"
)
```

# 刪除模型部署
<a name="canvas-deploy-model-delete"></a>

您可以從 Amazon SageMaker Canvas 應用程式刪除模型部署。此動作也會從 SageMaker AI 主控台刪除端點，並關閉任何端點相關的資源。

**注意**  
或者，您可以透過 [SageMaker AI 主控台](https://console.aws.amazon.com/sagemaker/)或使用 SageMaker AI `DeleteEndpoint` API 刪除端點。如需詳細資訊，請參閱[刪除端點和資源](realtime-endpoints-delete-resources.md)。但是當您透過 SageMaker AI 主控台或 API 而非 Canvas 應用程式刪除端點時，Canvas 中的部署清單不會自動更新。您也必須從 Canvas 應用程式刪除部署，才能將其從清單中移除。

若要刪除 Canvas 中的部署，請執行下列動作：

1. 開啟 SageMaker Canvas 應用程式。

1. 在左側導覽窗格中，選擇 **ML Ops**。

1. 選擇 **Deployment** (部署) 索引標籤。

1. 從部署清單中選擇具有您要刪除目標的部署。

1. 在部署詳細資訊頁面頂端，選擇 **More options** (更多選項) 圖示 (![\[More options icon for the output CSV file.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 選擇 **Delete deployment** (刪除部署)。

1. 在 **Delete deployment** (刪除部署) 對話方塊中，選擇 **Delete** (刪除)。

您的部署和 SageMaker AI 託管端點現在應該同時從 Canvas 和 SageMaker AI 主控台中刪除。

# 如何管理自動化
<a name="canvas-manage-automations"></a>

您可以在 SageMaker Canvas 中建立自動化來更新資料集，或依排程從模型產生預測。例如，您可能每天都會收到新的運送資料。您可以設定資料集自動更新，並在資料集更新時執行自動批次預測。使用這些功能，您可以設定自動化工作流程，並減少手動更新資料集和進行預測所花費的時間。

**注意**  
您最多只能在 Canvas 應用程式中設定 20 個自動組態。只有在您登入 Canvas 應用程式時，自動化才會處於作用中狀態。如果您登出 Canvas 應用程式，則自動工作會暫停，直到您重新登入為止。

以下章節描述如何檢視、編輯和刪除現有自動化的組態。若要了解如何設定自動化，請參閱下列主題：
+ 若要設定自動資料集更新，請參閱[更新資料集](canvas-update-dataset.md)。
+ 若要設定自動批次預測，請參閱[SageMaker Canvas 中的批次預測](canvas-make-predictions-batch.md)。

**Topics**
+ [檢視自動化](canvas-manage-automations-view.md)
+ [編輯自動組態](canvas-manage-automations-edit.md)
+ [刪除自動組態](canvas-manage-automations-delete.md)

# 檢視自動化
<a name="canvas-manage-automations-view"></a>

您也可以前往 Canvas 的左側導覽窗格並選擇 **ML Ops**，來檢視所有自動更新任務。**ML 操作**頁面結合了自動資料集更新和自動批次預測的自動化。在**自動化**索引標籤上，您可以看到下列子索引標籤：
+ **All jobs** (所有工作) - 您可以查看 Canvas 已完成的**資料集更新**或**批次預測**工作的每個執行個體。針對每項工作，您都可以看到相關的 **Input dataset** (輸入資料集)、相關自動更新組態的 **Configuration name** (組態名稱)，以及顯示工作是否成功的 **Status** (狀態)等欄位。您可以依組態名稱篩選工作：
  + 針對資料集更新工作，您可以選擇資料集的最新版本或最近工作來預覽資料集。
  + 針對批次預測任務，您可以選擇**更多選項**圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) 來預覽或下載該任務的預測。您也可以選擇**檢視詳細資訊**，以查看預測任務的更多詳細資訊。如需批次預測任務詳細資訊的詳細資訊，請參閱[檢視您的批次預測任務](canvas-make-predictions-batch-auto-view.md)。
+ **Configuration** (組態) - 您可以查看所有已建立的 **Dataset update** (資料集更新) 和 **Batch prediction** (批次預測) 配置。針對每個配置，您都可以看到相關的 **Input dataset** (輸入資料集) 和工作的 **Frequency** (頻率) 等欄位。您也可以關閉或開啟 **Auto update** (自動更新) 切換開關，以暫停或繼續自動更新。如果您為特定組態選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，您可以選擇組態的 **View all jobs** (檢視所有工作)、**Update configuration** (更新組態) 或 **Delete configuration** (刪除組態)。

# 編輯自動組態
<a name="canvas-manage-automations-edit"></a>

設定組態後，您可能想要對其進行變更。針對自動資料集更新，您可以更新 Canvas 的 Amazon S3 位置，以匯入資料、更新頻率和開始時間。針對自動批次預測，您可以變更組態追蹤更新的資料集。您也可以關閉自動化操作以暫停更新，直到您選擇繼續更新為止。

以下章節為您展示如何更新每種類型的組態。

**注意**  
您無法變更自動批次預測的頻率，因為每次更新目標資料集時都會執行自動批次預測。

**Topics**
+ [編輯自動資料集更新組態](canvas-manage-automations-edit-dataset.md)
+ [編輯自動批次預測設定](canvas-manage-automations-edit-batch.md)

# 編輯自動資料集更新組態
<a name="canvas-manage-automations-edit-dataset"></a>

您可能想要變更資料集的自動更新組態，例如變更更新頻率。您也可能希望關閉自動更新組態，以暫停資料集的更新。

若要變更資料集的自動更新組態，請執行下列動作：

1. 在 Canvas 左側導覽窗格中，選擇 **ML Ops**。

1. 選擇**自動化**索引標籤。

1. 選擇 **Configuration** (組態) 索引標籤。

1. 針對您的自動更新組態，請選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 在下拉式清單功能表中選擇 **Update configuration** (更新組態)。您會被導向至資料集的 **Auto updates** (自動更新) 索引標籤。

1. 對組態進行變更。修改完成後，請選擇 **Save** (儲存)。

若要暫停資料集更新，請關閉自動組態。若要關閉自動更新的請執行以下動作：

1. 在 Canvas 左側導覽窗格中，選擇 **ML Ops**。

1. 選擇**自動化**索引標籤。

1. 選擇 **Configuration** (組態) 索引標籤。

1. 從清單中尋找您的組態，然後關閉 **Auto update** (自動更新) 切換開關。

資料集的自動更新現在已暫停。您可以隨時重新開啟此切換，以繼續更新排程。

# 編輯自動批次預測設定
<a name="canvas-manage-automations-edit-batch"></a>

當您編輯批次預測設定時，您可以變更目標資料集，但無法變更頻率 (因為每當資料集更新時，都會自動進行批次預測)。

若要變更自動批次更新組態，請執行下列動作：

1. 在 Canvas 左側導覽窗格中，選擇 **ML Ops**。

1. 選擇**自動化**索引標籤。

1. 選擇 **Configuration** (組態) 索引標籤。

1. 針對您的自動更新組態，請選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 在下拉式清單功能表中選擇 **Update configuration** (更新組態)。您會被導向至資料集的 **Auto updates** (自動更新) 索引標籤。

1. **Automate batch prediction** (自動批次預測) 對話方塊隨即彈出。您可以選取其他資料集，然後選擇 **Set up** (設定) 以儲存變更。

您的自動批次預測設定現已更新。

若要暫停自動批次預測，請關閉自動組態。若要關閉組態，請使用下列程序：

1. 在 Canvas 左側導覽窗格中，選擇 **ML Ops**。

1. 選擇**自動化**索引標籤。

1. 選擇 **Configuration** (組態) 索引標籤。

1. 從清單中尋找您的組態，然後關閉 **Auto update** (自動更新) 切換開關。

資料集的自動批次預測現已暫停。您可以隨時重新開啟此切換，以繼續更新排程。

# 刪除自動組態
<a name="canvas-manage-automations-delete"></a>

您可能想要刪除組態，以停止在 SageMaker Canvas 中的自動化工作流程。

若要刪除自動資料集更新或自動批次預測的設定，請執行下列動作：

1. 在 Canvas 左側導覽窗格中，選擇 **ML Ops**。

1. 選擇**自動化**索引標籤。

1. 選擇 **Configuration** (組態) 索引標籤。

1. 尋找您的自動更新組態並選擇 **More options** (更多選項) 圖示 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))。

1. 選擇 **Delete configuration (刪除組態)**。

1. 在彈出的對話方塊中，選擇 **Delete** (刪除)。

您的自動更新組態現在已刪除。