

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 資料匯入
<a name="canvas-importing-data"></a>

Amazon SageMaker Canvas 支援匯入表格式、影像和文件資料。您可以從本機電腦、Amazon S3 和 Amazon Redshift 等 Amazon 服務，以及外部資料來源匯入資料集。從 Amazon S3 匯入資料集時，您可以攜帶任何大小的資料集。使用您匯入的資料集來建置模型並預測其他資料集。

您可以建立自訂模型的每個使用案例都接受不同類型的輸入。例如，如果您要建置單一標籤影像分類模型，則應匯入影像資料。如需有關不同模型類型及其接受資料的更多相關資訊，請參閱[自訂模型的運作方式](canvas-build-model.md)。您可以針對下列資料類型，在 SageMaker Canvas 中匯入資料並建立自訂模型：
+ **表格式** (CSV、Parquet 或資料表)
  + 分類 — 使用分類資料建置 2 和 3 個以上類別預測的自訂分類預測模型。
  + 數字 — 使用數值資料建置自訂的數值預測模型。
  + 文字 — 使用文字資料建置自訂的多類別文字預測模型。
  + 時間序列 — 使用時間序列資料來建置自訂時間序列預測模型。
+ **映像** (JPG 或 PNG) — 使用映像資料建置自訂的單一標籤影像預測模型。
+ **文件** (PDF、JPG、PNG、TIFF) — 僅支援 SageMaker Canvas 即用型模型的文件資料。若要進一步了解可針對文件資料進行預測的即用型模型，請參閱[即用型模型](canvas-ready-to-use-models.md)。

您可以從下列資料來源將資料匯入 Canvas：
+ 本機電腦上的檔案
+ Amazon S3 儲存貯體
+ Amazon Redshift 佈建叢集 (非 Amazon Redshift Serverless)
+ AWS Glue Data Catalog 透過 Amazon Athena
+ Amazon Aurora
+ Amazon Relational Database Service (Amazon RDS)
+ Salesforce Data Cloud
+ Snowflake
+ Databricks、SQLServer、MariaDB 和其他透過 JDBC 連接器的 熱門資料庫
+ 超過 40 個外部軟體 SaaS 平台，例如 SAP OData

如需您可以從中匯入的資料來源完整清單，請參閱下表：


| 來源 | Type | 支援的資料類型 | 
| --- | --- | --- | 
| 本機檔案上傳 | 區域 | 表格式、影像、文件 | 
| Amazon Aurora | Amazon 內部 | 表格式 | 
| Amazon S3 儲存貯體 | Amazon 內部 | 表格式、影像、文件 | 
| Amazon RDS | Amazon 內部 | 表格式 | 
| Amazon Redshift 佈建叢集 (非 Redshift Serverless) | Amazon 內部 | 表格式 | 
| AWS Glue Data Catalog （透過 Amazon Athena) | Amazon 內部 | 表格式 | 
| [Databricks](https://www.databricks.com/) | 外部 | 表格式 | 
| Snowflake | 外部 | 表格式 | 
| [Salesforce Data Cloud](https://www.salesforce.com/products/genie/overview/) | 外部 | 表格式 | 
| sqlserver | 外部 | 表格式 | 
| MySQL | 外部 | 表格式 | 
| PostgreSQL | 外部 | 表格式 | 
| MariaDB | 外部 | 表格式 | 
| [Amplitude](https://docs.aws.amazon.com/appflow/latest/userguide/amplitude.html) | 外部 SaaS 平台 | 表格式 | 
| [CircleCI](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-circleci.html) | 外部 SaaS 平台 | 表格式 | 
| [DocuSign 監控](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-docusign-monitor.html) | 外部 SaaS 平台 | 表格式 | 
| [Domo](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-domo.html) | 外部 SaaS 平台 | 表格式 | 
| [Datadog](https://docs.aws.amazon.com/appflow/latest/userguide/datadog.html) | 外部 SaaS 平台 | 表格式 | 
| [Dynatrace](https://docs.aws.amazon.com/appflow/latest/userguide/dynatrace.html) | 外部 SaaS 平台 | 表格式 | 
| [Facebook 廣告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-facebook-ads.html) | 外部 SaaS 平台 | 表格式 | 
| [Facebook 粉絲專頁洞察](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-facebook-page-insights.html) | 外部 SaaS 平台 | 表格式 | 
| [Google Ads](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-google-ads.html) | 外部 SaaS 平台 | 表格式 | 
| [Google Analytics 4](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-google-analytics-4.html) | 外部 SaaS 平台 | 表格式 | 
| [Google 網站管理員](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-google-search-console.html) | 外部 SaaS 平台 | 表格式 | 
| [GitHub](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-github.html) | 外部 SaaS 平台 | 表格式 | 
| [GitLab](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-gitlab.html) | 外部 SaaS 平台 | 表格式 | 
| [Infor Nexus](https://docs.aws.amazon.com/appflow/latest/userguide/infor-nexus.html) | 外部 SaaS 平台 | 表格式 | 
| [Instagram 廣告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-instagram-ads.html) | 外部 SaaS 平台 | 表格式 | 
| [Jira Cloud](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-jira-cloud.html) | 外部 SaaS 平台 | 表格式 | 
| [LinkedIn 廣告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-linkedin-ads.html) | 外部 SaaS 平台 | 表格式 | 
| [LinkedIn 廣告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-linkedin-ads.html) | 外部 SaaS 平台 | 表格式 | 
| [Mailchimp](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-mailchimp.html) | 外部 SaaS 平台 | 表格式 | 
| [Marketo](https://docs.aws.amazon.com/appflow/latest/userguide/marketo.html) | 外部 SaaS 平台 | 表格式 | 
| [Microsoft Teams](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-microsoft-teams.html) | 外部 SaaS 平台 | 表格式 | 
| [Mixpanel](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-mixpanel.html) | 外部 SaaS 平台 | 表格式 | 
| [Okta](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-okta.html) | 外部 SaaS 平台 | 表格式 | 
| [Salesforce](https://docs.aws.amazon.com/appflow/latest/userguide/salesforce.html) | 外部 SaaS 平台 | 表格式 | 
| [Salesforce Marketing Cloud](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-salesforce-marketing-cloud.html) | 外部 SaaS 平台 | 表格式 | 
| [Salesforce Pardot](https://docs.aws.amazon.com/appflow/latest/userguide/pardot.html) | 外部 SaaS 平台 | 表格式 | 
| [SAP OData](https://docs.aws.amazon.com/appflow/latest/userguide/sapodata.html) | 外部 SaaS 平台 | 表格式 | 
| [SendGrid](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-sendgrid.html) | 外部 SaaS 平台 | 表格式 | 
| [ServiceNow](https://docs.aws.amazon.com/appflow/latest/userguide/servicenow.html) | 外部 SaaS 平台 | 表格式 | 
| [Singular](https://docs.aws.amazon.com/appflow/latest/userguide/singular.html) | 外部 SaaS 平台 | 表格式 | 
| [Slack](https://docs.aws.amazon.com/appflow/latest/userguide/slack.html) | 外部 SaaS 平台 | 表格式 | 
| [Stripe](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-stripe.html) | 外部 SaaS 平台 | 表格式 | 
| [Trend Micro](https://docs.aws.amazon.com/appflow/latest/userguide/trend-micro.html) | 外部 SaaS 平台 | 表格式 | 
| [Typeform](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-typeform.html) | 外部 SaaS 平台 | 表格式 | 
| [Veeva](https://docs.aws.amazon.com/appflow/latest/userguide/veeva.html) | 外部 SaaS 平台 | 表格式 | 
| [Zendesk](https://docs.aws.amazon.com/appflow/latest/userguide/zendesk.html) | 外部 SaaS 平台 | 表格式 | 
| [Zendesk Chat](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zendesk-chat.html) | 外部 SaaS 平台 | 表格式 | 
| [Zendesk Sell](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zendesk-sell.html) | 外部 SaaS 平台 | 表格式 | 
| [Zendesk Sunshine](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zendesk-sunshine.html) | 外部 SaaS 平台 | 表格式 | 
| [Zoom Meetings](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zoom.html) | 外部 SaaS 平台 | 表格式 | 

如需有關如何匯入資料和輸入資料需求的資訊，例如影像的檔案大小上限等的指示，請參閱[建立資料集](canvas-import-dataset.md)。

Canvas 也在您的應用程式中提供多個範例資料集，協助您快速入門。若要進一步了解您可以試驗的 SageMaker AI 提供的範例資料集，請參閱[使用範例資料集](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-sample-datasets.html)。

將資料集匯入 Canvas 之後，您可以隨時更新資料集。您可以進行手動更新，也可以設定自動更新資料集的排程。如需詳細資訊，請參閱[更新資料集](canvas-update-dataset.md)。

如需各個資料集類型的更多資訊，請參閱下列章節：

**表格式**

若要從外部資料來源 (例如 Snowflake 資料庫或 SaaS 平台) 匯入資料，您必須在 Canvas 應用程式中驗證並連線至資料來源。如需詳細資訊，請參閱[連線至資料來源](canvas-connecting-external.md)。

如果您想要將大於 5 GB 的資料集從 Amazon S3 匯入至 Canvas，您可以使用 Amazon Athena 從 Amazon S3 查詢和取樣資料，以實現更快的取樣。

在 Canvas 中建立資料集之後，您可以使用 Data Wrangler 的資料準備功能來準備和轉換資料。您可以使用 Data Wrangler 來處理缺失值、轉換您的功能、將多個資料集聯結為單一資料集等。如需詳細資訊，請參閱[資料準備](canvas-data-prep.md)。

**提示**  
只要將資料排列到資料表中，就可以聯結來自各種來源的資料集，例如 Amazon Redshift、Amazon Athena 或 Snowflake。

**影像**

如需有關如何編輯影像資料集和執行指派或重新指派標籤、新增影像或刪除圖片等任務的資訊，請參閱[編輯影像資料集](canvas-edit-image.md)。