

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Canvas のサンプルデータセット
<a name="canvas-sample-datasets"></a>

SageMaker Canvas には、個別のユースケースに対応するサンプルデータセットが用意されているため、コードを記述することなくモデルの構築、トレーニング、検証をすぐに開始できます。これらのデータセットに関連するユースケースでは SageMaker Canvas の機能を使用しており、これらのデータセットを活用してモデルの構築を開始できます。サンプルデータセットは、SageMaker Canvas アプリケーションの **[データセット]** ページにあります。

以下のデータセットは、SageMaker Canvas がデフォルトで提供するサンプルです。これらのデータセットは、住宅価格、債務不履行、糖尿病患者の再入院の予測、売上予測、製造部門の予知保全を効率化するための機械故障予測、輸送と物流のサプライチェーン予測の生成などのユースケースを対象としています。このデータセットは、SageMaker AI がリージョンのアカウント用に作成するデフォルトの Amazon S3 バケット内の `sample_dataset` フォルダに保存されます。
+ **canvas-sample-diabetic-readmission.csv:** このデータセットには、患者と治療の成果に関する 15 を超える機能を含む履歴データが含まれています。このデータセットを使用して、高リスクの糖尿病患者が退院後 30 日以内に再入院するか、30 日後に再入院するか、あるいはまったく入院しないかを予測できます。**redadmitted** 列をターゲット列として使用して、このデータセットでは 3\+ カテゴリ予測モデルタイプを使用します。このデータセットを使用したモデル構築方法の詳細については、「[SageMaker Canvas workshop ページ](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/5-hcls)」を参照してください。このデータセットは、「[UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets/diabetes+130-us+hospitals+for+years+1999-2008)」から取得されました。
+ **canvas-sample-housing.csv:** このデータセットには、特定の住宅価格に関連する特性に関するデータが含まれています。このデータセットを使用して住宅価格を予測できます。**median\_house\_value** 列をターゲット列として使用して、このデータセットでは数値予測モデルタイプを使用します。このデータセットを使用したモデル構築方法の詳細については、「[SageMaker Canvas workshop ページ](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/2-real-estate)」を参照してください。これは「[StatLib repository](https://www.dcc.fc.up.pt/~ltorgo/Regression/cal_housing.html)」から取得したカリフォルニア州の住宅データセットです。
+ **canvas-sample-loans.csv:** このデータセットには、現在のローン状況や最新の支払い情報など、2007 年から 2011 年に発行されたすべてのローンの完全なローンデータが含まれています。このデータセットを使用して、顧客がローンを返済するかどうかを予測できます。**loan\_status** 列をターゲット列として使用して、このデータセットでは 3\+ カテゴリ予測モデルタイプを使用します。このデータセットを使用したモデル構築方法の詳細については、「[SageMaker Canvas workshop ページ](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/4-finserv)」を参照してください。このデータは「[Kaggle](https://www.kaggle.com/datasets/wordsforthewise/lending-club)」から入手した LendingClub データを使用しています。
+ **canvas-sample-maintenance.csv:** このデータセットには、特定のメンテナンス障害タイプに関連する特性に関するデータが含まれています。このデータセットを使用して、将来どの障害が発生するかを予測できます。**Failure Type** 列をターゲット列として使用して、このデータセットでは 3\+ カテゴリ予測モデルタイプを使用します。このデータセットを使用したモデル構築方法の詳細については、「[SageMaker Canvas workshop ページ](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/6-manufacturing)」を参照してください。このデータセットは、「[UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets/AI4I+2020+Predictive+Maintenance+Dataset)」から取得されました。
+ **canvas-sample-shipping-logs.csv:** このデータセットには、配送予定時刻、配送優先順位、配送元など、配送されたすべての製品の完全な配送データが含まれています。このデータセットを使用して、荷物の到着予定日数を予測できます。**ActualShippingDays** 列をターゲット列として使用して、このデータセットでは数値予測モデルタイプを使用します。このデータを使用したモデル構築方法の詳細については、「[SageMaker Canvas workshop ページ](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/7-supply-chain)」を参照してください。これは Amazon が作成した合成データセットです。
+ **canvas-sample-sales-forecasting.csv:** このデータセットには、小売店の過去の時系列売上データが含まれています。このデータセットを使用して、特定の小売店の売上を予測できます。**sales** をターゲット列として使用して、このデータセットでは時系列予測モデルタイプを使用します。このデータセットを使用したモデル構築方法の詳細については、「[SageMaker Canvas workshop ページ](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/3-retail)」を参照してください。これは Amazon が作成した合成データセットです。