

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon EMR を使用したデータ準備
<a name="studio-notebooks-emr-cluster"></a>

**重要**  
Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、SageMaker AI を操作するために使用できる 2 つの機械学習環境です。  
ドメインが 2023 年 11 月 30 日以降に作成されている場合には、Studio がデフォルトのエクスペリエンスになります。  
ドメインが 2023 年 11 月 30 日より前に作成されている場合には、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスである場合に Studio を使用するには、「[Amazon SageMaker Studio Classic からの移行](studio-updated-migrate.md)」を参照してください。  
Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行しても、利用できる機能に変わりはありません。Studio Classic は Amazon SageMaker Studio 内のアプリケーションとしても利用でき、従来の機械学習ワークフローの実行に役立ちます。

Amazon SageMaker Studio と Studio Classic には、[Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-what-is-emr.html) との統合が組み込まれています。データサイエンティストやデータエンジニアは、JupyterLab や Studio Classic のノートブック内で、既存の Amazon EMR クラスターを検出して接続し、[Apache Spark](https://aws.amazon.com/emr/features/spark)、[Apache Hive](https://aws.amazon.com/emr/features/hive)、[Presto](https://aws.amazon.com/emr/features/presto) を使用して、大規模なデータをインタラクティブに探索、可視化したり、機械学習向けに準備できます。ワンクリックで Spark UI にアクセスして、ノートブック以外を使用する必要なく、Spark ジョブのステータスとメトリクスをモニタリングできます。

管理者は、Amazon EMR クラスターを定義する[CloudFormation テンプレート](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html)を作成できます。その後、ユーザーが Studio や Studio Classic が起動できるように、このようなクラスターテンプレートを [AWS Service Catalog](https://docs.aws.amazon.com/servicecatalog/latest/userguide/end-user-console.html) で利用できるようにします。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMR クラスターをセルフプロビジョンできます。管理者はさらにテンプレートをパラメータ化して、クラスターの要素を事前定義された値の範囲内でユーザーが選択できるようにすることができます。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。

を使用すると CloudFormation、管理者は Amazon EMR クラスターの組織、セキュリティ、ネットワークのセットアップを制御できます。データサイエンティストやデータエンジニアは、ワークロードに応じてこのようなテンプレートをカスタマイズして、複雑な設定を必要とせずに Studio と Studio Classic から直接オンデマンドで Amazon EMR クラスターを作成できます。ユーザーは、使用後に Amazon EMR クラスターを終了できます。
+ **管理者の場合:**

  Studio または Studio Classic のクラスターと Amazon EMR クラスター間の通信が有効になっていることを確認します。手順については、「[Amazon EMR クラスターのネットワークアクセスを設定する](studio-notebooks-emr-networking.md)」を参照してください。この通信が有効になったら、以下を実行できます。
  + [Service Catalog で Amazon EMR CloudFormation テンプレートを設定する](studio-notebooks-set-up-emr-templates.md)
  + [Amazon EMR クラスターのリストを設定する](studio-notebooks-configure-discoverability-emr-cluster.md)
+ **データサイエンティストまたはデータエンジニアの場合**、以下を実行できます。
  + [Studio または Studio Classic から Amazon EMR クラスターを起動する](studio-notebooks-launch-emr-cluster-from-template.md)
  + [Studio または Studio Classic から Amazon EMR クラスターを一覧表示する](discover-emr-clusters.md)
  + [SageMaker Studio または Studio Classic から Amazon EMR クラスターに接続する](connect-emr-clusters.md)
  + [Studio または Studio Classic から Amazon EMR クラスターを終了する](terminate-emr-clusters.md)
  + [Studio または Studio Classic から Spark UI にアクセスする](studio-notebooks-access-spark-ui.md)

**Topics**
+ [クイックスタート: Studio で Amazon EMR クラスターを起動するための SageMaker AI サンドボックスドメインを作成する](studio-notebooks-emr-cluster-quickstart.md)
+ [管理者ガイド](studio-emr-admin-guide.md)
+ [ユーザーガイド](studio-emr-user-guide.md)
+ [ブログとホワイトペーパー](studio-notebooks-emr-resources.md)
+ [トラブルシューティング](studio-notebooks-emr-troubleshooting.md)