

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ユーザーガイド
<a name="studio-emr-user-guide"></a>

このセクションでは、データサイエンティストとデータエンジニアが Studio または Studio Classic から Amazon EMR クラスターを起動、検出、接続、または終了できる方法について説明します。

ユーザーがクラスターを一覧表示または起動できるようにする前に、管理者は Studio 環境で必要な設定を指定しておく必要があります。Amazon EMR クラスターのセルフプロビジョニングと一覧表示を許可するように、管理者が Studio 環境を設定する方法については、「[管理者ガイド](studio-emr-admin-guide.md)」を参照してください。

**Topics**
+ [Studio または Studio Classic から Amazon EMR クラスターに接続するためにサポートされているイメージとカーネル](#studio-notebooks-emr-cluster-connect-kernels)
+ [独自のイメージを使用する](#studio-notebooks-emr-byoi)
+ [Studio または Studio Classic から Amazon EMR クラスターを起動する](studio-notebooks-launch-emr-cluster-from-template.md)
+ [Studio または Studio Classic から Amazon EMR クラスターを一覧表示する](discover-emr-clusters.md)
+ [SageMaker Studio または Studio Classic から Amazon EMR クラスターに接続する](connect-emr-clusters.md)
+ [Studio または Studio Classic から Amazon EMR クラスターを終了する](terminate-emr-clusters.md)
+ [Studio または Studio Classic から Spark UI にアクセスする](studio-notebooks-access-spark-ui.md)

## Studio または Studio Classic から Amazon EMR クラスターに接続するためにサポートされているイメージとカーネル
<a name="studio-notebooks-emr-cluster-connect-kernels"></a>

以下のイメージとカーネルには、[Apache Livy](https://livy.apache.org/) を使用して [SparkMagic](https://github.com/jupyter-incubator/sparkmagic) ライブラリ経由でリモートの Spark (Amazon EMR) クラスターに接続できるようにする JupyterLab 拡張機能である [sagemaker-studio-analytics-extension](https://pypi.org/project/sagemaker-studio-analytics-extension/) を備えています。
+ **Studio を使用する場合:** SageMaker Distribution は、JupyterLab ノートブックインスタンスのデフォルトイメージとして使用されるデータサイエンス向けの Docker 環境です。[SageMaker AI Distribution](https://github.com/aws/sagemaker-distribution) のすべてのバージョンには、`sagemaker-studio-analytics-extension` がプリインストールされています。
+ **Studio Classic を使用する場合:** `sagemaker-studio-analytics-extension` には、以下のイメージがプリインストールされています。
  + DataScience – Python 3 カーネル
  + DataScience 2.0 – Python 3 カーネル
  + DataScience 3.0 – Python 3 カーネル
  + SparkAnalytics 1.0 – SparkMagic および PySpark カーネル
  + SparkAnalytics 2.0 – SparkMagic および PySpark カーネル
  + SparkMagic – SparkMagic および PySpark カーネル
  + PyTorch 1.8 – Python 3 カーネル
  + TensorFlow 2.6 – Python 3 カーネル
  + TensorFlow 2.11 – Python 3 カーネル

別の組み込みイメージまたは独自のイメージを使用して Amazon EMR クラスターに接続するには、「[独自のイメージを使用する](#studio-notebooks-emr-byoi)」の手順に従ってください。

## 独自のイメージを使用する
<a name="studio-notebooks-emr-byoi"></a>

Studio または Studio Classic で独自のイメージを使用し、ノートブックを Amazon EMR クラスターに接続できるようにするには、以下の [sagemaker-studio-analytics-extension](https://pypi.org/project/sagemaker-studio-analytics-extension/) 拡張機能をカーネルにインストールします。これは、[SparkMagic](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-magics.html) ライブラリを介したSageMaker Studio ノートブックまたは Studio Classic ノートブックの Spark (Amazon EMR) クラスターへの接続をサポートしています。

```
pip install sparkmagic
pip install sagemaker-studio-sparkmagic-lib
pip install sagemaker-studio-analytics-extension
```

[Kerberos](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-kerberos.html) 認証を使用して Amazon EMR に接続する場合は、kinit クライアントをインストールする必要があります。お使いの OS によって、kinit クライアントをインストールするコマンドは異なる場合があります。Ubuntu (Debian ベース) イメージを取り込むには、`apt-get install -y -qq krb5-user` コマンドを使用します。

SageMaker Studio または Studio Classic で独自のカスタムイメージを使用する方法の詳細については、「[Bring your own SageMaker image](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-byoi.html)」を参照してください。