

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# EMR Studio の機能、要件、制限
<a name="emr-studio-considerations"></a>

このトピックには、Amazon EMR Studio を使用する際に考慮すべき事項 (リージョンとツール、クラスターの要件、技術的な制限など) が含まれています。

## 考慮事項
<a name="emr-studio-considerations-general"></a>

EMR Studio を使用する場合は、次の点を考慮してください。
+ EMR Studio は、以下でご利用いただけます AWS リージョン。
  + 米国東部 (オハイオ) (us-east-2)
  + 米国東部 (バージニア北部) (us-east-1)
  + 米国西部 (北カリフォルニア) (us-west-1)
  + 米国西部 (オレゴン) (us-west-2)
  + アフリカ (ケープタウン) (af-south-1)
  + アジアパシフィック (香港) (ap-east-1)
  + アジアパシフィック (ジャカルタ) (ap-southeast-3)\*
  + アジアパシフィック (メルボルン) (ap-southeast-4)\*
  + アジアパシフィック (ムンバイ) (ap-south-1)
  + アジアパシフィック (大阪) (ap-northeast-3)\*
  + アジアパシフィック (ソウル) (ap-northeast-2)
  + アジアパシフィック (シンガポール) (ap-southeast-1)
  + アジアパシフィック (シドニー) (ap-southeast-2)
  + アジアパシフィック (東京) (ap-northeast-1)
  + カナダ (中部) (ca-central-1)
  + ヨーロッパ (フランクフルト) (eu-central-1)
  + 欧州 (アイルランド) (eu-west-1) 
  + ヨーロッパ (ロンドン) (eu-west-2)
  + 欧州 (ミラノ) (eu-south-1)
  + 欧州 (パリ) (eu-west-3)
  + 欧州 (スペイン) (eu-south-2)
  + 欧州 (ストックホルム) (eu-north-1)
  + 欧州 (チューリッヒ) (eu-central-2)\*
  + イスラエル (テルアビブ) (il-central-1)\*
  + 中東 (UAE) (me-central-1)\*
  + 南米 (サンパウロ) (sa-east-1)
  + AWS GovCloud (米国東部) (gov-us-east-1)
  + AWS GovCloud (米国西部) (gov-us-west-1)

  \* これらのリージョンではライブ版の Spark UI はサポートされていません。
+ ユーザーが Amazon EC2 で実行されている新しい EMR クラスターを Workspace 用にプロビジョニングできるようにするには、EMR Studio を一連のクラスターテンプレートに関連付けることができます。管理者は、Service Catalog でクラスターテンプレートを定義できます。また、Studio 内でユーザーまたはグループがクラスターテンプレートにアクセスできるのか、できないかを選択できます。
+ Amazon S3 に保存されているノートブックファイルへのアクセス許可を定義する場合、または からシークレットを読み取る場合は AWS Secrets Manager、Amazon EMR サービスロールを使用します。セッションポリシーは、これらのアクセス許可ではサポートされません。
+ 複数の EMR Studio を作成して、異なる VPC 内の EMR クラスターへのアクセスを制御できます。
+ を使用して AWS CLI 、Amazon EMR on EKS クラスターをセットアップします。その後、Studio インターフェイスを使用して、マネージドエンドポイントを使用して Workspace にクラスターをアタッチして、ノートブックジョブを実行できます。
+ Amazon EMR で信頼できる ID の伝達を使用する場合は、EMR Studio にも当てはまるその他の考慮事項があります。詳細については、「[Amazon EMR と Identity Center の統合に関する考慮事項と制限](emr-idc-considerations.md)」を参照してください。
+ EMR Studio では、次の Python マジックコマンドはサポートされていません。
  + `%alias`
  + `%alias_magic`
  + `%automagic`
  + `%macro`
  + `%%js`
  + `%%javascript`
  + `%configure` を使用した `proxy_user` の変更
  + `%env` または `%set_env` を使用した `KERNEL_USERNAME` の変更
+ Amazon EMR on EKS クラスターは、EMR Studio で SparkMagic コマンドをサポートしていません。
+ ノートブックのセルに複数行の Scala ステートメントを記述する場合は、最後の行以外のすべての行がピリオドで終わっていることを確認してください。次の例では、複数行の Scala ステートメントで正しい構文を使用しています。

  ```
  val df = spark.sql("SELECT * from table_name).
          filter("col1=='value'").
          limit(50)
  ```
+ Amazon EMR で使用するオフコンソールアプリケーションのセキュリティを強化するために、アプリケーションホスティングドメインはパブリックサフィックスリスト (PSL) に登録されます。これらのホスティングドメインの例には以下が含まれます: `emrstudio-prod.us-east-1.amazonaws.com`、`emrnotebooks-prod.us-east-1.amazonaws.com`、`emrappui-prod.us-east-1.amazonaws.com`セキュリティ強化のため、デフォルトのドメイン名に機密性の高い Cookie を設定する必要がある場合は、`__Host-` プレフィックスの付いた Cookie を使用することをお勧めします。これは、クロスサイトリクエストフォージェリ (CSRF) 攻撃からドメインを防ぐ際に役立ちます。詳細については、「*Mozilla Developer Network*」の「[https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Set-Cookie#cookie_prefixes](https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Set-Cookie#cookie_prefixes)」ページを参照してください。
+ Amazon EMR Studio WorkSpaces と永続 UI エンドポイントは e 転送時の暗号化に FIPS 140 検証済み暗号化モジュールを使用するため、規制対象のワークロードにサービスを簡単に導入できます。永続 UI エンドポイントの詳細については、「[View persistent application user interfaces in Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/app-history-spark-UI.html)」を参照してください。ノートブックに関するその他のコンテキストについては、[Amazon EMR Notebooks overview](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks.html)を参照してください。

## 既知の問題
<a name="emr-studio-known-issues"></a>
+ 信頼できる ID 伝達が有効になっている IAM Identity Center を使用する EMR Studio は、EMR クラスターのうち、信頼できる ID 伝達を使用するものにのみ関連付けることができます。
+ Studio を作成する前に、ブラウザで FoxyProxy や SwitchyOmega などのプロキシ管理ツールを無効にしてください。アクティブなプロキシを使用している場合、**[Create Studio]** (Studio の作成) を選択するとエラーが発生し、**[Network Failure]** (ネットワーク障害) エラーメッセージが表示されることがあります。
+ Amazon EMR on EKS クラスターで実行されるカーネルは、タイムアウトの問題により起動に失敗することがあります。カーネルの起動中にエラーまたは問題が発生した場合は、ノートブックファイルを閉じ、カーネルをシャットダウンしてから、ノートブックファイルを再度開きます。
+ **[Restart kernel]** (カーネルの再起動) オペレーションは、Amazon EMR on EKS クラスターを使用している場合、期待どおりに機能しません。**[Restart kernel]** (カーネルの再起動) を選択した後に、Workspace を更新して再起動を有効にします。
+ Workspace がクラスターにアタッチされていない場合、Studio ユーザーがノートブックファイルを開いてカーネルを選択しようとすると、エラーメッセージが表示されます。このエラーメッセージは、**[OK]**を選択して無視して構いません。ただし、ノートブックコードを実行するには、その前に Workspace をクラスターにアタッチし、カーネルを選択する必要があります。
+ クラスターセキュリティを設定するための[セキュリティ設定](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-security-configurations.html)を使用して Amazon EMR 6.2.0 を使用している場合は、Workspace インターフェイスがブランクになり、期待どおりに動作しません。クラスターの EMRFS のデータ暗号化または Amazon S3 認可を設定する場合は、サポートされている別のバージョンの Amazon EMR を使用することをお勧めします。EMR Studio は、Amazon EMR バージョン 5.32.0 (Amazon EMR 5.x シリーズ) および 6.2.0 (Amazon EMR 6.x シリーズ) 以降で動作します。
+ 「[Amazon EC2 ジョブで実行中の Amazon EMR をデバッグする](emr-studio-debug.md#emr-studio-debug-ec2)」を行うと、クラスター上の Spark UI へのリンクが機能しないか、表示されないことがあります。リンクを再生成するには、新しいノートブックセルを作成し、`%%info` コマンドを実行します。
+ Jupyter Enterprise Gateway は、Amazon EMR リリースバージョン 5.32.0、5.33.0、6.2.0、6.3.0 では、クラスターのプライマリノード上のアイドル状態のカーネルをクリーンアップしません。アイドル状態のカーネルはコンピューティングリソースを消費するため、長時間稼働クラスターが失敗する原因となる可能性があります。次のサンプルスクリプトを使用して、Jupyter Enterprise Gateway のアイドル状態のカーネルのクリーンアップを設定できます。「[SSH を使用して Amazon EMR クラスタープライマリノードに接続する](emr-connect-master-node-ssh.md)」やステップとしてのスクリプトの送信を行うことができます。詳細については、「[Amazon EMR クラスターでコマンドとスクリプトを実行する](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-commandrunner.html)」を参照してください。

  ```
  #!/bin/bash
  sudo tee -a /emr/notebook-env/conf/jupyter_enterprise_gateway_config.py << EOF
  c.MappingKernelManager.cull_connected = True
  c.MappingKernelManager.cull_idle_timeout = 10800
  c.MappingKernelManager.cull_interval = 300
  EOF
  sudo systemctl daemon-reload
  sudo systemctl restart jupyter_enterprise_gateway
  ```
+ Amazon EMR バージョン 5.32.0、5.33.0、6.2.0、または 6.3.0 で自動終了ポリシーを使用すると、Amazon EMR はクラスターをアイドルとしてマークし、アクティブな Python3 カーネルがあっても自動的にクラスターが終了されることがあります。これは、Python3 カーネルを実行しても Spark ジョブがクラスターで送信されないためです。Python3 カーネルで自動終了を使用するには、Amazon EMR バージョン 6.4.0 以降を使用することをお勧めします。自動終了の詳細については、「[Amazon EMR クラスタークリーンアップに自動終了ポリシーを使用する](emr-auto-termination-policy.md)」を参照してください。
+ `%%display` を使用して Spark DataFrame をテーブルで表示した場合、幅が非常に広いテーブルが切り捨てられることがあります。出力を右クリックして**[Create New View for Output]** (出力用の新しいビューを作成) を選択し、出力のスクロール可能なビューを取得できます。
+ PySpark、Spark、SparkR などの Spark ベースのカーネルを起動すると Spark セッションが開始され、ノートブックでセルを実行すると、そのセッションで Spark ジョブがキューに入れられます。実行中のセルを中断すると、Spark ジョブは引き続き実行されます。Spark ジョブを停止するには、クラスター上の Spark UI を使用する必要があります。Spark UI に接続する方法の手順については、「[EMR Studio でアプリケーションとジョブをデバッグする](emr-studio-debug.md)」を参照してください。
+ Amazon EMR Studio WorkSpaces を のルートユーザーとして使用すると、`403: Forbidden`エラー AWS アカウント が発生します。これは、Amazon EMR の Jupyter Enterprise Gateway 設定がルートユーザーへのアクセスを許可していないためです。日常的なタスクには、ルートユーザーを使用しないことをお勧めします。その他の認証オプションについては、「[Amazon EMR のAWS Identity and Access Management](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-access-iam.html)」を参照してください。

## 機能の制限
<a name="emr-studio-limitations"></a>

Amazon EMR Studio では、次の Amazon EMR 機能はサポートされていません。
+ Kerberos 認証を指定するセキュリティ構成を使用した EMR クラスターでのジョブのアタッチと実行
+ 複数のプライマリノードを持つクラスター
+ Amazon EMR 6.x リリースが 6.9.0 未満、5.x リリースが 5.36.1 未満の場合、 AWS Graviton2 に基づく Amazon EC2 インスタンスを使用するクラスター 

信頼できる ID 伝達を使用する Studio では、以下の機能はサポートされません。
+ テンプレートなしで EMR クラスターを作成。
+ EMR Serverless アプリケーションの使用。
+ Amazon EMR on EKS クラスターの起動。
+ ランタイムロールの使用。
+ SQL エクスプローラーまたはワークスペースコラボレーションの有効化。

## EMR Studio のサービスの制限
<a name="emr-studio-default-limits"></a>

次の表に、EMR Studio のサービスの制限を示します。


****  

| Item | 制限 | 
| --- | --- | 
| EMR Studio |  AWS アカウントあたり最大 100 | 
| サブネット | 各 EMR Studio に関連付けることができるのは最大 5 個 | 
| IAM Identity Center グループ | 各 EMR Studio に割り当てることができるのは最大 5 個 | 
| IAM Identity Center ユーザー | 各 EMR Studio に割り当てることができるのは最大 100 個 | 