翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
EMR Studio コンソールからのジョブの実行
EMR Serverless アプリケーションにジョブ実行を送信し、EMR Studio コンソールからジョブにアクセスできます。EMR Studio コンソールで EMR Serverless アプリケーションを作成または移動するには、「コンソールからの開始方法」の手順に従ってください。
ジョブを送信する
ジョブの送信ページで、次のように EMR Serverless アプリケーションにジョブを送信します。
- Spark
-
-
[名前] フィールドにジョブ実行の名前を入力します。
-
[ランタイムロール] フィールドに、EMR Serverless アプリケーションがジョブ実行のために引き受けることができる IAM ロールの名前を入力します。ランタイムロールの詳細については、「」を参照してくださいAmazon EMR Serverless のジョブランタイムロール。
-
[スクリプトの場所] フィールドに、実行するスクリプトまたは JAR の Amazon S3 の場所を入力します。Spark ジョブの場合、スクリプトは Python (
.py) ファイルまたは JAR (.jar) ファイルのいずれかになります。 -
スクリプトの場所が JAR ファイルの場合は、ジョブのエントリポイントであるクラス名を [メインクラス] フィールドに入力します。
-
(オプション) 残りのフィールドの値を入力します。
-
スクリプトの引数 — メイン JAR または Python スクリプトに渡す引数を入力します。コードはこれらのパラメータを読み取ります。配列の各引数は、カンマで区切ります。
-
Spark のプロパティ — Spark プロパティセクションを展開し、このフィールドに Spark 設定パラメータを入力します。
注記
Spark ドライバーとエグゼキュターのサイズを指定する場合は、メモリのオーバーヘッドを考慮してください。プロパティ
spark.driver.memoryOverheadとspark.executor.memoryOverheadにメモリオーバーヘッド値を指定します。メモリオーバーヘッドのデフォルト値はコンテナメモリの 10% で、最小 384 MB です。エグゼキュターメモリとメモリオーバーヘッドを合わせても、ワーカーメモリを超えることはできません。例えば、30 GB ワーカーのspark.executor.memoryの最大値は 27 GB である必要があります。 -
ジョブ設定 — このフィールドにジョブ設定を指定します。アプリケーションのデフォルトの設定を上書きするために、ジョブ設定を使用できます。
-
追加設定 — AWS Glue データカタログをメタストアとしてアクティブまたは非アクティブにして、アプリケーションログ設定を変更します。メタストア設定の詳細については、「」を参照してくださいEMR Serverless のメタストア設定。アプリケーションのログ記録オプションの詳細については、「」を参照してくださいログの保存。
-
タグ — アプリケーションにカスタムタグを割り当てます。
-
-
[Submit job] (ジョブの送信) を選択します。
-
- Hive
-
-
[名前] フィールドにジョブ実行の名前を入力します。
-
[ランタイムロール] フィールドに、EMR Serverless アプリケーションがジョブ実行のために引き受けることができる IAM ロールの名前を入力します。
-
[スクリプトの場所] フィールドに、実行するスクリプトまたは JAR の Amazon S3 の場所を入力します。Hive ジョブの場合、スクリプトは Hive (
.sql) ファイルである必要があります。 -
(オプション) 残りのフィールドの値を入力します。
-
初期化スクリプトの場所 – Hive スクリプトを実行する前にテーブルを初期化するスクリプトの場所を入力します。
-
Hive プロパティ – Hive プロパティセクションを展開し、このフィールドに Hive 設定パラメータを入力します。
-
ジョブ設定 – 任意のジョブ設定を指定します。アプリケーションのデフォルトの設定を上書きするために、ジョブ設定を使用できます。Hive ジョブの場合、
hive.exec.scratchdirおよびhive.metastore.warehouse.dirはhive-site設定に必要なプロパティです。{ "applicationConfiguration": [ { "classification": "hive-site", "configurations": [], "properties": { "hive.exec.scratchdir": "s3://DOC-EXAMPLE_BUCKET/hive/scratch", "hive.metastore.warehouse.dir": "s3://DOC-EXAMPLE_BUCKET/hive/warehouse" } } ], "monitoringConfiguration": {} } -
追加設定 — AWS Glue データカタログをメタストアとしてアクティブ化または非アクティブ化し、アプリケーションログ設定を変更します。メタストア設定の詳細については、「」を参照してくださいEMR Serverless のメタストア設定。アプリケーションのログ記録オプションの詳細については、「」を参照してくださいログの保存。
-
タグ — アプリケーションに任意のカスタムタグを割り当てます。
-
-
[Submit job] (ジョブの送信) を選択します。
-
アクセスジョブの実行
アプリケーションの詳細ページのジョブ実行タブから、ジョブ実行にアクセスし、ジョブ実行に対して次のアクションを実行します。
ジョブのキャンセル — RUNNING 状態のジョブ実行をキャンセルするには、このオプションを選択します。ジョブ実行の移行の詳細については、「」を参照してくださいジョブ実行状態。
ジョブのクローン — 以前のジョブ実行のクローンを作成して再送信するには、このオプションを選択します。