

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon EMR クラスターの選択とデプロイ
<a name="select"></a>

*ノードタイプ*を特定して整理します。Amazon EMR クラスターを定義するときは、そのハードウェアを理解することが重要です。動作の仕組み どのように構成されていますか？ これらの質問に対する回答には 3 つの部分があります。
+ ノードのタイプ
+ 各ノードが保持する関数
+ 各ノードで最も効率的な EC2 インスタンスのタイプ

最初は、プライマリノードが一般的なリソースの管理を担当します。分散アプリケーションの主要コンポーネントを実行します。例えば、Hadoop Distributed File System (HDFS) NameNode サービスを実行し、クラスターで実行されるジョブを追跡し、システムのヘルスをモニタリングします。

さらに、Amazon EMR にはコアノードとタスクノードがあります。コアノードは、プライマリノードによって管理されます。コアノードはタスクノードを実行し、クラスターの HDFS にデータを保存する責任があります。タスクノードは、クラスターに送信されるタスクの管理を担当します。タスクノードはデータを保存しません。（タスクノードは必須ではありません）。

Amazon EMR クラスターを設定してデプロイする場合、重要な考慮事項は、クラスターノードを表す EC2 インスタンスの適切な選択です。クラスターに EC2 インスタンスを追加する方法は、インスタンスグループ設定を使用するか、クラスターのインスタンスフリート設定を使用するかによって異なります。サポートされているインスタンスタイプの詳細については、 [AWS ドキュメント](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-supported-instance-types.html)を参照してください。

ほとんどの [Amazon EMR クラスター](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-ha-considerations.html)には、次のガイドラインが適用されます。[クラスター設定のベストプラクティス](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-instances-guidelines.html)を確認することもできます。

## インスタンス選択ガイドライン
<a name="instance-selection-guidelines"></a>

一般的に、Amazon EMR の実装にどのインスタンスが優先されるかは、実行中のジョブによって異なります。以下の質問を検討してください。
+ ジョブのメモリが大量に消費されていますか？
+ ジョブの CPU は集中的ですか？
+ 大量のストレージが必要ですか？
+ ジョブには GPU 容量が必要ですか？

これらの質問は、必要なインスタンスのタイプと、必要な実際の特性を理解するのに役立ちます。同時に処理するジョブの数と、ジョブの処理速度を決定します。Amazon EMR の使用料は時間単位で課金されるため、これは重要です。クラスターをオンにすると、1 時間分の料金が発生します。

異なる AWS リージョンで実行されている各インスタンスのコストを確認できます。リージョン間で料金を比較するには、 [AWS 料金計算ツール](https://calculator.aws/#/)を使用し、場所に基づいて値を変更できます。

## EC2 インスタンスの選択
<a name="select-instances"></a>

前の質問に答えたら、それらの要件に基づいてインスタンスを選択する時間です。処理ジョブのニーズを理解したら、必要な特性に基づいてインスタンスタイプを決定します。
+ 汎用インスタンスが必要な場合は、**M6g**、**T4g**、または **M5** インスタンスを選択します。
+ コンピューティング最適化インスタンスが必要な場合は、**C6g** または **C5** インスタンスを選択します。
+ メモリ最適化インスタンスが必要な場合は、**R6g**、**X1**、**R5**、または **z1d** インスタンスを選択します。
+ ストレージ用に最適化する必要がある場合は、I**I3**インスタンスを選択します。これにより、I/O パフォーマンスが向上します。
+ GPU などの高速コンピューティングが必要な場合は、**P3**、**G4**、または **Inf1** インスタンスを選択します。これらのインスタンスタイプは、機械学習や流体力学などのプロセスに高いパフォーマンスを提供します。

インスタンスのタイプとその機能を理解するもう 1 つの方法は、各インスタンスタイプの[デフォルトメモリ](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hadoop-task-config.html#emr-hadoop-task-config-m6g)を分析することです。このメトリクスは、MapReduce ジョブのパフォーマンスを調整および改善するのに役立ちます。詳細については、[「Hadoop デーモンの設定](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hadoop-daemons.html)」を参照してください。

必要なインスタンスのタイプがわかったら、クラスター容量を計画できます。