Trino で Amazon EMR クラスターを起動する - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Trino で Amazon EMR クラスターを起動する

Trino でクラスターを作成する際の正しい設定選択肢を以下に示します。

Hive コネクタを使用してデータをクエリ可能にする

クラスターからメタストアデータをクエリする目的で、Hive メタストアの Trino コネクタを設定できます。メタストアは、ファイルベースのコンテンツまたはデータをテーブルとして利用できる抽象化レイヤーであるため、クエリが容易です。Hive メタストアテーブルをクラスターで使用できるように、Amazon EMR でコネクタを設定する必要があります。次の手順では、これを行う方法を示します。

  1. コンソールで AWS Glue を選択し、Amazon S3 のソースデータに基づいてテーブルを作成します。 AWS Glue データカタログのテーブルは、データのメタデータ定義です。このコンテキストでは、ソースデータからテーブルを手動で作成し、必要に応じて列を作成するのが理にかなっています。Amazon S3 の半構造化データから AWS Glue でテーブルを作成する方法の詳細については、AWS 「 Glue ユーザーガイド」の「コンソールを使用したテーブルの作成」を参照してください。

  2. クラスター作成の一環として設定を設定します。[設定] タブを選択します。設定は、クラスターのオプション仕様です。設定を入力するときは、次のサンプルのような JSON を追加します。このサンプルは、テーブルメタデータの外部 Hive メタストアとして AWS Glue データカタログを使用するように Trino に指示します。

    { "classification": "trino-connector-hive", "properties": { "hive.metastore": "glue" } }

    または、クラスターの作成時にソフトウェア設定セクションで設定を適用することもできます。

    さらに、Apache Iceberg との接続など、他のコネクタタイプを設定することもできます。詳細については、Amazon EMR リリースガイドの「Trino で Iceberg クラスターを使用する」を参照してください。追加の設定はオプションです。

開始手順を続けるには、「」を参照してくださいAmazon EMR クラスターのプライマリノードに接続してクエリを実行する

Trino を使用してクラスターを作成する

Trino で使用するクラスターを作成する際の正しい設定選択肢を以下に示します。

重要

クラスターを作成する前に、Hive メタストアとして AWS Glue Data Catalog 設定を完了してください。開始するためにお勧めします。詳細については、「Hive コネクタを使用してデータをクエリ可能にする」を参照してください。

  1. AWS コンソールで、 サービスから Amazon EMR を選択します。Amazon EMR を選択すると、既存のクラスターがある場合、EC2 クラスター上の EMR が一覧表示されます。

  2. [クラスターを作成] を選択してください。ここから、クラスターを構築するプロセスを開始します。

  3. クラスターに名前を付け、Amazon EMR リリースを選択します。チュートリアルの最新のリリースを選択できます。

  4. Trino バンドルを選択します。このバンドルには Trino アプリケーションが事前に選択されています。バンドルは、クラスターの目的が事前にわかっている場合に便利です。それ以外の場合は、Trino のチェックボックスをオンにするだけで済みます。

  5. クラスター設定で、Uniform インスタンスグループを選択します。追加のインスタンスグループを削除してください。

  6. インスタンスタイプを選択します。通常、メモリが 16 GiB 以上のインスタンスタイプを選択することをお勧めします。また、クラスターのスケーリングとプロビジョニングでは、クラスターサイズを手動で設定を選択します。

  7. この時点で、Hive メタストア設定を AWS Glue を指すように設定します。詳細については、「」セクションを参照してくださいHive コネクタを使用してデータをクエリ可能にする。クラスターを構築する前に、これを完了してください。

  8. [クラスターを作成] を選択してください。完了までに数分かかる場合があります。

    ここでのステップでは、すべての設定ステップについて詳しく説明しているわけではありません。クラスターの設定の詳細については、「Amazon EMR クラスターの計画、設定、起動」を参照してください。

注記

同じクラスターで使用する Presto と Trino の両方を選択しないでください。これらを一緒に実行することはサポートされていません。Trino を実行する場合は、Spark など、クラスター上で他のアプリケーションを実行しないことをお勧めします。