Amazon EMR での Trino の設定

トピック

Trino のコネクタの設定
モニタリング

Trino のコネクタの設定

Hive メタストアとして AWS Glue に接続する

Trino でクエリを実行するときは、 Glue Data Catalog AWS を Hive メタストアとして設定できることを理解することが重要です。Hive メタストアでクラスターを設定する手順などの詳細については、「Hive のメタストアとして AWS Glue データカタログを使用する」を参照してください。

EMR on EKS と Glue AWS の統合については、以下のベストプラクティス「EMR Containers integration with AWS Glue」を参照してください。

Amazon EMR で Trino を使用する場合の Iceberg テーブルへの接続

Iceberg は、分析テーブル用のオープンテーブル形式です。これは、Spark や Trino などのエンジンが SQL クエリを使用して同じテーブルからビッグデータをクエリするために作成されました。これには、データの読み取りと書き込みの分離などの機能が含まれているため、リーダーは部分的に更新されたデータのクエリを回避できます。また、スナップショットなどの状態機能もサポートしています。メタデータとマニフェストファイルを使用して抽象化レイヤーを提供します。これらはテーブルスキーマを記述し、データのフォーマットや整理方法の詳細を多く知ることなく、データのクエリを容易にします。接続することにより、テーブルからデータを読み取ることも、基になるファイルに新しいデータを書き込むこともできます。

Amazon EMR と Glue で Iceberg AWS テーブルを設定する方法を示すワークショップがあります。詳細については、「 Analytics Workshop - Set Up and Use Apache Iceberg Tables on Your Data Lake」を参照してください。

クライアントとの接続

使用可能な JDBC ドライバーを使用して Trino に接続できます。詳細については、「Trino Documentation」の「JDBC driver」を参照してください。

モニタリング

を使用して Amazon EMR クラスターをモニタリングできます AWS マネジメントコンソール。詳細については、「View and monitor an Amazon EMR cluster as it performs work」を参照してください。Amazon EMR は、モニタリングメトリクスも Amazon CloudWatchに送信します。Amazon EMR クラスターのモニタリングの詳細については、「Amazon CloudWatch events and metrics from Amazon EMR」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

プライマリノードに接続してクエリを実行する

Amazon EMR の Trino ベストプラクティス