

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon EMR on EKS での Delta Lake の使用
<a name="tutorial-delta-lake"></a>

Delta Lake は、Lakehouse アーキテクチャを構築するためのオープンソースストレージフレームワークです。使用するためにセットアップする方法を以下に示しています。

**Amazon EMR on EKS アプリケーションで [Delta Lake](https://delta.io/) を使用するには**

1. アプリケーション設定でジョブ実行を開始して Spark ジョブを送信するときに、Delta Lake JAR ファイルを含めます。

   ```
   --job-driver '{"sparkSubmitJobDriver" : {
         "sparkSubmitParameters" : "--jars local:///usr/share/aws/delta/lib/delta-core.jar,local:///usr/share/aws/delta/lib/delta-storage.jar,local:///usr/share/aws/delta/lib/delta-storage-s3-dynamodb.jar"}}'
   ```
**注記**  
Amazon EMR リリース 7.0.0 以降では、Delta Lake 3.0 が使用され、`delta-core.jar` の名前が `delta-spark.jar` に変更されます。Amazon EMR リリース 7.0.0 以降を使用する場合は、次の例のように、正しいファイル名を使用してください。  

   ```
   --jars local:///usr/share/aws/delta/lib/delta-spark.jar
   ```

1. Delta Lake の追加設定を含め、 Glue データカタログ AWS をメタストアとして使用します。

   ```
   --configuration-overrides '{
           "applicationConfiguration": [
           {
             "classification" : "spark-defaults", 
             "properties" : {
               "spark.sql.extensions" : "io.delta.sql.DeltaSparkSessionExtension", 
               "spark.sql.catalog.spark_catalog":"org.apache.spark.sql.delta.catalog.DeltaCatalog",
   "spark.hadoop.hive.metastore.client.factory.class":"com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory" 
              }
           }]}'
   ```