

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用適用於 Apache Spark 的 Amazon Redshift 整合啟動 Spark 應用程式
<a name="emr-spark-redshift-launch"></a>

若要使用與 EMR Serverless 6.9.0 的整合，請將所需的 Spark-Redshift 相依性與 Spark 任務一起傳遞。使用 `--jars` 來包含 Redshift 連接器相關的程式庫。若要存取 `--jars`選項支援的其他檔案位置，請參閱 Apache Spark 文件的[進階相依性管理](https://spark.apache.org/docs/latest/submitting-applications.html#advanced-dependency-management)一節。
+ `spark-redshift.jar`
+ `spark-avro.jar`
+ `RedshiftJDBC.jar`
+ `minimal-json.jar`

Amazon EMR 6.10.0 版及更高版本不需要 `minimal-json.jar` 相依性，並且依預設會向每個叢集自動安裝其他相依性。下列範例示範如何使用 Apache Spark 的 Amazon Redshift 整合啟動 Spark 應用程式。

------
#### [ Amazon EMR 6.10.0 \$1 ]

使用 EMR Serverless 6.10.0 版和更新版本的 Apache Spark 的 Amazon Redshift 整合，在 Amazon EMR Serverless 上啟動 Spark 任務。

```
spark-submit my_script.py
```

------
#### [ Amazon EMR 6.9.0 ]

若要使用 EMR Serverless 6.9.0 版上 Apache Spark 的 Amazon Redshift 整合在 Amazon EMR Serverless 上啟動 Spark 任務，請使用 `--jars`選項，如下列範例所示。請注意，與 `--jars` 選項一起列出的路徑是 JAR 檔案的預設路徑。

```
--jars 
    /usr/share/aws/redshift/jdbc/RedshiftJDBC.jar,
    /usr/share/aws/redshift/spark-redshift/lib/spark-redshift.jar,
    /usr/share/aws/redshift/spark-redshift/lib/spark-avro.jar,
    /usr/share/aws/redshift/spark-redshift/lib/minimal-json.jar
```

```
spark-submit \
  --jars /usr/share/aws/redshift/jdbc/RedshiftJDBC.jar,/usr/share/aws/redshift/spark-redshift/lib/spark-redshift.jar,/usr/share/aws/redshift/spark-redshift/lib/spark-avro.jar,/usr/share/aws/redshift/spark-redshift/lib/minimal-json.jar \
  my_script.py
```

------