

# Amazon Athena で Apache Spark を使用する
<a name="notebooks-spark"></a>

Amazon Athena では、リソースの計画、設定、管理を必要とせずに、Apache Spark を使用してインタラクティブに簡単にデータ分析と探索を実行できます。Athena で Apache Spark アプリケーションを実行するということは、処理用 Spark コードを送信し、追加の設定をしなくても結果を直接受け取ることを意味します。Amazon Athena の Apache Spark はサーバーレスであり、オンデマンドで自動的にスケーリングされるため、データ量や処理要件の変化に合わせて瞬時に処理できます。

リリースバージョン [PySpark エンジンバージョン 3](notebooks-spark-release-versions.md#notebooks-spark-release-versions-pyspark-3) では、Amazon Athena コンソールのシンプルなノートブックエクスペリエンスを使用すると、Python または Athena ノートブック API を使用して Apache Spark アプリケーションを開発できます。

リリースバージョン [Apache Spark バージョン 3.5](notebooks-spark-release-versions.md#notebooks-spark-release-versions-spark-35) では、Amazon SageMaker Unified Studio ノートブックまたは互換性のある Spark Connect クライアントから Spark コードを実行できます。

Amazon Athena には次の特徴があります。
+ **コンソールの使用** - Amazon Athena コンソールから Spark アプリケーションを送信します（Pyspark エンジンバージョン 3 のみ）。
+ **スクリプティング** - Python で Apache Spark アプリケーションを迅速かつインタラクティブにビルドおよびデバッグできます。
+ **動的スケーリング** - Amazon Athena は、ジョブの実行に必要なコンピューティングリソースとメモリリソースを自動的に決定し、それに応じてそれらのリソースを指定された最大値まで継続的にスケーリングします。この動的スケーリングは、速度に影響を与えずにコストを削減します。
+ **ノートブックエクスペリエンス** - Amazon SageMaker AI Unified Studio ノートブックを使用すると、使い慣れたインターフェイスを使用した計算の作成、編集、実行が可能です。Pyspark エンジンバージョン 3 では、Athena コンソール内ノートブックを使用できます。これは Jupyter Notebook と互換性があり、計算として順番に実行されるセルのリストが含まれています。セルの内容には、コード、テキスト、マークダウン、数学、プロット、リッチメディアなどを含めることができます。

追加情報については、「*AWS Big Data Blog*」の「[Run Spark SQL on Amazon Athena Spark](https://aws.amazon.com/blogs/big-data/run-spark-sql-on-amazon-athena-spark/)」と「[Explore your data lake using Amazon Athena for Apache Spark](https://aws.amazon.com/blogs/big-data/explore-your-data-lake-using-amazon-athena-for-apache-spark/)」を参照してください。

**Topics**
+ [リリースバージョン](notebooks-spark-release-versions.md)
+ [考慮事項と制限事項](notebooks-spark-considerations-and-limitations.md)
+ [はじめに](notebooks-spark-getting-started.md)
+ [ノートブックファイルを管理する](notebooks-spark-managing.md)
+ [ノートブックエディタ](notebooks-spark-editor.md)
+ [Hive 以外のテーブル形式](notebooks-spark-table-formats.md)
+ [Python ライブラリのサポート](notebooks-spark-python-library-support.md)
+ [カスタム設定を指定する](notebooks-spark-custom-jar-cfg.md)
+ [サポートされているデータおよびストレージ形式](notebooks-spark-data-and-storage-formats.md)
+ [Apache Spark をモニタリングする](notebooks-spark-metrics.md)
+ [原価配分](notebooks-spark-cost-attribution.md)
+ [ログ記録とモニタリング](notebooks-spark-logging-monitoring.md)
+ [Spark UI アクセス](notebooks-spark-ui-access.md)
+ [Spark Connect](notebooks-spark-connect.md)
+ [Spark セッション VPC エンドポイント](athena-spark-vpc-endpoint.md)
+ [リクエスタによるバケットの支払いを有効にする](notebooks-spark-requester-pays.md)
+ [Lake Formation の統合](notebooks-spark-lakeformation.md)
+ [Spark 暗号化を有効にする](notebooks-spark-encryption.md)
+ [カタログへのクロスアカウントアクセス](spark-notebooks-cross-account-glue.md)
+ [サービスクォータ](notebooks-spark-quotas.md)
+ [Athena Spark API](notebooks-spark-api-list.md)
+ [トラブルシューティング](notebooks-spark-troubleshooting.md)