

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Verbessern der Spark Leistung mit Amazon S3
<a name="emr-spark-s3-performance"></a>

Amazon EMR bietet Features, mit denen die Leistung optimiert werden kann, wenn Spark für Abfragen und Lese- bzw. Schreiboperationen über Daten in Amazon S3 verwendet wird.

[S3 Select](https://aws.amazon.com/blogs/aws/s3-glacier-select/) kann in einigen Anwendungen die Abfrageleistung bei CSV- und JSON-Dateien verbessern, indem die Verarbeitung an Amazon S3 ausgelagert wird.

Der S3-optimized EMRFS-Committer ist eine Alternative zu der [OutputCommitter](https://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapreduce/OutputCommitter.html)Klasse, die die Funktion für mehrteilige Uploads von EMRFS verwendet, um die Leistung beim Schreiben von Parquet-Dateien auf Amazon S3 mithilfe von Spark,, und Datasets zu verbessern. DataFrames

**Topics**
+ [S3 Select mit Spark zur Verbesserung der Leistung bei Abfragen verwenden](emr-spark-s3select.md)
+ [EMR Spark MagicCommitProtocol](emr-spark-magic-commit-protocol.md)
+ [Verwenden Sie den EMRFS-Committer S3-optimized](emr-spark-s3-optimized-committer.md)
+ [Verwenden Sie das EMRFS-Commit-Protokoll S3-optimized](emr-spark-s3-optimized-commit-protocol.md)
+ [Amazon-S3-Anforderungen mit EMRFS wiederholen](emr-spark-emrfs-retry.md)