

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Melhorar a performance do Spark com Amazon S3
<a name="emr-spark-s3-performance"></a>

O Amazon EMR oferece atributos para ajudar na otimização da performance ao usar o Spark para consultar, ler e gravar dados salvos no Amazon S3.

O [S3 Select](https://aws.amazon.com/blogs/aws/s3-glacier-select/) pode melhorar a performance de consultas para arquivos CSV e JSON em algumas aplicações ao enviar o processamento para o Amazon S3.

O S3-optimized committer do EMRFS é uma alternativa à [OutputCommitter](https://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapreduce/OutputCommitter.html)classe, que usa o recurso de uploads de várias partes do EMRFS para melhorar o desempenho ao gravar arquivos Parquet no Amazon S3 usando Spark e conjuntos de dados. DataFrames

**Topics**
+ [Usar o S3 Select com Spark para melhorar a performance das consultas](emr-spark-s3select.md)
+ [EMR Spark MagicCommitProtocol](emr-spark-magic-commit-protocol.md)
+ [Use o committer do EMRFS S3-optimized](emr-spark-s3-optimized-committer.md)
+ [Use o protocolo de confirmação do EMRFS S3-optimized](emr-spark-s3-optimized-commit-protocol.md)
+ [Tentar novamente solicitações do Amazon S3 com EMRFS](emr-spark-emrfs-retry.md)