Mejora del rendimiento de Spark con Amazon S3
Amazon EMR ofrece características para ayudar a optimizar el rendimiento cuando se utiliza Spark para consultar, leer y escribir datos guardados en Amazon S3.
S3 Select
El confirmador optimizado para S3 de EMRFS constituye una alternativa a la clase OutputCommitter