Melhorar a performance do Hive - Amazon EMR

Melhorar a performance do Hive

O Amazon EMR oferece atributos para ajudar na otimização da performance ao usar o Hive para consultar, ler e gravar dados salvos no Amazon S3.

O S3 Select pode melhorar a performance de consultas para arquivos CSV e JSON em algumas aplicações ao enviar o processamento para o Amazon S3.

O confirmador otimizado para EMRFS S3 é uma alternativa à classe OutputCommitter, que elimina as operações de listar e renomear para melhorar a performance ao serem gravados arquivos no Amazon S3 usando o EMRFS.