Integrar o Amazon EMR com o Apache Ranger - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Integrar o Amazon EMR com o Apache Ranger

Desde a versão 5.32.0 do Amazon EMR, você pode iniciar um cluster que se integre nativamente ao Apache Ranger. O Apache Ranger é uma estrutura de código aberto para habilitar, monitorar e gerenciar uma segurança de dados abrangente em toda a plataforma Hadoop. Para obter mais informações, consulte Apache Ranger. Com a integração nativa, você pode trazer seu próprio Apache Ranger para aplicar um controle de acesso detalhado aos dados no Amazon EMR.

Esta seção fornece uma visão geral conceitual da integração do Amazon EMR com o Apache Ranger. Também inclui os pré-requisitos e as etapas necessárias para iniciar um cluster do Amazon EMR integrado ao Apache Ranger.

Integrar o Amazon EMR de maneira nativa com o Apache Ranger oferece os seguintes benefícios principais:

  • Controle de acesso refinado aos bancos de dados e tabelas do Hive Metastore, que permite definir políticas de filtragem de dados no nível de banco de dados, tabela e coluna para aplicações Apache Spark e Apache Hive. A filtragem em nível de linha e o mascaramento de dados são compatíveis com aplicações Hive.

  • A capacidade de usar suas políticas atuais do Hive diretamente com o Amazon EMR para aplicações Hive.

  • Controle de acesso aos dados do Amazon S3 no nível do prefixo e do objeto, o que permite definir políticas de filtragem de dados para acesso aos dados do S3 usando o sistema de arquivos do EMR.

  • A capacidade de usar o CloudWatch Logs para auditoria centralizada.

  • O Amazon EMR instala e gerencia os plug-ins do Apache Ranger por você.