As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Integre o Amazon EMR com AWS Lake Formation
AWS Lake Formation é um serviço gerenciado que ajuda você a descobrir, catalogar, limpar e proteger dados em um data lake do Amazon Simple Storage Service (S3). O Lake Formation fornece acesso refinado em nível de coluna a bancos de dados e tabelas no Glue Data Catalog. AWS Para ter mais informações, consulte O que é o AWS Lake Formation?
Com o Amazon EMR 6.7.0 e versões posteriores, você pode aplicar o controle de acesso baseado no Lake Formation a trabalhos do Spark, Hive e Presto enviados aos clusters do Amazon EMR. Para se integrar ao Lake Formation, é necessário criar um cluster do EMR com um perfil de runtime. O perfil de runtime é um perfil do AWS Identity and Access Management (IAM) que você associa a trabalhos ou consultas do Amazon EMR. Em seguida, o Amazon EMR usa essa função para acessar AWS recursos. Para obter mais informações, consulte Perfis de runtime para etapas ao Amazon EMR.
Como o Amazon EMR funciona com o Lake Formation
Depois de integrar o Amazon EMR com o Lake Formation, você pode executar consultas nos clusters do Amazon EMR com a Step
API ou com o AI Studio. SageMaker Em seguida, o Lake Formation fornecerá acesso aos dados por meio de credenciais temporárias para o Amazon EMR. Esse processo chamado de fornecimento de credenciais. Para ter mais informações, consulte O que é o AWS Lake Formation?
Veja a seguir uma visão geral de alto nível sobre como o Amazon EMR obtém acesso aos dados protegidos pelas políticas de segurança do Lake Formation.

-
O usuário envia uma consulta do Amazon EMR para obter dados no Lake Formation.
-
O Amazon EMR solicita credenciais temporárias do Lake Formation para dar acesso aos dados para o usuário.
-
O Lake Formation retorna credenciais temporárias.
-
O Amazon EMR envia a solicitação de consulta para recuperar dados do Amazon S3.
-
O Amazon EMR recebe os dados do Amazon S3, filtra-os e retorna os resultados com base nas permissões de usuário que o usuário definiu no Lake Formation.
Para obter mais informações sobre como adicionar usuários e grupos às políticas do Lake Formation, consulte Granting Data Catalog permissions.
Pré-requisitos
É necessário atender aos seguintes requisitos para integrar o Amazon EMR e o Lake Formation:
-
Ative a autorização do perfil de runtime no cluster do Amazon EMR.
-
Use o AWS Glue Data Catalog como seu armazenamento de metadados.
-
Defina e gerencie permissões no Lake Formation para acessar bancos de dados, tabelas e colunas no AWS Glue Data Catalog. Para ter mais informações, consulte O que é o AWS Lake Formation?