View a markdown version of this page

Propagação de identidades confiáveis - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Propagação de identidades confiáveis

Com as versões 7.8.0 e superiores do Amazon EMR, você pode propagar identidades de usuários do AWS IAM Identity Center para cargas de trabalho interativas com o EMR Serverless por meio do Apache Livy Endpoint. As workloads interativas do Apache Livy propagarão ainda mais a identidade fornecida para serviços downstream, como Amazon S3, Lake Formation e Amazon Redshift, permitindo o acesso seguro aos dados por meio da identidade do usuário nesses serviços. As seções a seguir fornecem uma visão geral conceitual, os pré-requisitos e as etapas necessárias para iniciar e propagar a identidade para workloads interativas com o EMR Sem Servidor por meio do Endpoint Apache Livy.

Visão geral do

O IAM Identity Center é a abordagem recomendada para autenticação e autorização da força de trabalho em AWS organizações de qualquer tamanho e tipo. Com o Identity Center, crie e gerencie identidades de usuários ou conecte sua fonte de identidade existente, incluindo Microsoft Active Directory, Okta, Ping Identity JumpCloud, Google Workspace e Microsoft Entra ID (antigo Azure AD). AWS

A propagação confiável de identidade é um recurso AWS do IAM Identity Center que os administradores de AWS serviços conectados podem usar para conceder e auditar o acesso aos dados do serviço. O acesso a esses dados é baseado em atributos do usuário, como associações de grupo. Configurar a propagação de identidade confiável requer colaboração entre os administradores dos AWS serviços conectados e os administradores do IAM Identity Center. Para obter mais informações, consulte Pré-requisitos e considerações, no Guia do usuário do Centro de Identidade do IAM.

Recursos e benefícios

A integração do Endpoint Apache Livy do EMR Sem Servidor com a Propagação de identidade confiável do Centro de Identidade do IAM oferece os seguintes benefícios:

  • A capacidade de impor a autorização em nível de tabela com identidades do Identity Center nas tabelas do catálogo de dados AWS Glue gerenciado pela Lake AWS Formation.

  • A capacidade de aplicar a autorização com identidades do Centro de Identidade em clusters do Amazon Redshift.

  • Permite o rastreamento ponta a ponta das ações do usuário para fins de auditoria.

  • A capacidade de aplicar a autorização no nível de prefixo do Amazon S3 com as identidades do Centro de Identidade em prefixos do S3 gerenciados pelo S3 Access Grants.

Como funciona

Fluxograma do EMR Sem Servidor.

Exemplos de casos de uso

Preparação de dados e engenharia de atributos

Cientistas de dados de várias equipes de pesquisa colaboram em projetos complexos usando uma plataforma de dados unificada. Eles se conectam à SageMaker IA usando suas credenciais corporativas, obtendo acesso imediato a um vasto lago de dados compartilhado que abrange várias AWS contas. À medida que iniciam a engenharia de atributos para novos modelos de machine learning, as sessões do Spark lançadas por meio do EMR Sem Servidor reforçam as políticas de segurança em nível de coluna e linha do Lake Formation com base em suas identidades propagadas. Os cientistas podem preparar dados de forma eficiente e criar recursos usando ferramentas familiares, enquanto as equipes de conformidade têm a garantia de que cada interação de dados será automaticamente rastreada e auditada. Esse ambiente seguro e colaborativo acelera os pipelines de pesquisa enquanto mantém os rígidos padrões de proteção de dados exigidos em setores regulamentados.