Propagação de identidades confiáveis com o Amazon EMR Sem Servidor
Com as versões 7.8.0 e posteriores do Amazon EMR, é possível propagar identidades de usuário do Centro de Identidade do AWS IAM para workloads interativas com o EMR Sem Servidor por meio do Endpoint Apache Livy. As workloads interativas do Apache Livy propagarão ainda mais a identidade fornecida para serviços downstream, como Amazon S3, Lake Formation e Amazon Redshift, permitindo o acesso seguro aos dados por meio da identidade do usuário nesses serviços. As seções a seguir fornecem uma visão geral conceitual, os pré-requisitos e as etapas necessárias para iniciar e propagar a identidade para workloads interativas com o EMR Sem Servidor por meio do Endpoint Apache Livy.
Visão geral
O Centro de Identidade do IAM é a abordagem recomendada para a autenticação e a autorização da força de trabalho na AWS para organizações de qualquer tamanho e tipo. Com o Centro de Identidade, crie e gerencie identidades de usuários na AWS ou conecte sua fonte de identidade existente, incluindo Microsoft Active Directory, Okta, Ping Identity, JumpCloud, Google Workspace e Microsoft Entra ID (antigo Azure AD).
A propagação de identidade confiável é um recurso do Centro de Identidade do AWS IAM que os administradores de serviços da AWS conectados podem usar para conceder e auditar o acesso aos dados do serviço. O acesso a esses dados é baseado em atributos do usuário, como associações de grupo. A configuração da propagação de identidade confiável requer a colaboração entre os administradores de serviços da AWS conectados e os administradores do Centro de Identidade do IAM. Para obter mais informações, consulte Pré-requisitos e considerações, no Guia do usuário do Centro de Identidade do IAM.
Recursos e benefícios
A integração do Endpoint Apache Livy do EMR Sem Servidor com a Propagação de identidade confiável do Centro de Identidade do IAM oferece os seguintes benefícios:
A capacidade de aplicar autorização no nível da tabela com identidades do Centro de Identidade em tabelas do catálogo de dados do AWS Glue gerenciadas pelo AWS Lake Formation.
A capacidade de aplicar a autorização com identidades do Centro de Identidade em clusters do Amazon Redshift.
Permite o rastreamento ponta a ponta das ações do usuário para fins de auditoria.
A capacidade de aplicar a autorização no nível de prefixo do Amazon S3 com as identidades do Centro de Identidade em prefixos do S3 gerenciados pelo S3 Access Grants.
Como funciona
Exemplos de casos de uso
Preparação de dados e engenharia de atributos
Cientistas de dados de várias equipes de pesquisa colaboram em projetos complexos usando uma plataforma de dados unificada. Eles fazem log no SageMaker AI usando suas credenciais corporativas, obtendo acesso imediato a um vasto data lake compartilhado que abrange várias contas da AWS. À medida que iniciam a engenharia de atributos para novos modelos de machine learning, as sessões do Spark lançadas por meio do EMR Sem Servidor reforçam as políticas de segurança em nível de coluna e linha do Lake Formation com base em suas identidades propagadas. Os cientistas podem preparar dados de forma eficiente e criar recursos usando ferramentas familiares, enquanto as equipes de conformidade têm a garantia de que cada interação de dados será automaticamente rastreada e auditada. Esse ambiente seguro e colaborativo acelera os pipelines de pesquisa enquanto mantém os rígidos padrões de proteção de dados exigidos em setores regulamentados.