As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criando um catálogo de tabelas do Amazon S3 no AWS Glue Data Catalog
A funcionalidade Tabelas do Amazon S3 fornece armazenamento do S3 especificamente otimizado para workloads de analytics, melhorando o desempenho das consultas e reduzindo os custos. Os dados na funcionalidade Tabelas do S3 são armazenados em um novo tipo de bucket: um bucket de tabela, que armazena tabelas como sub-recursos. As tabelas do S3 têm suporte integrado para o padrão Apache Iceberg, que permite que você consulte facilmente dados em tabelas em buckets de tabelas do Amazon S3 usando mecanismos de consulta conhecidos, como o Apache Spark.
Você pode integrar buckets e tabelas de tabela do Amazon S3 com AWS Glue Data Catalog (Catálogo de dados) e registrar o catálogo como um local de dados do Lake Formation a partir do console do Lake Formation ou usando o serviço. APIs Quando sua organização gerencia dados no Data Catalog e registra a localização dos dados no Lake Formation, você pode usar o Lake Formation para controlar o acesso aos seus conjuntos de dados.
Você pode aplicar as permissões do Lake Formation usando o controle de acesso baseado em tags e o método de recurso nomeado nos bancos de dados federados e compartilhá-los entre várias Contas da AWS AWS organizações e unidades organizacionais ()OUs. Você também pode compartilhar o banco de dados federado diretamente com as entidades principais do IAM de outra conta.
Para acessar mais informações, consulte Usar Tabelas do Amazon S3 com serviços de analytics da AWS no Guia do usuário do Amazon Simple Storage Service.
Tópicos
Como funciona a integração do Data Catalog e do Lake Formation
Quando você integra o catálogo de tabelas do S3 ao Data Catalog e ao Lake Formation, o serviço AWS Glue cria um único catálogo federado chamado s3tablescatalog no Data Catalog padrão de sua conta específico da sua Região da AWS. A integração mapeia todos os recursos do bucket de tabelas do Amazon S3 em sua conta e Região da AWS no catálogo federado da seguinte maneira:
Os buckets de tabela do Amazon S3 se tornam um catálogo de vários níveis no Data Catalog.
-
O namespace do Amazon S3 associado é registrado como um banco de dados no Data Catalog.
-
As tabelas do Amazon S3 no bucket de tabela se tornam tabelas no Data Catalog.
Após a integração com o Lake Formation, você pode criar tabelas Apache Iceberg no catálogo de tabelas e acessá-las por meio de mecanismos de AWS análise integrados, como o Amazon Athena Amazon EMR, bem como mecanismos de análise de terceiros.