Consulta de tablas de metadatos con servicios de análisis de AWS
Puede consultar las tablas de metadatos administradas por S3 con servicios de análisis de AWS como Amazon Athena, Amazon Redshift y Amazon EMR.
Para poder ejecutar consultas, primero debe integrar los buckets de tablas de S3 administradas de AWS en la región y la Cuenta de AWS con los servicios de análisis de AWS.
Consulta de tablas de metadatos con Amazon Athena
Después de integrar los buckets de tablas de S3 administradas de AWS con servicios de análisis de AWS, puede empezar a consultar las tablas de metadatos en Athena. En las consultas, haga lo siguiente:
-
Especifique el catálogo como
s3tablescatalog/aws-s3
y la base de datos comob_
(que normalmente es el espacio de nombres para las tablas de metadatos).general_purpose_bucket_name
-
Asegúrese de escribir los nombres del espacio de nombres de la tabla de metadatos entre comillas (
"
) o comillas invertidas (`
), ya que, de lo contrario, es posible que la consulta no funcione.
Para obtener más información, vea Consulta de tablas de Amazon S3 con Athena.
También puede ejecutar consultas en Athena desde la consola de Amazon S3.
El siguiente procedimiento utiliza la consola de Amazon S3 para acceder al editor de consultas de Athena y poder consultar una tabla con Amazon Athena.
Consulta de una tabla de metadatos
Inicie sesión en la AWS Management Console y abra la consola de Amazon S3 en https://console.aws.amazon.com/s3/
. -
En el panel de navegación izquierdo, elija Buckets de uso general.
-
En la pestaña Buckets de uso general, elija el bucket que contiene la configuración de metadatos de la tabla de metadatos que desea consultar.
-
En la página de detalles de los buckets, elija la pestaña Metadatos.
-
Elija Consultar tabla con Athena y, a continuación, elija una de las consultas de ejemplo para tablas de diario o de inventario.
-
Se abre la consola de Amazon Athena y aparece el editor de consultas de Athena con una consulta de ejemplo cargada. Modifique la consulta según proceda para su caso de uso.
En el editor de consultas, el campo Catálogo debe rellenarse con s3tablescatalog/aws-s3. El campo Base de datos debe rellenarse con el espacio de nombres donde se almacena la tabla (por ejemplo, b_
nombre-de-bucket-de-uso-general
).nota
Si no ve estos valores en los campos Catálogo y Base de datos, asegúrese de haber integrado el bucket de tablas administradas de AWS con los servicios de análisis de AWS en esta región. Para obtener más información, consulte Integración de tablas de Amazon S3 con servicios de análisis de AWS.
-
Elija Ejecutar para ejecutar la consulta.
nota
-
Si recibe el error
“Insufficient permissions to execute the query. Principal does not have any privilege on specified resource”
cuando intenta ejecutar una consulta en Athena, se le deberán conceder los permisos necesarios de Lake Formation para la tabla. Para obtener más información, consulte Concesión del permiso de Lake Formation sobre una tabla o base de datos.Asegúrese también de que dispone de los permisos de AWS Identity and Access Management (IAM) adecuados para consultar tablas de metadatos. Para obtener más información, consulte Permisos para consultar tablas de metadatos.
-
Si recibe el error
“Iceberg cannot access the requested resource”
al intentar ejecutar la consulta, vaya a la consola de AWS Lake Formation y asegúrese de haberse concedido permisos para el espacio de nombres de base de datos y catálogo de buckets de tablas que creó. No especifique una tabla al conceder estos permisos. Para obtener más información, consulte Concesión del permiso de Lake Formation sobre una tabla o base de datos.
-
Consulta de tablas de metadatos con Amazon Redshift
Después de integrar los buckets de tablas de S3 administradas de AWS con los servicios de análisis de AWS, haga lo siguiente:
-
Cree un enlace de recurso al espacio de nombres de la tabla de metadatos (normalmente
b_
).general_purpose_bucket_name
-
Asegúrese de escribir los nombres del espacio de nombres de la tabla de metadatos entre comillas (
"
) o comillas invertidas (`
), ya que, de lo contrario, es posible que la consulta no funcione.
Después de hacer esto, puede empezar a consultar las tablas de metadatos en la consola de Amazon Redshift. Para obtener más información, consulte Acceso a tablas de Amazon S3 con Amazon Redshift.
Consulta de tablas de metadatos con Amazon EMR
Para consultar las tablas de metadatos mediante Amazon EMR, cree un clúster de Amazon EMR configurado para Apache Iceberg y conéctese a las tablas de metadatos mediante Apache Spark. Puede configurarlo con la integración de los buckets de tablas de S3 administradas de AWS con servicios de análisis de AWS o mediante el catálogo de clientes de código abierto de Amazon S3 Tables Catalog for Iceberg.
nota
Cuando utilice Apache Spark en Amazon EMR u otros motores de terceros para consultar las tablas de metadatos, le recomendamos que utilice el punto de conexión de REST Iceberg de Tablas de Amazon S3. La consulta podría no ejecutarse correctamente si no utiliza este punto de conexión. Para obtener más información, consulte Acceso a tablas mediante el punto de conexión Iceberg REST de Tablas de Amazon S3.
Para obtener más información, consulte Acceso a las tablas de Amazon S3 con Amazon EMR.