Conectores de orígenes de datos disponibles - Amazon Athena

Conectores de orígenes de datos disponibles

En esta sección se muestran los conectores de origen de datos de Athena prediseñados que se pueden utilizar para consultar una variedad de orígenes de datos externos en Amazon S3. Para utilizar un conector en sus consultas de Athena, configúrelo e impleméntelo en su cuenta.

Consideraciones y limitaciones

  • Algunos conectores creados previamente requieren que se cree una VPC y un grupo de seguridad antes de utilizar el conector. Para obtener información sobre la creación de las VPC, consulte Cómo crear una VPC para un conector de origen de datos o una conexión de AWS Glue.

  • Para utilizar la característica de consulta federada de Athena con AWS Secrets Manager, debe configurar un punto de conexión privado de Amazon VPC para Secrets Manager. Para obtener más información, consulte Creación de un punto de conexión privado de VPC de Secrets Manager en la Guía del usuario de AWS Secrets Manager.

  • En el caso de los conectores que no admiten la inserción de predicados, las consultas que incluyen un predicado tardan más en ejecutarse. Para conjuntos de datos pequeños, se escanean muy pocos datos y las consultas tardan un promedio de 2 minutos, aproximadamente. Sin embargo, para conjuntos de datos grandes, muchas consultas pueden agotar el tiempo de espera.

  • Algunos orígenes de datos federados utilizan una terminología diferente de la de Athena para referirse a objetos de datos. Para obtener más información, consulte Descripción de los calificadores de nombres de tablas federadas.

  • Actualizamos nuestros conectores periódicamente en función de las actualizaciones de la base de datos o del proveedor de orígenes de datos. No admitimos orígenes de datos que se encuentren al final de su vida útil para recibir soporte.

  • En el caso de los conectores que no admiten la paginación al enumerar tablas, el servicio web puede agotar el tiempo de espera si la base de datos tiene muchas tablas y metadatos. Los siguientes conectores admiten la paginación de las tablas de listados:

    • DocumentDB

    • DynamoDB

    • MySQL

    • OpenSearch

    • Oracle

    • PostgreSQL

    • Redshift

    • SQL Server

Modos de resolución de casos en el SDK de federación

El SDK de federación admite los siguientes modos estandarizados de resolución de mayúsculas y minúsculas para nombres de esquemas y tablas:

  • NONE: no modifica las mayúsculas y minúsculas de los nombres de esquemas y tablas proporcionados.

  • LOWER: convierte a minúsculas todos los nombres de esquemas y tablas proporcionados.

  • UPPER: convierte a mayúsculas todos los nombres de esquemas y tablas proporcionados.

  • ANNOTATION: este modo se mantiene únicamente por compatibilidad con versiones anteriores y es compatible exclusivamente con los conectores existentes de Snowflake y SAP HANA.

  • CASE_INSENSITIVE_SEARCH: realiza búsquedas que no distinguen entre mayúsculas y minúsculas en los nombres de esquemas y tablas.

Compatibilidad de los conectores con los modos de resolución de mayúsculas y minúsculas

Compatibilidad con el modo básico

Todos los conectores JDBC son compatibles con los siguientes modos básicos:

  • NONE

  • LOWER

  • UPPER

Compatibilidad con el modo de anotación

Solo los siguientes conectores son compatibles con el modo de ANNOTATION:

  • Snowflake

  • SAP HANA

nota

Se recomienda usar CASE_INSENSITIVE_SEARCH en lugar de ANNOTATION.

Compatibilidad con búsquedas sin distinción entre mayúsculas y minúsculas

Los siguientes conectores admiten CASE_INSENSITIVE_SEARCH:

  • DataLake Gen2

  • Snowflake

  • Oracle

  • Synapse

  • MySQL

  • PostgreSQL

  • Redshift

  • ClickHouse

  • SQL Server

  • DB2

Limitaciones de los modos de resolución de mayúsculas y minúsculas

Tenga en cuenta las siguientes limitaciones al usar los modos de resolución de mayúsculas y minúsculas:

  • Al usar el modo LOWER, el nombre del esquema y todas las tablas dentro de este deben estar en minúsculas.

  • Al usar el modo UPPER, el nombre del esquema y todas las tablas dentro de este deben estar en mayúsculas.

  • Cuando se utiliza CASE_INSENSITIVE_SEARCH:

    • Los nombres de los esquemas deben ser únicos

    • Los nombres de las tablas dentro de un esquema deben ser únicos (por ejemplo, no se puede tener tanto “Apple” como “APPLE”)

  • Límites de la integración de Glue:

    • Glue solo admite nombres en minúsculas

    • Solo funcionarán los modos NONE o LOWER al registrar la función de Lambda en GlueDataCatalog/LakeFormation.

Información adicional

nota

El conector AthenaJdbcConnector (versión más reciente, 2022.4.1) ha quedado obsoleto. En su lugar, use un conector específico para bases de datos, como los de MySQL, Redshift o PostgreSQL.