Conectores de orígenes de datos disponibles
En esta sección se muestran los conectores de origen de datos de Athena prediseñados que se pueden utilizar para consultar una variedad de orígenes de datos externos en Amazon S3. Para utilizar un conector en sus consultas de Athena, configúrelo e impleméntelo en su cuenta.
Consideraciones y limitaciones
-
Algunos conectores creados previamente requieren que se cree una VPC y un grupo de seguridad antes de utilizar el conector. Para obtener información sobre la creación de las VPC, consulte Cómo crear una VPC para un conector de origen de datos o una conexión de AWS Glue.
-
Para utilizar la característica de consulta federada de Athena con AWS Secrets Manager, debe configurar un punto de conexión privado de Amazon VPC para Secrets Manager. Para obtener más información, consulte Creación de un punto de conexión privado de VPC de Secrets Manager en la Guía del usuario de AWS Secrets Manager.
-
En el caso de los conectores que no admiten la inserción de predicados, las consultas que incluyen un predicado tardan más en ejecutarse. Para conjuntos de datos pequeños, se escanean muy pocos datos y las consultas tardan un promedio de 2 minutos, aproximadamente. Sin embargo, para conjuntos de datos grandes, muchas consultas pueden agotar el tiempo de espera.
-
Algunos orígenes de datos federados utilizan una terminología diferente de la de Athena para referirse a objetos de datos. Para obtener más información, consulte Descripción de los calificadores de nombres de tablas federadas.
-
Actualizamos nuestros conectores periódicamente en función de las actualizaciones de la base de datos o del proveedor de orígenes de datos. No admitimos orígenes de datos que se encuentren al final de su vida útil para recibir soporte.
-
En el caso de los conectores que no admiten la paginación al enumerar tablas, el servicio web puede agotar el tiempo de espera si la base de datos tiene muchas tablas y metadatos. Los siguientes conectores admiten la paginación de las tablas de listados:
-
DocumentDB
-
DynamoDB
-
MySQL
-
OpenSearch
-
Oracle
-
PostgreSQL
-
Redshift
-
SQL Server
-
Modos de resolución de casos en el SDK de federación
El SDK de federación admite los siguientes modos estandarizados de resolución de mayúsculas y minúsculas para nombres de esquemas y tablas:
NONE
: no modifica las mayúsculas y minúsculas de los nombres de esquemas y tablas proporcionados.LOWER
: convierte a minúsculas todos los nombres de esquemas y tablas proporcionados.UPPER
: convierte a mayúsculas todos los nombres de esquemas y tablas proporcionados.-
ANNOTATION
: este modo se mantiene únicamente por compatibilidad con versiones anteriores y es compatible exclusivamente con los conectores existentes de Snowflake y SAP HANA. CASE_INSENSITIVE_SEARCH
: realiza búsquedas que no distinguen entre mayúsculas y minúsculas en los nombres de esquemas y tablas.
Compatibilidad de los conectores con los modos de resolución de mayúsculas y minúsculas
Compatibilidad con el modo básico
Todos los conectores JDBC son compatibles con los siguientes modos básicos:
NONE
LOWER
UPPER
Compatibilidad con el modo de anotación
Solo los siguientes conectores son compatibles con el modo de ANNOTATION
:
Snowflake
SAP HANA
nota
Se recomienda usar CASE_INSENSITIVE_SEARCH en lugar de ANNOTATION.
Compatibilidad con búsquedas sin distinción entre mayúsculas y minúsculas
Los siguientes conectores admiten CASE_INSENSITIVE_SEARCH
:
DataLake Gen2
Snowflake
Oracle
Synapse
MySQL
PostgreSQL
Redshift
ClickHouse
SQL Server
DB2
Limitaciones de los modos de resolución de mayúsculas y minúsculas
Tenga en cuenta las siguientes limitaciones al usar los modos de resolución de mayúsculas y minúsculas:
-
Al usar el modo
LOWER
, el nombre del esquema y todas las tablas dentro de este deben estar en minúsculas. -
Al usar el modo
UPPER
, el nombre del esquema y todas las tablas dentro de este deben estar en mayúsculas. -
Cuando se utiliza
CASE_INSENSITIVE_SEARCH
:Los nombres de los esquemas deben ser únicos
Los nombres de las tablas dentro de un esquema deben ser únicos (por ejemplo, no se puede tener tanto “Apple” como “APPLE”)
-
Límites de la integración de Glue:
-
Glue solo admite nombres en minúsculas
-
Solo funcionarán los modos
NONE
oLOWER
al registrar la función de Lambda en GlueDataCatalog/LakeFormation.
-
Información adicional
-
Para obtener información sobre la implementación de un conector de origen de datos de Athena, consulte Uso de consulta federada de Amazon Athena.
-
Para obtener información sobre las consultas que utilizan conectores de orígenes de datos de Athena, consulte Ejecución de consultas federadas.
Conectores de origen de datos de Athena
nota
El conector AthenaJdbcConnector