Integraciones sin ETL
La integración sin ETL es una solución totalmente administrada que permite que los datos transaccionales y operativos estén disponibles en Amazon Redshift desde múltiples fuentes operativas y transaccionales. Con esta solución, puede configurar una integración desde su fuente a un almacenamiento de datos de Amazon Redshift. No es necesario mantener una canalización de extracción, transformación y carga (ETL). Nosotros nos ocupamos de la ETL mediante la automatización de la creación y administración de la replicación de datos del origen de datos al clúster de Amazon Redshift o al espacio de nombres de Redshift sin servidor. Puede seguir actualizando y consultando los datos de origen y, al mismo tiempo, utilizar Amazon Redshift para cargas de trabajo de análisis, como informes y paneles.
Con la integración sin ETL, dispondrá de datos más actualizados para el análisis, la inteligencia artificial y el aprendizaje automático y la elaboración de informes. Obtendrá información más precisa y oportuna para casos de uso, como paneles empresariales, una experiencia de juego optimizada, la supervisión de la calidad de los datos y el análisis del comportamiento de los clientes. Puede hacer predicciones basadas en datos con más confianza, mejorar las experiencias de los clientes y promover información basada en datos en toda la empresa.
Los siguientes orígenes son compatibles actualmente con las integraciones sin ETL:
-
MySQL de Amazon Aurora
-
PostgreSQL de Amazon Aurora
-
Amazon RDS para MySQL
-
Amazon DynamoDB
-
Aplicaciones, como Salesforce, SAP, ServiceNow y Zendesk
Para crear una integración sin ETL, especifique un origen de integración y un almacenamiento de datos de Amazon Redshift como destino. Después de una carga inicial de datos, la integración replica los datos desde la fuente hasta el almacenamiento de datos en destino. Los datos estarán disponibles en Amazon Redshift. Usted controla el cifrado de sus datos cuando crea la fuente de integración, cuando crea la integración sin ETL y cuando crea el almacenamiento de datos de Amazon Redshift. La integración supervisa el estado de la canalización de datos y se recupera de los problemas cuando es posible. Puede crear integraciones a partir de orígenes del mismo tipo en un único almacenamiento de datos de Amazon Redshift para obtener información integral de varias aplicaciones.
Con los datos de Amazon Redshift, puede utilizar los análisis que proporciona Amazon Redshift. Por ejemplo, el machine learning (ML) integrado, las vistas materializadas, el uso compartido de datos y el acceso directo a varios almacenes y lagos de datos. Para los ingenieros de datos, la integración sin ETL proporciona acceso a datos urgentes que, de otro modo, pueden verse retrasados por errores intermitentes en canalizaciones de datos complejas. Puede ejecutar consultas analíticas y modelos de ML en los datos transaccionales para obtener información a tiempo sobre eventos y decisiones empresariales urgentes.
Puede crear una suscripción de notificación de eventos de Amazon Redshift para recibir notificaciones cada vez que se produzca un evento para una integración sin ETL determinada. Para ver la lista de notificaciones de eventos relacionadas con la integración, consulte Notificaciones de eventos de integración sin ETL con Amazon EventBridge. La forma más sencilla de crear una suscripción es a través de la consola de Amazon SNS. Para obtener información acerca de cómo crear un tema de Amazon SNS y suscribirse a él, consulte Introducción a Amazon SNS en la Guía para desarrolladores de Amazon Simple Notification Service.
Cuando empiece a utilizar las integraciones sin ETL, tenga en cuenta los siguientes conceptos:
-
Una base de datos de origen es la base de datos desde la que se replican los datos en Amazon Redshift.
-
Un almacenamiento de datos de destino es el clúster aprovisionado de Amazon Redshift o el grupo de trabajo de Redshift sin servidor en el que se replican los datos.
-
Una base de datos de destino es la base de datos que se crea a partir de una integración sin ETL en el almacenamiento de datos de destino.
Para obtener información sobre las tablas y las vistas del sistema que puede utilizar para monitorear las integraciones sin ETL, consulte Monitoreo de integraciones sin ETL con vistas del sistema de Amazon Redshift.
Para obtener una lista de Regiones de AWS que admite cada origen de integraciones sin ETL, consulte Regiones compatibles con integraciones sin ETL.
Para obtener información sobre los precios de las integraciones sin ETL, consulte la página de precios correspondiente:
Para obtener más información acerca de los orígenes de la integración sin ETL, consulte los temas siguientes:
-
Para obtener información sobre las integraciones sin ETL de Aurora, consulte los temas Beneficios, Conceptos clave, Limitaciones, Cuotas y Regiones admitidas de las integraciones sin ETL en la Guía del usuario de Amazon Aurora.
-
Para obtener información sobre las integraciones sin ETL de RDS, consulte los temas Beneficios, Conceptos clave, Limitaciones, Cuotas y Regiones admitidas de las integraciones sin ETL en la Guía del usuario de Amazon RDS.
-
Para integraciones sin ETL de DynamoDB, consulte DynamoDB zero-ETL integration with Amazon Redshift en la Guía para desarrolladores de Amazon DynamoDB.
-
Para obtener información sobre las integraciones sin ETL con aplicaciones, consulte Integraciones sin ETL en la Guía para desarrolladores de AWS Glue.