Uso de una canalización de OpenSearch Ingestion con Amazon RDS - Amazon OpenSearch Service

Uso de una canalización de OpenSearch Ingestion con Amazon RDS

Puede usar una canalización de OpenSearch Ingestion con Amazon RDS para exportar los datos existentes y transmitir los cambios (como crear, actualizar y eliminar) a los dominios y recopilaciones de Amazon OpenSearch Service. La canalización de OpenSearch Ingestion incorpora una infraestructura de captura de datos de cambios (CDC) para proporcionar una forma a gran escala y de baja latencia de transmitir datos de forma continua desde Amazon RDS. Se admiten RDS para MySQL y RDS para PostgreSQL.

Existen dos formas de utilizar Amazon RDS como origen para procesar datos: con o sin una instantánea inicial completa. Una instantánea inicial completa es una instantánea de las tablas especificadas y esta instantánea se exporta a Amazon S3. Desde allí, una canalización de OpenSearch Ingestion la envía a un índice de un dominio o la particiona en varios índices en un dominio. Para mantener la coherencia de los datos en Amazon RDS y OpenSearch, la canalización sincroniza todos los eventos de creación, actualización y eliminación de la tabla de Amazon RDS con los documentos guardados en el índice o los índices de OpenSearch.

Cuando utiliza una instantánea inicial completa, la canalización de OpenSearch Ingestion ingiere primero la instantánea y, a continuación, comienza a leer los datos de los flujos de cambios de Amazon RDS. Con el tiempo, recupera y mantiene la coherencia de datos casi en tiempo real entre Amazon RDS y OpenSearch.

También puede usar la integración de OpenSearch Ingestion con Amazon RDS para realizar un seguimiento de los cambios, capturar datos e ingerir todas las actualizaciones de Aurora en OpenSearch. Elija esta opción si ya tiene una instantánea completa de algún otro mecanismo o si solo quiere capturar todos los cambios en los datos de una instancia de Amazon RDS.

Si elige esta opción, debe configurar el registro binario de Amazon RDS para MySQL o configurar la replicación lógica para la instancia de base de datos Amazon RDS para PostgresSQL.