View a markdown version of this page

2. Creación a partir del origen - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

2. Creación a partir del origen

Como se describió anteriormente, crear a partir del origen es el enfoque en el que no se migran los datos del entorno o Elasticsearch actuales. OpenSearch En su lugar, se crean índices en el dominio de destino directamente a partir del registro, el origen de datos del catálogo de productos o el origen de contenido.

Hay dos opciones disponibles para crear a partir del origen. La opción que elija depende del tipo de datos:

  • Uso de AWS Database Migration Service: si la fuente de sus datos es un sistema de administración de bases de datos relacionales (RDBMS) y la fuente es compatible con AWS Database Migration Service (AWS DMS), puede usar AWS DMS para copiar los datos de su fuente de datos a su dominio de Amazon Service de destino. OpenSearch AWS DMS admite opciones de captura de datos modificados (CDC) y carga completa. En la opción de carga completa, la tarea de AWS DMS copia todos los datos de la tabla de la base de datos de origen a un OpenSearch índice de destino. Puede usar la asignación predeterminada o proporcionar configuraciones de asignación personalizadas. En la opción CDC, AWS DMS primero hace una copia completa de los registros de la tabla de origen en un OpenSearch índice de destino. A continuación, captura los datos modificados (los actualiza e inserta) y los copia en el OpenSearch índice. Para obtener más información, consulte las publicaciones del blog Introducing Amazon Elasticsearch Service as a target in AWS Database Migration Service y Scale Amazon Elasticsearch Service for AWS Database Migration Service migrations.

  • Creación a partir del origen del documento: si su origen de datos no es un RDBMS o no es compatible con AWS DMS, es posible que tenga que crear una solución personalizada con herramientas de código abierto o una combinación de herramientas de código abierto y servicios de AWS. Debe convertir los datos de origen en documentos JSON para poder cargarlos OpenSearch. Si ya tienes canalizaciones configuradas desde tu fuente hasta tu OpenSearch entorno o Elasticsearch actual, puedes apuntar esas canalizaciones de datos con los cambios adecuados en las bibliotecas de clientes y (si es necesario) OpenSearch con los cambios del modelo de datos en los índices del dominio de Amazon Service. OpenSearch Cuando cree índices a partir del origen, tenga en cuenta lo siguiente:

    • La ubicación de los documentos: es posible que los documentos ya estén disponibles en la nube de AWS, en un almacén de objetos, como Amazon S3, o en una ubicación de almacenamiento en las instalaciones, como un sistema de archivos.

    • El formato de los documentos: es posible que los documentos ya estén en formato JSON, listos para ser ingeridos en el dominio de Amazon OpenSearch Service, o es posible que deban limpiarse, procesarse y formatearse en JSON antes de poder incorporarse al dominio de Amazon Service. OpenSearch

Estos son los pasos generales para crear a partir del origen:

  1. Defina la asignación de índices y la configuración en el dominio OpenSearch de Amazon Service.

  2. Extraiga los datos del origen del documento y cópielos en una ubicación de almacenamiento de objetos, como Amazon S3. Puede usar una herramienta de código abierto (por ejemplo, Logstash), un cliente de servicio de AWS (por ejemplo, Amazon Kinesis Agent), una herramienta comercial de terceros o un programa personalizado.

  3. Configure una herramienta de código abierto (por ejemplo, Logstash o Fluent Bit) o un servicio nativo de AWS (por ejemplo, AWS Lambda o AWS DMS) para convertir los datos en documentos JSON y cargarlos de forma periódica o continua desde el almacén de objetos al dominio de Amazon Service. OpenSearch

Para obtener más información, consulta Cómo cargar datos de streaming en Amazon OpenSearch Service.