Migre una base de datos ThoughtSpot Falcon local a Amazon Redshift - Recomendaciones de AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Migre una base de datos ThoughtSpot Falcon local a Amazon Redshift

Creado por Battulga Purevragchaa (AWS) y Antony Prasad Thevaraj (AWS)

Resumen

El almacenamiento de datos en las instalaciones requiere una cantidad considerable de tiempo y recursos de administración, especialmente en el caso de conjuntos de datos de gran tamaño. El costo financiero de compilar, mantener y hacer crecer estos almacenes también es muy alto. Para ayudar a administrar los costos, mantener baja la complejidad de extracción, transformación y carga (ETL) y ofrecer rendimiento a medida que sus datos crecen, debe elegir constantemente qué datos cargar y qué datos archivar.

Al migrar sus bases de datos ThoughtSpot Falcon locales a la nube de Amazon Web Services (AWS), puede acceder a lagos de datos y almacenes de datos basados en la nube que aumentan la agilidad, la seguridad y la confiabilidad de las aplicaciones de su empresa, además de reducir los costos generales de infraestructura. Amazon Redshift ayuda a reducir considerablemente los costos y los gastos operativos de un almacenamiento de datos. También puede usar Amazon Redshift Spectrum para analizar grandes cantidades de datos en su formato nativo sin necesidad de cargar los datos.

Este patrón describe los pasos y el proceso para migrar una base de datos ThoughtSpot Falcon de un centro de datos local a una base de datos de Amazon Redshift en la nube de AWS.

Requisitos previos y limitaciones

Requisitos previos 

  • Una cuenta de AWS activa

  • Una base de datos ThoughtSpot Falcon alojada en un centro de datos local

Versiones de producto

  • ThoughtSpot versión 7.0.1 

Arquitectura

Migración de una base de datos ThoughtSpot Falcon desde un centro de datos local a Amazon Redshift.

En el diagrama, se muestra el siguiente flujo de trabajo:

  1. Los datos se alojan en una base de datos relacional en las instalaciones.

  2. La herramienta de conversión de esquemas de AWS (AWS SCT) convierte el lenguaje de definición de datos (DDL) que es compatible con Amazon Redshift.

  3. Una vez creadas las tablas, puede migrar los datos mediante AWS Database Migration Service (AWS DMS).

  4. Los datos se cargan en Amazon Redshift.

  5. Los datos se almacenan en Amazon Simple Storage Service (Amazon S3) si utiliza Redshift Spectrum o si ya aloja los datos en Amazon S3.

Herramientas

  • AWS DMS: AWS Data Migration Service (AWS DMS) le ayuda a migrar bases de datos a AWS de forma rápida y segura.

  • Amazon Redshift: Amazon RedShift es un servicio de almacenamiento de datos de escala de petabyte rápido, totalmente administrado, que hace que sea simple y rentable analizar de manera eficiente todos sus datos utilizando sus herramientas de inteligencia empresariales existentes.

  • AWS SCT: la herramienta de conversión de esquemas de AWS (AWS SCT) convierte el esquema de base de datos existente de un motor de base de datos a otro.

Epics

TareaDescripciónHabilidades requeridas

Identifique la configuración de Amazon Redshift adecuada.

Identifique la configuración de clúster de Amazon Redshift adecuada en función de sus requisitos y volumen de datos. 

Para obtener más información, consulte Clústeres de Amazon Redshift en la documentación de Amazon Redshift.

Administrador de base de datos

Investigue Amazon Redshift para evaluar si cumple con sus requisitos.

Utilice Amazon Redshift FAQs para comprender y evaluar si Amazon Redshift cumple sus requisitos.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Crear un clúster de Amazon Redshift.

Inicie sesión en la consola de administración de AWS, abra la consola de Amazon Redshift y, a continuación, cree un clúster de Amazon Redshift en una nube privada virtual (VPC). 

Para obtener más información, consulte Creación de un clúster en una VPC en la documentación de Amazon Redshift.

Administrador de base de datos

Lleve a cabo una PoC para el diseño de su base de datos de Amazon Redshift.

Siga las prácticas recomendadas de Amazon Redshift realizando una prueba de concepto (PoC) para el diseño de su base de datos. 

Para obtener más información, consulte Realización de una prueba de concepto para Amazon Redshift en la documentación de Amazon Redshift.

Administrador de base de datos

Cree usuarios de bases de datos.

Cree los usuarios en la base de datos de Amazon Redshift y asigne los roles adecuados para acceder al esquema y a las tablas.  

Para obtener más información, consulte Conceder privilegios de acceso a un usuario o grupo de usuarios en la documentación de Amazon Redshift.

Administrador de base de datos

Aplique los parámetros de configuración a la base de datos de destino.

Aplique los parámetros de configuración a la base de datos de Amazon Redshift según sus requisitos. 

Para obtener más información sobre cómo habilitar los parámetros de base de datos, sesión y servidor, consulte la Referencia de configuración en la documentación de Amazon Redshift.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Cree tablas manualmente con DDL en Amazon Redshift.

(Opcional) Si utiliza AWS SCT, las tablas se crean automáticamente. Sin embargo, si se producen errores al replicar DDLs, tendrá que crear las tablas manualmente

Administrador de base de datos

Crear tablas externas para Redshift Spectrum.

Cree una tabla externa con un esquema externo para Amazon Redshift Spectrum. Para crear tablas externas, debe ser el propietario del esquema externo o un superusuario de base de datos

Para obtener más información, consulte Creación de tablas externas para Amazon Redshift Spectrum en la documentación de Amazon Redshift.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Utilice AWS DMS para migrar los datos.

Tras crear el DDL de las tablas en la base de datos de Amazon Redshift, migre sus datos a Amazon Redshift mediante AWS DMS.

Para obtener instrucciones y pasos detallados, consulte Uso de una base de datos de Amazon Redshift como destino de AWS DMS en la documentación de AWS DMS.

Administrador de base de datos

Uso del comando COPY para cargar datos.

Utilice el comando COPY de Amazon Redshift para cargar los datos desde Amazon S3 a Amazon Redshift.

Para obtener más información, consulte Uso del comando COPIAR para cargar desde Amazon S3 en la documentación de Amazon Redshift.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Valide los registros de origen y destino.

Valide el recuento de tablas de los registros de origen y destino que se cargaron desde el sistema de origen.

Administrador de base de datos

Implemente las prácticas recomendadas de Amazon Redshift para el ajuste del rendimiento.

Implemente las prácticas recomendadas de Amazon Redshift para el diseño de tablas y bases de datos. 

Para obtener más información, consulte la siguiente entrada del blog: Las 10 técnicas principales de ajuste del rendimiento de Amazon Redshift.

Administrador de base de datos

Optimizar el rendimiento de la consulta.

Amazon RedShift utiliza consultas basadas en SQL para interactuar con datos y objetos en el sistema. El Data Manipulation Language (DML, Lenguaje de manipulación de datos) es el subconjunto de SQL que el usuario utiliza para ver, añadir, cambiar y eliminar datos. DDL es el subconjunto de SQL que el usuario utiliza para añadir, cambiar y eliminar objetos de la base de datos como tablas y vistas.

Para obtener más información, consulte Ajuste del rendimiento de las consultas en la documentación de Amazon Redshift.

Administrador de base de datos

Implemente WLM.

Puede utilizar workload management (WLM) para definir varias colas de consultas y dirigir las consultas a las colas adecuadas en tiempo de ejecución.

Para obtener más información, consulte Implementación de la administración de la carga de trabajo en la documentación de Amazon Redshift.

Administrador de base de datos

Trabajar con escalado de concurrencia.

Al usar la característica de escalado de concurrencia, puede admitir usuarios concurrentes prácticamente ilimitados y consultas concurrentes, con un rendimiento de consulta consistentemente rápido.

Para obtener más información, consulte Uso del escalado de simultaneidad en la documentación de Amazon Redshift.

Administrador de base de datos

Use las prácticas recomendadas de Amazon RedShift para el diseño de tablas.

Cuando planifica su base de datos, ciertas decisiones importantes de diseño de tabla pueden influir considerablemente en el rendimiento general de la consulta.

Para obtener más información sobre seleccionar la opción de diseño de tablas más adecuada, consulte Prácticas recomendadas de Amazon Redshift para el diseño de tablas en la documentación de Amazon Redshift.

Administrador de base de datos

Crear vistas materializadas en Amazon Redshift.

Una vista materializada contiene un conjunto de resultados computados previamente, basados en una consulta de SQL sobre una o más tablas base. Puede emitir instrucciones SELECT para consultar una vista materializada, de la misma manera que puede consultar otras tablas o vistas en la base de datos.

Para obtener más información, consulte Creación de vistas materializadas en Amazon Redshift en la documentación de Amazon Redshift.

Administrador de base de datos

Defina las uniones entre las tablas.

Para buscar en más de una tabla al mismo tiempo ThoughtSpot, debe definir las uniones entre las tablas especificando columnas que contengan datos coincidentes en dos tablas. Estas columnas representan la primary key y foreign key de la unión.

Puede definirlos mediante el ALTER TABLE comando de Amazon Redshift o. ThoughtSpot Para obtener más información, consulte ALTER TABLE en la documentación de Amazon RedShift.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Añada una conexión de Amazon Redshift.

Añada una conexión Amazon Redshift a su base de datos Falcon local. ThoughtSpot

Para obtener más información, consulte Añadir una conexión Amazon Redshift en la ThoughtSpot documentación.

Administrador de base de datos

Edite la conexión de Amazon Redshift.

Puede editar la conexión de Amazon Redshift para añadir tablas y columnas.

Para obtener más información, consulte Edición de una conexión de Amazon Redshift en la ThoughtSpot documentación.

Administrador de base de datos

Reasigne la conexión de Amazon Redshift.

Modifique los parámetros de conexión editando el archivo .yaml de asignación de origen que se creó al añadir la conexión de Amazon Redshift. 

Por ejemplo, puede reasignar la tabla o columna existente a una tabla o columna diferente en una conexión de base de datos existente. ThoughtSpot recomienda comprobar las dependencias antes y después de volver a mapear una tabla o columna de una conexión para asegurarse de que se muestran según sea necesario.

Para obtener más información, consulte Remapear una conexión de Amazon Redshift en ThoughtSpot la documentación.

Administrador de base de datos

Elimine una tabla de la conexión de Amazon Redshift.

(Opcional) Si intenta eliminar una tabla de una conexión de Amazon Redshift, ThoughtSpot comprueba las dependencias y muestra una lista de objetos dependientes. Puede elegir los objetos de la lista para eliminarlos o eliminar la dependencia. A continuación puede eliminar la tabla.

Para obtener más información, consulte Eliminar una tabla de una conexión de Amazon Redshift en la ThoughtSpot documentación.

Administrador de base de datos

Elimine una tabla con objetos dependientes de una conexión de Amazon Redshift.

(Opcional) Si intenta eliminar una tabla con objetos dependientes, la operación se bloquea. Se muestra una ventana Cannot delete con una lista de enlaces a objetos dependientes. Cuando se eliminen todas las dependencias, podrá eliminar la tabla

Para obtener más información, consulte Eliminar una tabla con objetos dependientes de una conexión de Amazon Redshift en la ThoughtSpot documentación.

Administrador de base de datos

Elimine una conexión de Amazon Redshift.

(Opcional) Como una conexión se puede utilizar en varios orígenes de datos o visualizaciones, debe eliminar todas las fuentes y tareas que utilizan esa conexión antes de poder eliminar la conexión de Amazon Redshift.

Para obtener más información, consulte Eliminar una conexión de Amazon Redshift en la ThoughtSpot documentación.

Administrador de base de datos

Compruebe la referencia de conexión de Amazon Redshift.

Asegúrese de proporcionar la información requerida para su conexión a Amazon Redshift utilizando la referencia de conexión de la documentación. ThoughtSpot

Administrador de base de datos

Información adicional