Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Migre una base de datos ThoughtSpot Falcon local a Amazon Redshift
Creado por Battulga Purevragchaa (AWS) y Antony Prasad Thevaraj (AWS)
Resumen
El almacenamiento de datos en las instalaciones requiere una cantidad considerable de tiempo y recursos de administración, especialmente en el caso de conjuntos de datos de gran tamaño. El costo financiero de compilar, mantener y hacer crecer estos almacenes también es muy alto. Para ayudar a administrar los costos, mantener baja la complejidad de extracción, transformación y carga (ETL) y ofrecer rendimiento a medida que sus datos crecen, debe elegir constantemente qué datos cargar y qué datos archivar.
Al migrar sus bases de datos ThoughtSpot Falcon
Este patrón describe los pasos y el proceso para migrar una base de datos ThoughtSpot Falcon de un centro de datos local a una base de datos de Amazon Redshift en la nube de AWS.
Requisitos previos y limitaciones
Requisitos previos
Una cuenta de AWS activa
Una base de datos ThoughtSpot Falcon alojada en un centro de datos local
Versiones de producto
ThoughtSpot versión 7.0.1
Arquitectura

En el diagrama, se muestra el siguiente flujo de trabajo:
Los datos se alojan en una base de datos relacional en las instalaciones.
La herramienta de conversión de esquemas de AWS (AWS SCT) convierte el lenguaje de definición de datos (DDL) que es compatible con Amazon Redshift.
Una vez creadas las tablas, puede migrar los datos mediante AWS Database Migration Service (AWS DMS).
Los datos se cargan en Amazon Redshift.
Los datos se almacenan en Amazon Simple Storage Service (Amazon S3) si utiliza Redshift Spectrum o si ya aloja los datos en Amazon S3.
Herramientas
AWS DMS: AWS Data Migration Service (AWS DMS) le ayuda a migrar bases de datos a AWS de forma rápida y segura.
Amazon Redshift: Amazon RedShift es un servicio de almacenamiento de datos de escala de petabyte rápido, totalmente administrado, que hace que sea simple y rentable analizar de manera eficiente todos sus datos utilizando sus herramientas de inteligencia empresariales existentes.
AWS SCT: la herramienta de conversión de esquemas de AWS (AWS SCT) convierte el esquema de base de datos existente de un motor de base de datos a otro.
Epics
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Identifique la configuración de Amazon Redshift adecuada. | Identifique la configuración de clúster de Amazon Redshift adecuada en función de sus requisitos y volumen de datos. Para obtener más información, consulte Clústeres de Amazon Redshift en la documentación de Amazon Redshift. | Administrador de base de datos |
Investigue Amazon Redshift para evaluar si cumple con sus requisitos. | Utilice Amazon Redshift FAQs | Administrador de base de datos |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Crear un clúster de Amazon Redshift. | Inicie sesión en la consola de administración de AWS, abra la consola de Amazon Redshift y, a continuación, cree un clúster de Amazon Redshift en una nube privada virtual (VPC). Para obtener más información, consulte Creación de un clúster en una VPC en la documentación de Amazon Redshift. | Administrador de base de datos |
Lleve a cabo una PoC para el diseño de su base de datos de Amazon Redshift. | Siga las prácticas recomendadas de Amazon Redshift realizando una prueba de concepto (PoC) para el diseño de su base de datos. Para obtener más información, consulte Realización de una prueba de concepto para Amazon Redshift en la documentación de Amazon Redshift. | Administrador de base de datos |
Cree usuarios de bases de datos. | Cree los usuarios en la base de datos de Amazon Redshift y asigne los roles adecuados para acceder al esquema y a las tablas. Para obtener más información, consulte Conceder privilegios de acceso a un usuario o grupo de usuarios en la documentación de Amazon Redshift. | Administrador de base de datos |
Aplique los parámetros de configuración a la base de datos de destino. | Aplique los parámetros de configuración a la base de datos de Amazon Redshift según sus requisitos. Para obtener más información sobre cómo habilitar los parámetros de base de datos, sesión y servidor, consulte la Referencia de configuración en la documentación de Amazon Redshift. | Administrador de base de datos |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Cree tablas manualmente con DDL en Amazon Redshift. | (Opcional) Si utiliza AWS SCT, las tablas se crean automáticamente. Sin embargo, si se producen errores al replicar DDLs, tendrá que crear las tablas manualmente | Administrador de base de datos |
Crear tablas externas para Redshift Spectrum. | Cree una tabla externa con un esquema externo para Amazon Redshift Spectrum. Para crear tablas externas, debe ser el propietario del esquema externo o un superusuario de base de datos. Para obtener más información, consulte Creación de tablas externas para Amazon Redshift Spectrum en la documentación de Amazon Redshift. | Administrador de base de datos |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Utilice AWS DMS para migrar los datos. | Tras crear el DDL de las tablas en la base de datos de Amazon Redshift, migre sus datos a Amazon Redshift mediante AWS DMS. Para obtener instrucciones y pasos detallados, consulte Uso de una base de datos de Amazon Redshift como destino de AWS DMS en la documentación de AWS DMS. | Administrador de base de datos |
Uso del comando COPY para cargar datos. | Utilice el comando Para obtener más información, consulte Uso del comando COPIAR para cargar desde Amazon S3 en la documentación de Amazon Redshift. | Administrador de base de datos |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Valide los registros de origen y destino. | Valide el recuento de tablas de los registros de origen y destino que se cargaron desde el sistema de origen. | Administrador de base de datos |
Implemente las prácticas recomendadas de Amazon Redshift para el ajuste del rendimiento. | Implemente las prácticas recomendadas de Amazon Redshift para el diseño de tablas y bases de datos. Para obtener más información, consulte la siguiente entrada del blog: Las 10 técnicas principales de ajuste del rendimiento de Amazon Redshift | Administrador de base de datos |
Optimizar el rendimiento de la consulta. | Amazon RedShift utiliza consultas basadas en SQL para interactuar con datos y objetos en el sistema. El Data Manipulation Language (DML, Lenguaje de manipulación de datos) es el subconjunto de SQL que el usuario utiliza para ver, añadir, cambiar y eliminar datos. DDL es el subconjunto de SQL que el usuario utiliza para añadir, cambiar y eliminar objetos de la base de datos como tablas y vistas. Para obtener más información, consulte Ajuste del rendimiento de las consultas en la documentación de Amazon Redshift. | Administrador de base de datos |
Implemente WLM. | Puede utilizar workload management (WLM) para definir varias colas de consultas y dirigir las consultas a las colas adecuadas en tiempo de ejecución. Para obtener más información, consulte Implementación de la administración de la carga de trabajo en la documentación de Amazon Redshift. | Administrador de base de datos |
Trabajar con escalado de concurrencia. | Al usar la característica de escalado de concurrencia, puede admitir usuarios concurrentes prácticamente ilimitados y consultas concurrentes, con un rendimiento de consulta consistentemente rápido. Para obtener más información, consulte Uso del escalado de simultaneidad en la documentación de Amazon Redshift. | Administrador de base de datos |
Use las prácticas recomendadas de Amazon RedShift para el diseño de tablas. | Cuando planifica su base de datos, ciertas decisiones importantes de diseño de tabla pueden influir considerablemente en el rendimiento general de la consulta. Para obtener más información sobre seleccionar la opción de diseño de tablas más adecuada, consulte Prácticas recomendadas de Amazon Redshift para el diseño de tablas en la documentación de Amazon Redshift. | Administrador de base de datos |
Crear vistas materializadas en Amazon Redshift. | Una vista materializada contiene un conjunto de resultados computados previamente, basados en una consulta de SQL sobre una o más tablas base. Puede emitir instrucciones Para obtener más información, consulte Creación de vistas materializadas en Amazon Redshift en la documentación de Amazon Redshift. | Administrador de base de datos |
Defina las uniones entre las tablas. | Para buscar en más de una tabla al mismo tiempo ThoughtSpot, debe definir las uniones entre las tablas especificando columnas que contengan datos coincidentes en dos tablas. Estas columnas representan la Puede definirlos mediante el | Administrador de base de datos |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Añada una conexión de Amazon Redshift. | Añada una conexión Amazon Redshift a su base de datos Falcon local. ThoughtSpot Para obtener más información, consulte Añadir una conexión Amazon Redshift | Administrador de base de datos |
Edite la conexión de Amazon Redshift. | Puede editar la conexión de Amazon Redshift para añadir tablas y columnas. Para obtener más información, consulte Edición de una conexión de Amazon Redshift | Administrador de base de datos |
Reasigne la conexión de Amazon Redshift. | Modifique los parámetros de conexión editando el archivo .yaml de asignación de origen que se creó al añadir la conexión de Amazon Redshift. Por ejemplo, puede reasignar la tabla o columna existente a una tabla o columna diferente en una conexión de base de datos existente. ThoughtSpot recomienda comprobar las dependencias antes y después de volver a mapear una tabla o columna de una conexión para asegurarse de que se muestran según sea necesario. Para obtener más información, consulte Remapear una conexión de Amazon Redshift | Administrador de base de datos |
Elimine una tabla de la conexión de Amazon Redshift. | (Opcional) Si intenta eliminar una tabla de una conexión de Amazon Redshift, ThoughtSpot comprueba las dependencias y muestra una lista de objetos dependientes. Puede elegir los objetos de la lista para eliminarlos o eliminar la dependencia. A continuación puede eliminar la tabla. Para obtener más información, consulte Eliminar una tabla de una conexión de Amazon Redshift | Administrador de base de datos |
Elimine una tabla con objetos dependientes de una conexión de Amazon Redshift. | (Opcional) Si intenta eliminar una tabla con objetos dependientes, la operación se bloquea. Se muestra una ventana Para obtener más información, consulte Eliminar una tabla con objetos dependientes de una conexión de Amazon Redshift | Administrador de base de datos |
Elimine una conexión de Amazon Redshift. | (Opcional) Como una conexión se puede utilizar en varios orígenes de datos o visualizaciones, debe eliminar todas las fuentes y tareas que utilizan esa conexión antes de poder eliminar la conexión de Amazon Redshift. Para obtener más información, consulte Eliminar una conexión de Amazon Redshift | Administrador de base de datos |
Compruebe la referencia de conexión de Amazon Redshift. | Asegúrese de proporcionar la información requerida para su conexión a Amazon Redshift utilizando la referencia de conexión | Administrador de base de datos |