Resumen Requisitos previos y limitaciones Arquitectura Tools (Herramientas)Epics Información adicional

Migre una base de datos ThoughtSpot Falcon local a Amazon Redshift

Battulga Purevragchaa y Antony Prasad Thevaraj, Amazon Web Services

Resumen

El almacenamiento de datos en las instalaciones requiere una cantidad considerable de tiempo y recursos de administración, especialmente en el caso de conjuntos de datos de gran tamaño. El costo financiero de compilar, mantener y hacer crecer estos almacenes también es muy alto. Para ayudar a administrar los costos, mantener baja la complejidad de extracción, transformación y carga (ETL) y ofrecer rendimiento a medida que sus datos crecen, debe elegir constantemente qué datos cargar y qué datos archivar.

Al migrar sus bases de datos ThoughtSpot Falcon locales a la nube de Amazon Web Services (AWS), puede acceder a lagos de datos y almacenes de datos basados en la nube que aumentan la agilidad, la seguridad y la confiabilidad de las aplicaciones de su empresa, además de reducir los costos generales de infraestructura. Amazon Redshift ayuda a reducir considerablemente los costos y los gastos operativos de un almacenamiento de datos. También puede usar Amazon Redshift Spectrum para analizar grandes cantidades de datos en su formato nativo sin necesidad de cargar los datos.

Este patrón describe los pasos y el proceso para migrar una base de datos ThoughtSpot Falcon de un centro de datos local a una base de datos de Amazon Redshift en la nube de AWS.

Requisitos previos y limitaciones

Requisitos previos

Una cuenta de AWS activa
Una base de datos ThoughtSpot Falcon alojada en un centro de datos local

Versiones de producto

ThoughtSpot versión 7.0.1

Arquitectura

Migración de una base de datos ThoughtSpot Falcon desde un centro de datos local a Amazon Redshift.

En el diagrama, se muestra el siguiente flujo de trabajo:

Los datos se alojan en una base de datos relacional en las instalaciones.
La herramienta de conversión de esquemas de AWS (AWS SCT) convierte el lenguaje de definición de datos (DDL) que es compatible con Amazon Redshift.
Una vez creadas las tablas, puede migrar los datos mediante AWS Database Migration Service (AWS DMS).
Los datos se cargan en Amazon Redshift.
Los datos se almacenan en Amazon Simple Storage Service (Amazon S3) si utiliza Redshift Spectrum o si ya aloja los datos en Amazon S3.

Tools (Herramientas)

AWS DMS: AWS Data Migration Service (AWS DMS) le ayuda a migrar bases de datos a AWS de forma rápida y segura.
Amazon Redshift: Amazon RedShift es un servicio de almacenamiento de datos de escala de petabyte rápido, totalmente administrado, que hace que sea simple y rentable analizar de manera eficiente todos sus datos utilizando sus herramientas de inteligencia empresariales existentes.
AWS SCT: la herramienta de conversión de esquemas de AWS (AWS SCT) convierte el esquema de base de datos existente de un motor de base de datos a otro.

Epics

Tarea	Descripción	Habilidades requeridas
Identifique la configuración de Amazon Redshift adecuada.	Identifique la configuración de clúster de Amazon Redshift adecuada en función de sus requisitos y volumen de datos. Para obtener más información, consulte Clústeres de Amazon Redshift en la documentación de Amazon Redshift.	Administrador de base de datos
Investigue Amazon Redshift para evaluar si cumple con sus requisitos.	Utilice Amazon Redshift FAQs para comprender y evaluar si Amazon Redshift cumple sus requisitos.	Administrador de base de datos

Tarea

Descripción

Habilidades requeridas

Identifique la configuración de Amazon Redshift adecuada.

Identifique la configuración de clúster de Amazon Redshift adecuada en función de sus requisitos y volumen de datos.

Para obtener más información, consulte Clústeres de Amazon Redshift en la documentación de Amazon Redshift.

Administrador de base de datos

Investigue Amazon Redshift para evaluar si cumple con sus requisitos.

Utilice Amazon Redshift FAQs para comprender y evaluar si Amazon Redshift cumple sus requisitos.

Administrador de base de datos

Tarea	Descripción	Habilidades requeridas
Crear un clúster de Amazon Redshift.	Inicie sesión en la consola de administración de AWS, abra la consola de Amazon Redshift y, a continuación, cree un clúster de Amazon Redshift en una nube privada virtual (VPC). Para obtener más información, consulte Creación de un clúster en una VPC en la documentación de Amazon Redshift.	Administrador de base de datos
Lleve a cabo una PoC para el diseño de su base de datos de Amazon Redshift.	Siga las prácticas recomendadas de Amazon Redshift realizando una prueba de concepto (PoC) para el diseño de su base de datos. Para obtener más información, consulte Realización de una prueba de concepto para Amazon Redshift en la documentación de Amazon Redshift.	Administrador de base de datos
Cree usuarios de bases de datos.	Cree los usuarios en la base de datos de Amazon Redshift y asigne los roles adecuados para acceder al esquema y a las tablas. Para obtener más información, consulte Conceder privilegios de acceso a un usuario o grupo de usuarios en la documentación de Amazon Redshift.	Administrador de base de datos
Aplique los parámetros de configuración a la base de datos de destino.	Aplique los parámetros de configuración a la base de datos de Amazon Redshift según sus requisitos. Para obtener más información sobre cómo habilitar los parámetros de base de datos, sesión y servidor, consulte la Referencia de configuración en la documentación de Amazon Redshift.	Administrador de base de datos

Tarea	Descripción	Habilidades requeridas
Cree tablas manualmente con DDL en Amazon Redshift.	(Opcional) Si utiliza AWS SCT, las tablas se crean automáticamente. Sin embargo, si se producen errores al replicar DDLs, tendrá que crear las tablas manualmente	Administrador de base de datos
Crear tablas externas para Redshift Spectrum.	Cree una tabla externa con un esquema externo para Amazon Redshift Spectrum. Para crear tablas externas, debe ser el propietario del esquema externo o un superusuario de base de datos. Para obtener más información, consulte Creación de tablas externas para Amazon Redshift Spectrum en la documentación de Amazon Redshift.	Administrador de base de datos

Tarea

Descripción

Habilidades requeridas

Cree tablas manualmente con DDL en Amazon Redshift.

(Opcional) Si utiliza AWS SCT, las tablas se crean automáticamente. Sin embargo, si se producen errores al replicar DDLs, tendrá que crear las tablas manualmente

Administrador de base de datos

Crear tablas externas para Redshift Spectrum.

Cree una tabla externa con un esquema externo para Amazon Redshift Spectrum. Para crear tablas externas, debe ser el propietario del esquema externo o un superusuario de base de datos.

Para obtener más información, consulte Creación de tablas externas para Amazon Redshift Spectrum en la documentación de Amazon Redshift.

Administrador de base de datos

Tarea Descripción Habilidades requeridas

Tarea	Descripción	Habilidades requeridas
Utilice AWS DMS para migrar los datos.	Tras crear el DDL de las tablas en la base de datos de Amazon Redshift, migre sus datos a Amazon Redshift mediante AWS DMS. Para obtener instrucciones y pasos detallados, consulte Uso de una base de datos de Amazon Redshift como destino de AWS DMS en la documentación de AWS DMS.	Administrador de base de datos
Uso del comando COPY para cargar datos.	Utilice el comando `COPY` de Amazon Redshift para cargar los datos desde Amazon S3 a Amazon Redshift. Para obtener más información, consulte Uso del comando COPIAR para cargar desde Amazon S3 en la documentación de Amazon Redshift.	Administrador de base de datos

Utilice AWS DMS para migrar los datos.

Tras crear el DDL de las tablas en la base de datos de Amazon Redshift, migre sus datos a Amazon Redshift mediante AWS DMS.

Para obtener instrucciones y pasos detallados, consulte Uso de una base de datos de Amazon Redshift como destino de AWS DMS en la documentación de AWS DMS.

Administrador de base de datos

Uso del comando COPY para cargar datos.

Utilice el comando COPY de Amazon Redshift para cargar los datos desde Amazon S3 a Amazon Redshift.

Para obtener más información, consulte Uso del comando COPIAR para cargar desde Amazon S3 en la documentación de Amazon Redshift.

Administrador de base de datos

Tarea	Descripción	Habilidades requeridas
Valide los registros de origen y destino.	Valide el recuento de tablas de los registros de origen y destino que se cargaron desde el sistema de origen.	Administrador de base de datos
Implemente las prácticas recomendadas de Amazon Redshift para el ajuste del rendimiento.	Implemente las prácticas recomendadas de Amazon Redshift para el diseño de tablas y bases de datos. Para obtener más información, consulte la siguiente entrada del blog: Las 10 técnicas principales de ajuste del rendimiento de Amazon Redshift.	Administrador de base de datos
Optimizar el rendimiento de la consulta.	Amazon RedShift utiliza consultas basadas en SQL para interactuar con datos y objetos en el sistema. El Data Manipulation Language (DML, Lenguaje de manipulación de datos) es el subconjunto de SQL que el usuario utiliza para ver, añadir, cambiar y eliminar datos. DDL es el subconjunto de SQL que el usuario utiliza para añadir, cambiar y eliminar objetos de la base de datos como tablas y vistas. Para obtener más información, consulte Ajuste del rendimiento de las consultas en la documentación de Amazon Redshift.	Administrador de base de datos
Implemente WLM.	Puede utilizar workload management (WLM) para definir varias colas de consultas y dirigir las consultas a las colas adecuadas en tiempo de ejecución. Para obtener más información, consulte Implementación de la administración de la carga de trabajo en la documentación de Amazon Redshift.	Administrador de base de datos
Trabajar con escalado de concurrencia.	Al usar la característica de escalado de concurrencia, puede admitir usuarios concurrentes prácticamente ilimitados y consultas concurrentes, con un rendimiento de consulta consistentemente rápido. Para obtener más información, consulte Uso del escalado de simultaneidad en la documentación de Amazon Redshift.	Administrador de base de datos
Use las prácticas recomendadas de Amazon RedShift para el diseño de tablas.	Cuando planifica su base de datos, ciertas decisiones importantes de diseño de tabla pueden influir considerablemente en el rendimiento general de la consulta. Para obtener más información sobre seleccionar la opción de diseño de tablas más adecuada, consulte Prácticas recomendadas de Amazon Redshift para el diseño de tablas en la documentación de Amazon Redshift.	Administrador de base de datos
Crear vistas materializadas en Amazon Redshift.	Una vista materializada contiene un conjunto de resultados computados previamente, basados en una consulta de SQL sobre una o más tablas base. Puede emitir instrucciones `SELECT` para consultar una vista materializada, de la misma manera que puede consultar otras tablas o vistas en la base de datos. Para obtener más información, consulte Creación de vistas materializadas en Amazon Redshift en la documentación de Amazon Redshift.	Administrador de base de datos
Defina las uniones entre las tablas.	Para buscar en más de una tabla al mismo tiempo ThoughtSpot, debe definir las uniones entre las tablas especificando columnas que contengan datos coincidentes en dos tablas. Estas columnas representan la `primary key` y `foreign key` de la unión. Puede definirlos mediante el `ALTER TABLE` comando de Amazon Redshift o. ThoughtSpot Para obtener más información, consulte ALTER TABLE en la documentación de Amazon RedShift.	Administrador de base de datos

Tarea	Descripción	Habilidades requeridas
Añada una conexión de Amazon Redshift.	Añada una conexión Amazon Redshift a su base de datos Falcon local. ThoughtSpot Para obtener más información, consulte Añadir una conexión Amazon Redshift en la ThoughtSpot documentación.	Administrador de base de datos
Edite la conexión de Amazon Redshift.	Puede editar la conexión de Amazon Redshift para añadir tablas y columnas. Para obtener más información, consulte Edición de una conexión de Amazon Redshift en la ThoughtSpot documentación.	Administrador de base de datos
Reasigne la conexión de Amazon Redshift.	Modifique los parámetros de conexión editando el archivo .yaml de asignación de origen que se creó al añadir la conexión de Amazon Redshift. Por ejemplo, puede reasignar la tabla o columna existente a una tabla o columna diferente en una conexión de base de datos existente. ThoughtSpot recomienda comprobar las dependencias antes y después de volver a mapear una tabla o columna de una conexión para asegurarse de que se muestran según sea necesario. Para obtener más información, consulte Remapear una conexión de Amazon Redshift en ThoughtSpot la documentación.	Administrador de base de datos
Elimine una tabla de la conexión de Amazon Redshift.	(Opcional) Si intenta eliminar una tabla de una conexión de Amazon Redshift, ThoughtSpot comprueba las dependencias y muestra una lista de objetos dependientes. Puede elegir los objetos de la lista para eliminarlos o eliminar la dependencia. A continuación puede eliminar la tabla. Para obtener más información, consulte Eliminar una tabla de una conexión de Amazon Redshift en la ThoughtSpot documentación.	Administrador de base de datos
Elimine una tabla con objetos dependientes de una conexión de Amazon Redshift.	(Opcional) Si intenta eliminar una tabla con objetos dependientes, la operación se bloquea. Se muestra una ventana `Cannot delete` con una lista de enlaces a objetos dependientes. Cuando se eliminen todas las dependencias, podrá eliminar la tabla Para obtener más información, consulte Eliminar una tabla con objetos dependientes de una conexión de Amazon Redshift en la ThoughtSpot documentación.	Administrador de base de datos
Elimine una conexión de Amazon Redshift.	(Opcional) Como una conexión se puede utilizar en varios orígenes de datos o visualizaciones, debe eliminar todas las fuentes y tareas que utilizan esa conexión antes de poder eliminar la conexión de Amazon Redshift. Para obtener más información, consulte Eliminar una conexión de Amazon Redshift en la ThoughtSpot documentación.	Administrador de base de datos
Compruebe la referencia de conexión de Amazon Redshift.	Asegúrese de proporcionar la información requerida para su conexión a Amazon Redshift utilizando la referencia de conexión de la documentación. ThoughtSpot	Administrador de base de datos

Información adicional

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Migración de una base de datos de SQL Server de Amazon EC2 a Amazon DocumentDB

Migración de una base de datos de Oracle a Amazon RDS para PostgreSQL