Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Genere información sobre z/OS datos de Db2 mediante AWS Mainframe Modernization Amazon Q en Quick Sight
Shubham Roy, Roshna Razack y Santosh Kumar Singh, Amazon Web Services
Resumen
Nota: AWS Mainframe Modernization El servicio (experiencia de entorno de ejecución gestionado) ya no está abierto a nuevos clientes. Para obtener funciones similares a las AWS Mainframe Modernization de Service (experiencia en entornos de ejecución gestionados), explore AWS Mainframe Modernization Service (experiencia autogestionada). Los clientes existentes pueden seguir utilizando el servicio con normalidad. Para obtener más información, consulte Cambio en la disponibilidad de AWS Mainframe Modernization.
Si su organización aloja datos críticos para la empresa en un entorno de mainframe IBM Db2, obtener información a partir de esos datos es fundamental para impulsar el crecimiento y la innovación. Al desbloquear los datos del mainframe, puede crear inteligencia empresarial más rápida, segura y escalable para acelerar la toma de decisiones, el crecimiento y la innovación basados en los datos en la nube de Amazon Web Services (AWS).
Este patrón presenta una solución para generar información empresarial y crear narrativas compartibles a partir de datos de mainframe en IBM Db2 for tables. z/OS Los cambios en los datos del mainframe se transmiten al tema de Amazon Managed Streaming para Apache Kafka (Amazon MSK) mediante la replicación de datos de AWS Mainframe Modernization con Precisely. Mediante la ingesta de transmisión de Amazon Redshift, los datos de los temas de Amazon MSK se almacenan en tablas de almacenes de datos de Amazon Redshift sin servidor para su análisis en Amazon QuickSight.
Una vez que los datos estén disponibles en QuickSight, puede utilizar las peticiones en lenguaje natural con Amazon Q en QuickSight para crear resúmenes de los datos, formular preguntas y generar historias basadas en datos. No tiene que escribir consultas SQL ni aprender una herramienta de inteligencia empresarial (BI).
Contexto empresarial
Este patrón presenta una solución para casos de uso de análisis de datos e información de datos de mainframe. Con el patrón, puede crear un panel visual para los datos de su empresa. Para demostrar la solución, este patrón utiliza una empresa de atención médica que ofrece planes médicos, dentales y oftalmológicos a sus miembros en los EE. UU. En este ejemplo, la información demográfica y del plan de los miembros se almacena en las tablas de datos de IBM Db2 for. z/OS El panel visual muestra lo siguiente:
Distribución de miembros por región
Distribución de miembros por género
Distribución de miembros por edad
Distribución de miembros por tipo de plan
Miembros que no han completado la inmunización preventiva
Para ver ejemplos de la distribución de los miembros por región y de los miembros que no han completado la inmunización preventiva, consulte la sección de información adicional.
Después de crear el panel, se genera una historia basada en datos que explica la información del análisis anterior. Las historias basadas en datos proporcionan recomendaciones para aumentar el número de miembros que han completado la inmunización preventiva.
Requisitos previos y limitaciones
Requisitos previos
Un activo Cuenta de AWS. Esta solución se creó y probó en Amazon Linux 2 en Amazon Elastic Compute Cloud (Amazon EC2).
Una nube privada virtual (VPC) con una subred a la que puede acceder el sistema de su mainframe.
Una base de datos de mainframe con datos empresariales. Para ver los datos de ejemplo que se utilizan para crear y probar esta solución, consulte la sección de archivos adjuntos.
La captura de datos de cambios (CDC) está habilitada en las z/OS tablas de Db2. Para habilitar la CDC en Db2 z/OS, consulte la documentación de IBM
. Precisamente Connect CDC z/OS se instala en el z/OS sistema que aloja las bases de datos de origen. La z/OS imagen CDC for de Precision Connect se proporciona como un archivo zip dentro de la imagen Amazon Machine Image AWS Mainframe Modernization (AMI) de Data Replication for IBM z/OS
. Para instalar Precily Connect CDC for z/OS en el mainframe, consulte la documentación de instalación de Precision .
Limitaciones
Los datos de Db2 de su mainframe deben estar en un tipo de datos compatible con Precisely Connect CDC. Para obtener una lista de los tipos de datos compatibles, consulte la documentación de Precisely Connect CDC
. Los datos de Amazon MSK deben estar en un tipo de datos compatible con Amazon Redshift. Para obtener una lista de los tipos de datos compatibles, consulte la documentación de Amazon Redshift.
Amazon Redshift tiene diferentes comportamientos y límites de tamaño para los distintos tipos de datos. Para obtener más información, consulte la documentación de Amazon Redshift.
Los datos casi en tiempo real de QuickSight dependen del intervalo de actualización establecido para la base de datos de Amazon Redshift.
Algunas Servicios de AWS no están disponibles en todas Regiones de AWS. Para obtener información sobre la disponibilidad en regiones, consulte Servicios de AWS by Region
. Amazon Q en QuickSight no está disponible actualmente en todas las regiones que admiten QuickSight. Para ver los puntos de conexión específicos, consulte la página Service endpoints and quotas y elija el enlace del servicio.
Versiones de producto
AWS Mainframe Modernization Replicación de datos con la versión 4.1.44 de Precision
Python, versión 3.6 o posterior
Apache Kafka versión 3.5.1
Arquitectura
Arquitectura de destino
El siguiente diagrama muestra una arquitectura para generar información empresarial a partir de datos del mainframe mediante la replicación de datos de AWS Mainframe Modernization con Precisely

En el diagrama, se muestra el siguiente flujo de trabajo:
El agente de lectura de registro de Precisely lee los datos de los registros de Db2 y los escribe en un almacenamiento transitorio de un sistema de archivos OMVS del mainframe.
El agente publicador lee los registros de Db2 sin procesar del almacenamiento transitorio.
El daemon del controlador en las instalaciones autentica, autoriza, supervisa y administra las operaciones.
El Apply Agent se implementa en Amazon EC2 mediante la AMI preconfigurada. Se conecta con el agente publicador a través del daemon del controlador mediante TCP/IP. El agente de aplicación envía los datos a Amazon MSK mediante varios trabajadores para lograr un alto rendimiento.
Los trabajadores escriben los datos en el tema de Amazon MSK en formato JSON. Como objetivo intermedio para los mensajes replicados, Amazon MSK ofrece capacidades de conmutación por error automatizadas y de alta disponibilidad.
La ingesta de transmisión de Amazon Redshift proporciona una ingesta de datos de alta velocidad y baja latencia de Amazon MSK a una base de datos de Amazon Redshift sin servidor. Un procedimiento almacenado en Amazon Redshift realiza la reconciliación de los datos de cambios (insert/update/deletes) del mainframe en tablas de Amazon Redshift. Estas tablas de Amazon Redshift sirven como origen de análisis de datos para QuickSight.
Los usuarios acceden a los datos en QuickSight para obtener análisis e información. Puede usar Amazon Q en QuickSight para interactuar con los datos mediante peticiones en lenguaje natural.
Tools (Herramientas)
Servicios de AWS
Amazon Elastic Compute Cloud (Amazon EC2) proporciona una capacidad informática escalable en el Nube de AWS. Puede iniciar tantos servidores virtuales como necesite y escalarlos o reducirlos horizontalmente con rapidez.
AWS Key Management Service (AWS KMS) le ayuda a crear y controlar claves criptográficas para proteger sus datos.
Amazon Managed Streaming para Apache Kafka (Amazon MSK) es un servicio completamente administrado que le permite crear y ejecutar aplicaciones que utilizan Apache Kafka para procesar datos de streaming.
Amazon QuickSight es un servicio de inteligencia empresarial (BI) a escala de la nube que lo ayuda a visualizar, analizar y generar informes de sus datos en un único panel. Este patrón utiliza las capacidades de BI generativa de Amazon Q en QuickSight.
Amazon Redshift sin servidor
es una opción sin servidor de Amazon Redshift que hace que sea más eficiente ejecutar y escalar los análisis en cuestión de segundos sin necesidad de configurar y administrar la infraestructura del almacén de datos. AWS Secrets Manager lo ayuda a reemplazar las credenciales codificadas en su código, incluidas contraseñas, con una llamada a la API de Secrets Manager para recuperar el secreto mediante programación.
Otras herramientas
Precisely Connect CDC
recopila e integra datos de sistemas heredados en plataformas de datos y en la nube.
Repositorio de código
El código de este patrón está disponible en el repositorio GitHub Mainframe_ DataInsights _change_data_reconciliation
Prácticas recomendadas
Siga las prácticas recomendadas al configurar su clúster de Amazon MSK.
Siga las prácticas recomendadas de análisis de datos de Amazon Redshift para mejorar el rendimiento
Al crear los roles AWS Identity and Access Management (IAM) para la configuración de Precially, siga el principio de privilegios mínimos y conceda los permisos mínimos necesarios para realizar una tarea. Para obtener más información, consulte Otorgar privilegio mínimo y Prácticas recomendadas de seguridad en la documentación de IAM.
Epics
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure un grupo de seguridad. | Para conectarse al daemon del controlador y al clúster de Amazon MSK, cree un grupo de seguridad para la EC2 instancia. Agregue las siguientes reglas de entrada y salida:
Anote el nombre del grupo de seguridad. Deberá hacer referencia al nombre cuando lance la EC2 instancia y configure el clúster de Amazon MSK. | DevOps ingeniero, AWS DevOps |
Cree una política de IAM y un rol de IAM. |
| DevOps ingeniero, administrador de sistemas de AWS |
Aprovisione una EC2 instancia. | Para aprovisionar una EC2 instancia para ejecutar Precily CDC y conectarse a Amazon MSK, haga lo siguiente:
| Administrador DevOps e ingeniero de AWS |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Cree el clúster de Amazon MSK. | Para crear un clúster de Amazon MSK, haga lo siguiente:
Un clúster aprovisionado típico tarda hasta 15 minutos en crearse. Una vez creado el clúster, su estado cambia de Creando a Activo. | AWS DevOps, administrador de la nube |
Configure la SASL/SCRAM autenticación. | Para configurar la SASL/SCRAM autenticación de un clúster de Amazon MSK, haga lo siguiente:
| Arquitecto de la nube |
Cree el tema de Amazon MSK. | Para crear el tema de Amazon MSK, haga lo siguiente:
| Administrador de la nube |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure los scripts de Precisely para replicar los cambios en los datos. | Para configurar los scripts de Precisely Connect CDC para replicar los datos modificados del mainframe al tema de Amazon MSK, haga lo siguiente:
Para archivos .ddl de ejemplo, consulte la sección Información adicional. | Desarrollador de aplicaciones, arquitecto de la nube |
Genere la clave ACL de red. | Para generar la clave de lista de control de acceso de la red (ACL de la red), haga lo siguiente:
| Arquitecto de nube, AWS DevOps |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure los valores predeterminados en la pantalla del ISPF. | Para configurar los ajustes predeterminados en el Interactive System Productivity Facility (ISPF), siga las instrucciones de la documentación de Precisely | Administrador del sistema de mainframe |
Configure el daemon del controlador. | Para configurar el daemon del controlador, haga lo siguiente:
| Administrador del sistema de mainframe |
Configure el publicador. | Para configurar el publicador, haga lo siguiente:
| Administrador del sistema de mainframe |
Actualice el archivo de configuración del daemon. | Para actualizar los detalles del publicador en el archivo de configuración del daemon del controlador, haga lo siguiente:
| Administrador del sistema de mainframe |
Cree el trabajo para iniciar el daemon del controlador. | Para crear el trabajo, haga lo siguiente:
| Administrador del sistema de mainframe |
Genere el archivo JCL del publicador de capturas. | Para generar el archivo JCL del publicador de capturas, haga lo siguiente:
| Administrador del sistema de mainframe |
Compruebe y actualice las CDC. |
| Administrador del sistema de mainframe |
Envíe los archivos JCL. | Envíe los siguientes archivos JCL que ha configurado en los pasos anteriores:
Tras enviar los archivos JCL, puede iniciar el motor de aplicación en Precily en la EC2 instancia. | Administrador del sistema de mainframe |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Inicie el motor de aplicación y valide la CDC. | Para iniciar el motor de aplicación en la EC2 instancia y validar el CDC, haga lo siguiente:
| Arquitecto de la nube, desarrollador de aplicaciones |
Valide los registros del tema de Amazon MSK. | Para leer el mensaje del tema de Kafka, haga lo siguiente:
| Desarrollador de aplicaciones, arquitecto de la nube |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure Amazon Redshift sin servidor. | Para crear un almacén de datos de Amazon Redshift sin servidor, siga las instrucciones de la documentación de AWS En el panel de Amazon Redshift sin servidor, compruebe que el espacio de nombres y el grupo de trabajo se crearon y están disponibles. Para este patrón de ejemplo, el proceso puede tardar entre 2 y 5 minutos. | Ingeniero de datos |
Configure el rol de IAM y la política de confianza necesarios para la ingesta de transmisión. | Para configurar la ingesta de transmisión de Amazon Redshift sin servidor desde Amazon MSK, haga lo siguiente:
| Ingeniero de datos |
Conecte Amazon Redshift sin servidor a Amazon MSK. | Para conectarse al tema de Amazon MSK, cree un esquema externo en Amazon Redshift sin servidor. En el editor de consultas V2 de Amazon Redshift, ejecute el siguiente comando SQL y, a continuación, sustituya
| Ingeniero de migraciones |
Cree una vista materializada. | Para consumir los datos del tema de Amazon MSK en Amazon Redshift sin servidor, cree una vista materializada. En el editor de consultas V2 de Amazon Redshift, ejecute los siguientes comandos de SQL y sustituya
| Ingeniero de migraciones |
Cree tablas de destino en Amazon Redshift. | Las tablas de Amazon Redshift proporcionan la entrada para QuickSight. Este patrón utiliza las tablas Para crear las dos tablas en Amazon Redshift, ejecute los siguientes comandos de SQL en el editor de consultas V2 de Amazon Redshift:
| Ingeniero de migraciones |
Cree un procedimiento almacenado en Amazon Redshift. | Este patrón utiliza un procedimiento almacenado para sincronizar los datos de cambios ( Para crear el procedimiento almacenado en Amazon Redshift, utilice el editor de consultas v2 para ejecutar el código del procedimiento almacenado que se encuentra en el GitHub repositorio. | Ingeniero de migraciones |
Lea la vista materializada de la transmisión y cárguela en las tablas de destino. | El procedimiento almacenado lee los cambios de datos de la vista materializada de transmisión y carga los cambios de datos en las tablas de destino. Para ejecutar el procedimiento almacenado, use el siguiente comando:
Puede utilizar Amazon EventBridge Otra opción es utilizar el editor de consultas V2 de Amazon Redshift para programar la actualización. Para obtener más información, consulte Consultas programadas con el editor de consultas v2. | Ingeniero de migraciones |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure QuickSight. | Para configurar QuickSight, siga las instrucciones de la documentación de AWS. | Ingeniero de migraciones |
Configure una conexión segura entre QuickSight y Amazon Redshift. | Para configurar una conexión segura entre QuickSight y Amazon Redshift, haga lo siguiente:
| Ingeniero de migraciones |
Cree un conjunto de datos para QuickSight. | Para crear un conjunto de datos para QuickSight desde Amazon Redshift, haga lo siguiente:
| Ingeniero de migraciones |
Una el conjunto de datos. | Para crear análisis en QuickSight, combine las dos tablas; para ello, siga las instrucciones de la documentación de AWS. En el panel Configuración de unión, elija Izquierda en Tipo de unión. En Cláusulas de unión, utilice | Ingeniero de migraciones |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure Amazon Q en QuickSight. | Para configurar la capacidad de BI generativa de Amazon Q in QuickSight, siga las instrucciones de la documentación de AWS. | Ingeniero de migraciones |
Analice los datos del mainframe y cree un panel visual. | Para analizar y visualizar sus datos en QuickSight, haga lo siguiente:
Cuando termine, puede publicar el panel de control para compartirlo con otras personas de su organización. Para ver ejemplos, consulte el panel visual del mainframe en la sección de información adicional. | Ingeniero de migraciones |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Cree una historia basada en datos. | Cree una historia basada en datos para explicar la información del análisis anterior y genere una recomendación para aumentar la inmunización preventiva de los miembros:
| Ingeniero de migraciones |
Vea la historia basada en datos generada. | Para ver la historia basada en datos generada, selecciónela en la página de Historias basadas en datos. | Ingeniero de migraciones |
Edite una historia basada en datos generada. | Para cambiar el formato, el diseño o los elementos visuales de una historia basada en datos, siga las instrucciones de la documentación de AWS. | Ingeniero de migraciones |
Comparta una historia basada en datos. | Para compartir una historia basada en datos, siga las instrucciones de la documentación de AWS. | Ingeniero de migraciones |
Resolución de problemas
| Problema | Solución |
|---|---|
Se ha producido el error |
|
Al intentar iniciar el motor de aplicación en la EC2 instancia, aparece el siguiente error:
| Para exportar la ruta de instalación de
|
Al intentar iniciar el motor de aplicación, se produce uno de los siguientes errores de conexión:
| Compruebe el spool del mainframe para asegurarse de que los trabajos del daemon del controlador se estén ejecutando. |
Recursos relacionados
Genere información mediante AWS Mainframe Modernization Amazon Q en Quick Sight (patrón)
Genere información de datos con AWS Mainframe Modernization Amazon Q en Quick Sight
(demostración) AWS Mainframe Modernization - Replicación de datos para IBM z/OS
Ingesta de transmisión de Amazon Redshift a una vista materializada
Información adicional
Ejemplo: archivos .ddl
members_details.ddl
CREATE TABLE MEMBER_DTLS ( memberid INTEGER NOT NULL, member_name VARCHAR(50), member_type VARCHAR(20), age INTEGER, gender CHAR(1), email VARCHAR(100), region VARCHAR(20) );
member_plans.ddl
CREATE TABLE MEMBER_PLANS ( memberid INTEGER NOT NULL, medical_plan CHAR(1), dental_plan CHAR(1), vision_plan CHAR(1), preventive_immunization VARCHAR(20) );
Ejemplo de archivo .sqd
Sustituya <kafka topic name> por el nombre de su tema de Amazon MSK.
script.sqd
-- Name: DB2ZTOMSK: DB2z To MSK JOBNAME DB2ZTOMSK;REPORT EVERY 1;OPTIONS CDCOP('I','U','D');-- Source Descriptions JOBNAME DB2ZTOMSK; REPORT EVERY 1; OPTIONS CDCOP('I','U','D'); -- Source Descriptions BEGIN GROUP DB2_SOURCE; DESCRIPTION DB2SQL /var/precisely/di/sqdata/apply/DB2ZTOMSK/ddl/mem_details.ddl AS MEMBER_DTLS; DESCRIPTION DB2SQL /var/precisely/di/sqdata/apply/DB2ZTOMSK/ddl/mem_plans.ddl AS MEMBER_PLANS; END GROUP; -- Source Datastore DATASTORE cdc://<zos_host_name>/DB2ZTOMSK/DB2ZTOMSK OF UTSCDC AS CDCIN DESCRIBED BY GROUP DB2_SOURCE ; -- Target Datastore(s) DATASTORE 'kafka:///<kafka topic name>/key' OF JSON AS TARGET DESCRIBED BY GROUP DB2_SOURCE; PROCESS INTO TARGET SELECT { REPLICATE(TARGET) } FROM CDCIN;
Panel visual de mainframe
Amazon Q creó el siguiente elemento visual de datos en QuickSight para la pregunta de análisis show member distribution by region.

Amazon Q creó el siguiente elemento visual de datos en QuickSight para la pregunta show member distribution by Region who have not completed preventive immunization, in pie chart.

Salida de una historia basada en datos
Las siguientes capturas de pantalla muestran secciones de la historia basada en datos creada por Amazon Q en QuickSight para la petición Build a data story about Region with most numbers of members. Also show the member distribution by age, member distribution by gender. Recommend how to motivate members to complete immunization. Include 4 points of supporting data for this pattern.
En la introducción, la historia basada en datos recomienda elegir la región con más miembros para obtener el mayor impacto de las iniciativas de inmunización.

La historia basada en datos proporciona un análisis del número de miembros de las cuatro regiones. Las regiones noreste, sudoeste y sureste son las que tienen más miembros.

La historia basada en datos presenta un análisis de los miembros por edad.

La historia basada en datos se centra en las iniciativas de inmunización en el medio oeste.


Conexiones
Para acceder al contenido adicional asociado a este documento, descomprima el archivo: attachment.zip