Investigaciones de CloudWatch - Amazon CloudWatch

Investigaciones de CloudWatch

La característica de investigaciones de CloudWatch es un asistente que usa IA generativa para ayudar a responder ante los incidentes en un sistema. Utiliza la IA generativa para analizar la telemetría del sistema y obtener rápidamente sugerencias y datos de telemetría que puedan estar relacionados con el problema. Entre estas sugerencias se incluyen métricas, registros, eventos de implementación e hipótesis sobre causas principales con representaciones visuales cuando se utilizan varios recursos. Si desea obtener una lista completa de los tipos de datos que el asistente de IA puede mostrar, consulte Información que las investigaciones de CloudWatch pueden obtener en las investigaciones.

Puede llevar a cabo investigaciones sin ninguna configuración adicional en la solución de problemas operativos de CloudWatch. Al iniciar una investigación, Investigaciones de CloudWatch utiliza los permisos asociados al usuario que ha iniciado sesión para investigar y analizar los recursos asociados a la alarma, las métricas o la consulta de Información de registros y ofrecer sugerencias de solución de problemas. La investigación no crea ningún recurso y todas las acciones que lleva a cabo Investigaciones de CloudWatch se registran en CloudTrail para garantizar su seguimiento. La investigación le proporciona la siguiente información para que pueda solucionar problemas operativos:

  • Visualización de observaciones, sugerencias e hipótesis generadas por IA

  • Acceso a representaciones visuales de hipótesis de múltiples recursos

  • Revisión de las explicaciones en lenguaje natural y el análisis de causa raíz

  • Acceso al análisis de IA de los datos de telemetría, lo que incluye las métricas, los registros, los eventos de implementación, los eventos de AWS Health, los eventos de cambios de CloudTrail, los datos de rastros de X-Ray y las consultas de Información de registros de CloudWatch

    La configuración de Investigaciones de CloudWatch le proporcionará investigaciones más exhaustivas.

Al configurar Investigaciones de CloudWatch, estas tienen las siguientes capacidades adicionales:

  • Aceptación o descarte de sugerencias y observaciones

    Para cada sugerencia, decide si desea agregarla a los resultados de la investigación o descartarla. Esto ayuda a que las investigaciones de CloudWatch refinen e iteren la causa principal del problema. Las investigaciones de CloudWatch pueden ayudar a encontrar la causa principal sin tener que identificar y consultar manualmente varias métricas ni otros orígenes de telemetría y eventos. Una incidencia de solución de problemas que habría tardado horas de búsqueda y cambio entre distintas consolas se puede solucionar en mucho menos tiempo.

  • Configuración del acceso entre cuentas

    Utilice la observabilidad entre cuentas de CloudWatch para permitir que la investigación recopile datos de otras cuentas de origen.

  • Adición de nuevos orígenes de telemetría a la investigación

    Agregar datos del historial de eventos de CloudTrail ayuda a Investigaciones de CloudWatch a asociar los problemas a los eventos de cambios. La adición de X-Ray proporciona una mejor topología y asignación de aplicaciones. También puede agregar datos de Application Signals para profundizar en el estado de las aplicaciones y los servicios mediante la combinación de esa telemetría con los demás orígenes de telemetría. Si utiliza clústeres de Amazon EKS, puede otorgar a Investigaciones de CloudWatch acceso a sus recursos de EKS para proporcionar información más detallada sobre los recursos del clúster que podrían estar involucrados en el problema que se está investigando.

  • Adición de notas o comentarios a los resultados de la investigación

    Permite proporcionar un contexto adicional a los resultados de la investigación para verlos en perspectiva durante la presentación de informes o la auditoría.

  • Ejecución de correcciones sugeridas en el manual de procedimientos

    Investigaciones de CloudWatch puede sugerirle utilizar un manual de procedimientos de Automatización para intentar resolver el problema automáticamente. Automatización es una capacidad de Systems Manager, otro servicio de AWS. Los runbooks de Automatización definen una serie de pasos, o acciones, que se ejecutarán en los recursos que seleccione. Cada runbook está diseñado para abordar un problema específico.

  • Uso compartido de los resultados de la investigación con los miembros del equipo

    Sin una configuración adicional, la investigación se vincula a la sesión del usuario que ha iniciado sesión. Los demás usuarios no pueden ver los resultados de la investigación ni continuar con la investigación. Después de configurar CloudWatch, las investigaciones están disponibles para todos los usuarios de la cuenta que cuenten con los permisos necesarios.

  • Finalización, archivado o reapertura de la investigación manualmente

    Antes de configurar Investigaciones de CloudWatch en la cuenta, las investigaciones se ejecutan una vez y, a continuación, se completan. Después de configurar Investigaciones de CloudWatch, las investigaciones pueden continuar hasta que se resuelvan. Una vez resuelto el problema, la investigación se archiva. Si resolvió el problema, pero las condiciones que provocaron la investigación siguen presentes, puede cerrarla manualmente. Si las condiciones vuelven a surgir, puede reiniciar (o reabrir) la investigación.

  • Informes de investigaciones

    Al completar una investigación, puede generar un informe de investigación exhaustivo que recopile automáticamente todos los resultados de la investigación, los eventos cronológicos y las acciones recomendadas.

La configuración de Investigaciones de CloudWatch crea un grupo de investigación en la cuenta. Cada cuenta puede tener un grupo de investigación con hasta 2 investigaciones activas simultáneas en el grupo de investigación. Cada mes, cada cuenta puede crear hasta 150 investigaciones mejoradas con análisis de IA. Los grupos de investigación son configuraciones de cuenta. Cuando se crea un grupo de investigación en una cuenta, se utiliza con todas las investigaciones iniciadas en la cuenta.

nota

Al configurar Investigaciones de CloudWatch, CloudWatch utilizará el rol de IAM proporcionado para analizar periódicamente los recursos de la cuenta con el fin de asignar los recursos y la telemetría. Algunos servicios, como Lambda, invocan la API de descifrado de KMS en nombre de CloudWatch para determinadas llamadas a la API relacionadas con la descripción o la enumeración de recursos. Este proceso en segundo plano se realiza para garantizar que la topología refleje el estado más reciente de la cuenta y sus dependencias. Esta actualización se produce independientemente de si hay una investigación activa o no.