Investigación de los problemas operativos de su entorno - Amazon CloudWatch

Investigación de los problemas operativos de su entorno

Creación de una investigación

Creación de una investigación desde una página de consola de AWS

Puede iniciar una investigación desde varias consolas de AWS, lo que incluye, entre otras, las páginas de alarmas de CloudWatch, las páginas de métricas de CloudWatch y las páginas de supervisión de Lambda.

Para iniciar una investigación desde una página de consola de AWS
  1. En Nivel de cuenta, seleccione el gráfico de la métrica o alarma que quiere investigar.

  2. Si en la parte superior de la página se muestra el botón Investigar, elíjalo y, a continuación, elija Iniciar una nueva investigación.

    De lo contrario, elija el ícono del menú de puntos suspensivos verticales Depicts the appearance of the vertical ellipsis icon on the console para la métrica y elija Investigar y, luego, Iniciar una nueva investigación.

  3. En el panel Investigación, introduzca un nombre para la investigación en Título de la nueva investigación y, si lo desea, escriba notas sobre la métrica o alarma seleccionada.

  4. A continuación, seleccione Iniciar investigación.

    Inicia la investigación. Las investigaciones de CloudWatch escanean los datos de telemetría para encontrar datos que puedan estar asociados a esta situación.

  5. Para trasladar los datos de la investigación al panel más grande, elija Abrir en página completa.

  6. Para obtener instrucciones detalladas sobre los pasos que puede seguir mientras continúa la investigación, consulte Visualización y continuación de una investigación abierta.

Creación de una investigación desde el chat de Amazon Q

Puede hacer preguntas acerca de problemas de implementación en el chat de investigaciones de CloudWatch. La pregunta podría ser algo parecido a “¿Por qué mi función de Lambda está lenta?”

Si lo hace, las investigaciones de CloudWatch podrían hacer preguntas de seguimiento y comprobar el estado del problema. Tras la comprobación de estado, el chat le preguntará si quiere iniciar una investigación.

Para obtener más información y más preguntas de muestra, consulte Chat con Amazon Q sobre AWS.

Para obtener instrucciones detalladas sobre los pasos que puede seguir mientras continúa la investigación después de haberse iniciado, consulte Visualización y continuación de una investigación abierta.

Creación de una investigación a partir de una acción de alarma de CloudWatch

Al crear una alarma de CloudWatch, puede especificar que se inicie automáticamente una investigación cuando entre en estado ALARMA. Puede hacer esto para las alarmas de métricas y las alarmas compuestas. Para obtener más información acerca de la creación de alarmas, consulte Alarmas y métricas y Crear una alarma compuesta.

Visualización y continuación de una investigación abierta

Siga los pasos de esta sección para ver y continuar una investigación en curso.

Para ver y continuar una investigación
  1. Si aún no ha abierto la página de la investigación, haga lo siguiente:

    1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

    2. En el panel de navegación izquierdo, elija Operaciones de IA, Investigaciones.

    3. Elija el nombre de la investigación.

  2. La sección Fuente muestra los elementos que se han agregado a los resultados de la investigación, tal como la métrica o alarma que se seleccionó originalmente para iniciar la investigación.

    El panel de la derecha incluye pestañas. Elija la pestaña Sugerencias.

  3. La pestaña Sugerencias muestra observaciones de otros tipos de telemetría que las investigaciones de CloudWatch han encontrado y que podrían estar relacionados con la investigación. También podría incluir hipótesis, que son posibles motivos o causas principales que las investigaciones de CloudWatch hayan encontrado para la situación.

    Las investigaciones de CloudWatch escriben tanto las observaciones como las hipótesis en lenguaje natural.

    Dispone de varias opciones para hacerlo:

    • Para cada sugerencia, puede elegir Aceptar o Descartar.

      Si selecciona Aceptar, la sugerencia se agrega a la sección Fuente y las investigaciones de CloudWatch utilizan esta información para dirigir el análisis y las sugerencias adicionales.

      Si elige Descartar, la sugerencia se traslada a la pestaña Descartados.

    • En el caso de cada sugerencia de tipo de observación, puede optar por ampliar el gráfico en la pestaña Sugerencias o abrirlo en la consola de CloudWatch para ver más detalles al respecto.

    • Algunas de las observaciones pueden ser el resultado de consultas de Información de registros de CloudWatch que las investigaciones de CloudWatch ejecutaron como parte de la investigación. Cuando una observación es el resultado de una consulta de Información de registros de Amazon CloudWatch, la propia consulta se muestra como parte de la observación. Puede editar la consulta y volver a ejecutarla. Para ello, elija el ícono del menú de puntos suspensivos verticales situado An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page. junto a los resultados y, a continuación, elija Abrir en Logs Insights. Para obtener más información, consulte Análisis de los datos de registros con Información de registros de Amazon CloudWatch.

    • Si conoce la telemetría de un servicio de AWS que podría aplicarse a esta investigación, puede ir a la consola de ese servicio y agregar la telemetría a la investigación. Por ejemplo, para agregar una métrica de Lambda a la investigación, puede hacer lo siguiente:

      1. Abra la consola Lambda.

      2. En la sección Monitorear, busque la métrica.

      3. Abra el menú contextual de puntos suspensivos verticales An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page. de la métrica, elija Investigar y Agregar a la investigación. A continuación, en el panel Investigar, seleccione el nombre de la investigación.

    • Cuando vea una hipótesis en la pestaña Sugerencias, puede elegir Mostrar razonamiento para mostrar los datos que las investigaciones de CloudWatch utilizaron para generar la hipótesis.

    • Puede elegir la pestaña Descartadas y ver las sugerencias que se han descartado anteriormente. Para agregar una de estas a los resultados, elija Restaurar a los resultados.

    • Para agregar notas a los resultados, elija Nueva nota en el panel Fuente. A continuación, introduzca las notas y elija Agregar.

  4. Al agregar una hipótesis al área de Fuente, es posible que se aparezca Mostrar acciones sugeridas. Si es así, al elegir esta opción se muestran las posibles acciones que puede llevar a cabo, suponiendo que la hipótesis sobre el tema sea correcta. Entre las posibles acciones se incluyen las siguientes:

    • Las sugerencias de documentación son enlaces a documentación de AWS que pueden ayudar a entender el problema en el que está trabajando y cómo resolverlo. Para ver la documentación sugerida, elija el enlace Revisar

    • Las sugerencias del runbook son sugerencias que aprovechan los runbooks predefinidos de Automatización de Systems Manager. Cada runbook define una serie de pasos para hacer una tarea en un recurso de AWS.

      importante

      La ejecución de un runbook de Automatización conlleva un costo. Sin embargo, las investigaciones de CloudWatch le proporcionan una vista previa de las acciones que lleva a cabo un manual de procedimientos sugerido, lo que le brinda la oportunidad de evaluar mejor si se debe ejecutar el manual de procedimientos. Para obtener información sobre los precios de Automatización, consulte Precios de AWS Systems Manager para Automatización.

      Para obtener información sobre cómo continuar con una acción del runbook, consulte Revisión y ejecución de las correcciones sugeridas en el manual de procedimientos de las investigaciones de CloudWatch antes de continuar con el siguiente paso de este procedimiento.

  5. Cuando crea que encontró la causa principal del problema, puede elegir la pestaña Descripción general y, a continuación, elegir Generar en la sección Resumen de la investigación. A continuación, las investigaciones de CloudWatch crean un resumen en lenguaje natural de los resultados e hipótesis importantes de la investigación.

    Incluso después de generar un resumen, puede continuar con la investigación. Si lo hace y agrega o elimina resultados de la investigación, siempre puede volver a la pestaña Resumen y seleccionar Generar de nuevo para obtener un resumen actualizado.

  6. Para finalizar una investigación, elija Finalizar investigación y, si lo desea, agregue notas finales. A continuación, elija Guardar.

    El estado de la investigación cambia a Archivado. Para reiniciar las investigaciones archivadas, abra la página de investigación y elija Reiniciar la investigación.

    Le recomendamos que no deje las investigaciones abiertas indefinidamente, ya que las transiciones del estado de alarma relacionadas con la investigación se seguirán agregando a la investigación mientras esté abierta.

nota

En algunos momentos, es posible que vea el mensaje Se completó el análisis. La investigación ha finalizado. que se muestra sobre el área de Fuente. Si, a continuación, agrega más telemetría a los resultados, este mensaje cambiará y las investigaciones de CloudWatch empezarán a escanear la telemetría de nuevo, en función de los nuevos datos que haya agregado a los resultados.

Revisión y ejecución de las correcciones sugeridas en el manual de procedimientos de las investigaciones de CloudWatch

Al agregar una hipótesis al área de Fuente de una investigación activa, las investigaciones de CloudWatch pueden mostrar la opción Mostrar acciones sugeridas. Una acción sugerida podría tratarse de ver la documentación con información que ayude a solucionar un problema de forma manual.

Otra sugerencia podría ser utilizar un runbook de Automatización para intentar resolver el problema automáticamente. Automatización es una funcionalidad de Systems Manager, otro Servicio de AWS. Los runbooks de Automatización definen una serie de pasos, o acciones, que se ejecutarán en los recursos que seleccione. Cada runbook está diseñado para abordar un problema específico. Los runbooks pueden abordar una variedad de necesidades operativas: crear, reparar, reconfigurar, instalar, solucionar problemas, corregir, duplicar, etc. Para obtener más información acerca de Automatización, consulte Integración con Automatización de AWS Systems Manager.

Antes de empezar

Antes de trabajar con los runbooks de Automatización en una investigación, tenga en cuenta las siguientes consideraciones importantes:

  • Si decide ejecutar un runbook, se incurrirá en gastos. Para obtener información, consulte Precios de AWS Systems Manager.

  • Las sugerencias de runbook y causas principales se basan en el razonamiento automatizado y los servicios de inteligencia artificial generativa.

    importante

    Es responsable de las acciones que resulten de la ejecución de los pasos del runbook y de la elección de los valores de los parámetros introducidos durante la ejecución del runbook. Es posible que tenga que editar el runbook sugerido para garantizar que funciona según lo esperado. Para obtener más información, consulte Política de IA responsable de AWS.

  • Según el runbook, es posible que tenga que introducir valores para los parámetros de entrada del runbook antes de que se pueda llevar a cabo la ejecución.

  • El runbook se ejecuta con los permisos de IAM asignados al operador. Si es necesario, inicie sesión con diferentes permisos de IAM para ejecutar el runbook. Además de los permisos para las acciones que se van a llevar a cabo, necesitará permisos adicionales de Systems Manager para ejecutar los pasos del runbook. Para obtener más información, consulte Configuración de la automatización en la Guía del usuario de AWS Systems Manager.

Para revisar y ejecutar las correcciones sugeridas en el manual de procedimientos de las investigaciones de CloudWatch
  1. Para ver información sobre un runbook sugerido, elija Revisar para obtener información sobre cómo ejecutar los pasos del runbook.

    En la página de detalles de la investigación, elija Sugerencias.

  2. En el panel de sugerencias, revise la lista de hipótesis en función del análisis del sistema sobre el problema que se está investigando.

    Para cada hipótesis, puede elegir entre las opciones siguientes:

    • Mostrar razonamiento: vea más información sobre los motivos por los que el sistema ha generado la hipótesis.

    • Ver acciones: vea las acciones sugeridas para el problema. No todas las hipótesis incluirán acciones sugeridas.

    • Aceptar: acepte la hipótesis y agréguela a la sección Fuente de la investigación.

      nota

      Al aceptar la hipótesis, no se ejecuta automáticamente la solución del runbook asociada. Puede ver los manuales de procedimientos sugeridos antes de aceptar una hipótesis, pero debe aceptar la hipótesis para ejecutar un manual de procedimientos.

    • Descartar: rechace la hipótesis y no continúe con ella.

  3. Tras elegir Ver acción, en el panel Acciones sugeridas, revise la lista de acciones sugeridas que puede llevar a cabo para solucionar el problema. Las acciones sugeridas pueden incluir una o varias de las siguientes opciones:

    • Artículos de conocimientos de AWS: proporciona información sobre las medidas que puede tomar para abordar el problema manualmente, además de un enlace a más información.

    • Documentación de AWS: proporciona enlaces a temas de la documentación para el usuario relacionados con el problema.

    • Runbooks propiedad de AWS: enumera uno o más runbooks de Automatización administrados por AWS que puede ejecutar para intentar resolver problemas.

    • Runbooks de su propiedad: muestra uno o varios runbooks de Automatización personalizados y creados por usted o por otra persona de su cuenta u organización, que puede ejecutar para intentar resolver problemas.

      nota

      El sistema genera automáticamente esta lista de runbooks al evaluar las palabras clave de los manuales personalizados y, luego, compararlas con términos relacionados con el problema en investigación.

      Si hay más coincidencias de palabras clave, un runbook personalizado en concreto aparece más arriba en la lista de runbooks de su propiedad.

  4. Tras revisar la hipótesis, para poder examinar más a fondo una acción sugerida específica y leer la documentación relacionada, elija Más información. También puede elegir Revisar detalles para inspeccionar los runbooks sugeridos de propiedad de AWS y de su propiedad.

  5. Al elegir Revisar los detalles de los runbooks, haga lo siguiente:

    1. En Descripción del runbook, revise el contenido, que proporciona información general de las medidas que el runbook puede tomar para corregir el problema en investigación. Elija Ver pasos para visualizar el flujo de trabajo del runbook y profundizar en los detalles de los pasos individuales.

    2. En Parámetros de entrada, especifique los valores de los parámetros requeridos por el runbook. Estos parámetros varían de un runbook a otro.

    3. En Vista previa de ejecución, revise detenidamente la información. En esta información se explica cuál sería el alcance y el impacto que tendría si decidiera ejecutar el runbook.

      El contenido de Vista previa de ejecución proporciona la siguiente información:

      • En cuántas cuentas y regiones se llevaría a cabo la operación del runbook.

      • Los tipos de medidas que se tomarían y la cantidad de cada tipo.

        Los tipos de acción son los siguientes:

        • Mutating: un paso del runbook hará cambios en los destinos mediante acciones que crean, modifican o eliminan recursos.

        • Non-Mutating: un paso del runbook recuperaría los datos sobre los recursos, pero no los modificaría. Por lo general, esta categoría incluye Describe, List, Get y acciones de API similares de solo lectura.

        • Undetermined: un paso indeterminado invoca las ejecuciones que lleva a cabo otro servicio de orquestación, como AWS Lambda, AWS Step Functions o Run Command, una funcionalidad de AWS Systems Manager. Un paso indeterminado también podría llamar a una API de terceros o ejecutar un script de Python o PowerShell. Automatización de Systems Manager no puede detectar cuál sería el resultado de los procesos de orquestación o de las ejecuciones de una API de terceros y, por lo tanto, no puede evaluarlos. Los resultados de esos pasos deberían revisarse manualmente para determinar su impacto.

        Para obtener información sobre las acciones compatibles y sus tipos de impacto, consulte Tipos de impacto de la corrección de las acciones del runbook en la Guía del usuario de AWS Systems Manager.

    4. Revise detenidamente la información de la vista previa antes de decidir si desea continuar.

      En este caso, puede elegir una de las siguientes acciones:

      • Detenga y no ejecute el runbook.

      • Cambie los parámetros de entrada antes de ejecutar el runbook.

      • Ejecute el runbook con las opciones que ya ha seleccionado.

    importante

    Si decide ejecutarlo, se incurriría en gastos. Para obtener información, consulte Precios de AWS Systems Manager.

  6. Si desea ejecutar el runbook, elija Ejecutar.

    Si ya ha aceptado la hipótesis, se ejecuta.

    Si aún no ha aceptado la hipótesis, aparecerá un cuadro de diálogo en el que se le solicitará que la acepte antes de llevar a cabo la ejecución.

Tras elegir Ejecutar para un runbook, esa acción se agrega al panel de Fuente de la investigación. A partir de la investigación, puede supervisar los nuevos datos de las métricas de los resultados para comprobar si las acciones del runbook están corrigiendo el problema.