Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Supervisión de recopiladores con registros proporcionados
Los recopiladores de Amazon Managed Service para Prometheus ofrecen registros proporcionados para ayudarle a supervisar y solucionar los problemas del proceso de recopilación de métricas. Estos registros se envían automáticamente a Registros de Amazon CloudWatch y proporcionan visibilidad de las operaciones de detección de servicios, recopilación de métricas y exportación de datos. El recopilador proporciona los registros de los tres componentes principales del proceso de recopilación de métricas:
Temas
Registros de la detección de servicios
Los registros de detección de servicios proporcionan información sobre el proceso de detección de objetivos, que incluye:
-
Problemas de autenticación o permisos al acceder a los recursos de la API de Kubernetes.
-
Errores de configuración en los ajustes de detección de servicios.
Los siguientes ejemplos muestran los errores comunes de autenticación y permisos que se pueden encontrar durante la detección de servicios:
- Clúster de Amazon EKS inexistente
-
Cuando el clúster de Amazon EKS especificado no existe, recibe el siguiente error:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Service - Verify your scraper source exists." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" } - Permisos no válidos para los servicios
-
Cuando el recopilador no tiene los permisos de control de acceso basado en roles (RBAC) adecuados para ver los servicios, recibe el siguiente error:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Service - Verify your scraper source permissions are valid." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" } - Permisos no válidos para puntos de conexión
-
Cuando el recopilador no tiene los permisos de control de acceso basado en roles (RBAC) adecuados para ver los puntos de conexión, recibe el siguiente error:
{ "component": "SERVICE_DISCOVERY", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "log": "Failed to watch Endpoints - Verify your scraper source permissions are valid." }, "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
Registros del recopilador
Los registros del recopilador proporcionan información sobre el proceso de extracción de métricas, que incluye:
-
Los errores de análisis se deben a que los puntos de conexión no están disponibles.
-
Problemas de conexión al intentar analizar objetivos.
-
Se agotan los tiempos de espera durante las operaciones de análisis.
-
Errores de estado HTTP devueltos por los objetivos de análisis.
Los siguientes ejemplos muestran los errores de recopilación más comunes que se pueden encontrar durante el proceso de scraping de métricas:
- Falta el punto de conexión de las métricas
-
Cuando el punto de conexión de las
/metricsno está disponible en la instancia objetivo, aparece este error:{ "component": "COLLECTOR", "message": { "log": "Failed to scrape Prometheus endpoint - verify /metrics endpoint is available", "job": "pod_exporter", "targetLabels": "{__name__=\"up\", instance=\10.24.34.0\", job=\"pod_exporter\"}" }, "timestamp": "1752787969551", "scraperId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" } - Conexión rechazada
-
Cuando el recopilador no puede establecer una conexión con el punto de conexión objetivo, aparece este error:
{ "scrapeConfigId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111", "timestamp": "2025-04-30T17:25:41.946Z", "message": { "message": "Scrape failed", "scrape_pool": "pod_exporter", "target": "http://10.24.34.0:80/metrics", "error": "Get \"http://10.24.34.0:80/metrics\": dial tcp 10.24.34.0:80: connect: connection refused" }, "component": "COLLECTOR" }
Registros del exportador
Los registros del exportador proporcionan información sobre el proceso de envío de métricas recopiladas al espacio de trabajo de Amazon Managed Service para Prometheus, que incluye:
-
Número de métricas y puntos de datos procesados.
-
Fallos de exportación debido a problemas con el espacio de trabajo.
-
Errores de permisos al intentar escribir métricas.
-
Fallos de dependencia en el proceso de exportación.
Los siguientes ejemplos muestran los errores de recopilación más comunes que se pueden encontrar durante el proceso de exportación de métricas:
- Espacio de trabajo no encontrado
-
Si no se encuentra el espacio de trabajo objetivo para la exportación de métricas, aparece este error:
{ "component": "EXPORTER", "message": { "log": "Failed to export to the target workspace - Verify your scraper destination.", "samplesDropped": 5 }, "timestamp": "1752787969664", "scraperId": "s-a1b2c3d4-5678-90ab-cdef-EXAMPLE11111" }
Descripción y uso de los registros proporcionados por el recopilador
Estructura de registros
Todos los registros proporcionados por recopiladores siguen una estructura coherente con los siguientes campos:
- scrapeConfigId
-
El identificador único de la configuración de análisis que generó el registro.
- timestamp
-
La hora en que se generó el registro.
- message
-
El contenido del mensaje de registro, que puede incluir campos estructurados adicionales.
- component
-
El componente que generó el registro (SERVICE_DISCOVERY, COLLECTOR o EXPORTER)
Uso de registros proporcionados para solucionar problemas
Los registros proporcionados por recopiladores le ayudan a solucionar problemas comunes con la recopilación de métricas:
-
Problemas de la detección de servicios
-
Compruebe los registros de SERVICE_DISCOVERY para ver si hay errores de autenticación o permiso.
-
Compruebe que el recopilador tenga los permisos necesarios para acceder a los recursos de Kubernetes.
-
-
Problemas de scraping de métricas
-
Compruebe los registros de COLLECTOR para ver si hay errores de análisis.
-
Compruebe que los puntos de conexión objetivo sean accesibles y que devuelvan métricas.
-
Asegúrese de que las reglas del firewall permitan al recopilador conectarse a los puntos de conexión objetivo.
-
-
Problemas de exportación de métricas
-
Compruebe los registros de EXPORTER para ver si hay errores de exportación.
-
Compruebe que el espacio de trabajo existe y está configurado correctamente.
-
Asegúrese de que el recopilador tenga los permisos necesarios para escribir en el espacio de trabajo.
-
Acceso a registros proporcionados por recopiladores
Los registros proporcionados por los recopiladores se envían automáticamente a Registros de Amazon CloudWatch. Para acceder a estos registros:
-
Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/
. -
En el panel de navegación, seleccione Grupos de registro.
-
Busque y seleccione el grupo de registro de su recopilador:
/aws/prometheus/workspace_id/collector/collector_id. -
Examine o explore los eventos de registro para encontrar información pertinente.
También puede utilizar Información de registros de CloudWatch para consultar y analizar los registros de su recopilador. Por ejemplo, para buscar todos los errores de detección de servicios:
fields @timestamp, message.message | filter component = "SERVICE_DISCOVERY" and message.message like /Failed/ | sort @timestamp desc
Prácticas recomendadas de supervisión de recopiladores
Para supervisar de forma eficaz los recopiladores de Amazon Managed Service para Prometheus:
-
Configure alarmas de CloudWatch para los problemas críticos de los recopiladores, como los errores de análisis persistentes o los errores de exportación. Para obtener más información, consulte Alarmas en la Guía del usuario de Amazon CloudWatch.
-
Cree paneles de CloudWatch para visualizar las métricas de rendimiento de los recopiladores junto con los datos de registro proporcionados. Para obtener más información, consulte Paneles en la Guía del usuario de Amazon CloudWatch.
-
Revise periódicamente los registros de detección de servicios para asegurarse de que los objetivos se detecten correctamente.
-
Supervise la cantidad de objetivos descartados para identificar posibles problemas de configuración.
-
Realice un seguimiento de los errores de exportación para garantizar que las métricas se envíen correctamente a su espacio de trabajo.