As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Métricas do ambiente Apache Airflow em CloudWatch
O Apache Airflow v2 e v3 já estão configurados para coletar e enviar métricas do StatsD
Sumário
Termos
- Namespace
-
Um namespace é um contêiner para as CloudWatch métricas de um AWS serviço. Para o Amazon MWAA, o namespace é AmazonMWAA.
- CloudWatch métricas
-
Uma CloudWatch métrica representa um conjunto ordenado por tempo de pontos de dados específicos de CloudWatch.
- Métricas do Apache Airflow
-
As métricas
específicas do Apache Airflow. - Dimensão
-
Uma dimensão é um name/value par que faz parte da identidade de uma métrica.
- Unidade
-
Uma estatística tem uma unidade de medida. Para o Amazon MWAA, as unidades incluem Contagem, Segundos e Milissegundos. Para o Amazon MWAA, as unidades são definidas com base nas unidades nas métricas originais do Airflow.
Dimensões
Esta seção descreve o agrupamento de CloudWatch dimensões para métricas do Apache Airflow em. CloudWatch
| Dimensão | Descrição |
|---|---|
|
DAG |
Indica um nome específico de DAG do Apache Airflow. |
|
Nome do arquivo DAG |
Indica um nome de arquivo específico de DAG do Apache Airflow. |
|
Função |
Essa dimensão é usada para melhorar o agrupamento de métricas em CloudWatch. |
|
Trabalho |
Indica uma tarefa do Apache Airflow executada pelo agendador. Sempre tem um valor de |
|
Operador |
Indica um operador específico do Apache Airflow. |
|
Grupo |
Indica um grupo de operadores específico do Apache Airflow. |
|
Tarefa |
Indica uma tarefa específica do Apache Airflow. |
|
HostName |
Indica o nome do host de um processo específico do Apache Airflow em execução. |
Acessando métricas no CloudWatch console
Esta seção descreve como acessar as métricas de desempenho CloudWatch de um DAG específico.
Para acessar métricas de desempenho de uma dimensão
-
Abra a página Métricas
no CloudWatch console. -
Selecione o seu Região da AWS.
-
Escolha o namespace AmazonMWAA.
-
Na guia Todas as métricas, selecione uma dimensão. Por exemplo, DAG, Ambiente.
-
Escolha uma CloudWatch métrica para uma dimensão. Por exemplo, TaskInstanceSuccesses ou TaskInstanceDuration. Escolha Representar graficamente todos os resultados da pesquisa.
-
Escolha a guia Métricas representadas graficamente para acessar as estatísticas de desempenho das métricas do Apache Airflow, como DAG, Ambiente, Tarefa.
Métricas do Apache Airflow disponíveis em CloudWatch
Esta seção descreve as métricas e dimensões do Apache Airflow enviadas para. CloudWatch
Contadores do Apache Airflow
As métricas do Apache Airflow nesta seção contêm dados sobre os Contadores do Apache Airflow
| CloudWatch métrica | Métrica do Apache Airflow | Unidade | Dimensão |
|---|---|---|---|
|
SLAMissed notaDisponível somente para Apache Airflow v2.4.3 a v2.10.3. |
sla_missed |
Contagem |
Função, Agendador |
|
Falhou SLACallback notaDisponível somente para Apache Airflow v2.4.3 a v2.10.3. |
sla_callback_notification_failure |
Contagem |
Função, Agendador |
|
Atualizações notaDisponível para Apache Airflow v2.6.3 e versões posteriores. |
dataset.updates |
Contagem |
Função, Agendador |
|
Orphaned notaDisponível para Apache Airflow v2.6.3 e versões posteriores. |
dataset.orphaned |
Contagem |
Função, Agendador |
|
FailedCeleryTaskExecution notaDisponível para Apache Airflow v2.4.3 e versões posteriores. |
celery.execute_command.failure |
Contagem |
Função, Celery |
|
FilePathQueueUpdateCount notaDisponível para Apache Airflow v2.6.3 e versões posteriores. |
dag_processing.file_path_queue_update_count |
Contagem |
Função, Agendador |
|
CriticalSectionBusy |
scheduler.critical_section_busy |
Contagem |
Função, Agendador |
|
DagBagSize |
dagbag_size |
Contagem |
Função, Processamento de DAG |
|
DagCallbackExceptions |
dag.callback_exceptions |
Contagem |
DAG, Todos |
|
SLAEmailTentativas fracassadas notaNão disponível para o Apache Airflow v3.0.6 e versões posteriores. |
sla_email_notification_failure |
Contagem |
Função, Agendador |
|
TaskInstanceFinished |
ti.finish.{dag_id}.{task_id}.{state} |
Contagem |
DAG, {dag_id} Tarefa, {task_id} Estado, {state} |
|
JobEnd |
{job_name}_end |
Contagem |
Trabalho, {job_name} |
|
JobHeartbeatFailure |
{job_name}_heartbeat_failure |
Contagem |
Trabalho, {job_name} |
|
JobStart |
{job_name}_start |
Contagem |
Trabalho, {job_name} |
|
ManagerStalls |
dag_processing.manager_stalls |
Contagem |
Função, Processamento de DAG |
|
OperatorFailures |
operator_failures_{operator_name} |
Contagem |
Operador, {operator_name} |
|
OperatorSuccesses |
operator_successes_{operator_name} |
Contagem |
Operador, {operator_name} |
|
OtherCallbackCount notaDisponível no Apache Airflow v2.6.3 e versões posteriores. |
dag_processing.other_callback_count |
Contagem |
Função, Agendador |
|
Processos |
dag_processing.processes |
Contagem |
Função, Processamento de DAG |
|
SchedulerHeartbeat |
scheduler_heartbeat |
Contagem |
Função, Agendador |
|
StartedTaskInstances |
ti.start.{dag_id}.{task_id} |
Contagem |
DAG, Todos Tarefa, Todos |
|
SlaCallbackCount |
dag_processing.sla_callback_count notaDisponível para Apache Airflow v2.6.3 e versões posteriores. |
Contagem |
Função, Agendador |
|
TasksKilledExternally |
scheduler.tasks.killed_externally |
Contagem |
Função, Agendador |
|
TaskTimeoutError |
celery.task_timeout_error |
Contagem |
Função, Celery |
|
TaskInstanceCreatedUsingOperator |
task_instance_created-{operator_name} |
Contagem |
Operador, {operator_name} |
|
TaskInstancePreviouslySucceeded |
previously_succeeded |
Contagem |
DAG, Todos Tarefa, Todos |
|
TaskInstanceFailures |
ti_failures |
Contagem |
DAG, Todos Tarefa, Todos |
|
TaskInstanceSuccesses |
ti_successes |
Contagem |
DAG, Todos Tarefa, Todos |
|
TaskRemovedFromDAG |
task_removed_from_dag.{dag_id} |
Contagem |
DAG, {dag_id} |
|
TaskRestoredToDAG |
task_restored_to_dag.{dag_id} |
Contagem |
DAG, {dag_id} |
|
TriggersSucceeded notaDisponível para Apache Airflow v2.7.2 e versões posteriores. |
triggers.succeeded |
Contagem |
Função, Trigger |
|
TriggersFailed notaDisponível para Apache Airflow v2.7.2 e versões posteriores. |
triggers.failed |
Contagem |
Função, Trigger |
|
TriggersBlockedMainThread notaDisponível para Apache Airflow v2.7.2 e versões posteriores. |
triggers.blocked_main_thread |
Contagem |
Função, Trigger |
|
TriggerHeartbeat notaDisponível para Apache Airflow v2.8.1 e versões posteriores. |
triggerer_heartbeat |
Contagem |
Função, acionador |
|
TaskInstanceCreatedUsingOperator |
airflow.task_instance_created_ notaDisponível para Apache Airflow v2.7.2 e versões posteriores. |
Contagem |
Operador, |
|
ZombiesKilled |
zombies_killed |
Contagem |
DAG, Todos Tarefa, Todos |
Medidores do Apache Airflow
As métricas do Apache Airflow nesta seção contêm dados sobre os Medidores do Apache Airflow
| CloudWatch métrica | Métrica do Apache Airflow | Unidade | Dimensão |
|---|---|---|---|
|
DAGFileRefreshError |
dag_file_refresh_error |
Contagem |
Função, Processamento de DAG |
|
ImportErrors |
dag_processing.import_errors |
Contagem |
Função, Processamento de DAG |
|
ExceptionFailures |
smart_sensor_operator.exception_failures |
Contagem |
Função, Operador de sensor inteligente |
|
ExecutedTasks |
smart_sensor_operator.executed_tasks |
Contagem |
Função, Operador de sensor inteligente |
|
InfraFailures |
smart_sensor_operator.infra_failures |
Contagem |
Função, Operador de sensor inteligente |
|
LoadedTasks |
smart_sensor_operator.loaded_tasks |
Contagem |
Função, Operador de sensor inteligente |
|
TotalParseTime |
dag_processing.total_parse_time |
Segundos |
Função, Processamento de DAG |
|
TriggeredDagRuns notaDisponível no Apache Airflow v2.6.3 e versões posteriores. |
dataset.triggered_dagruns |
Contagem |
Função, Agendador |
|
TriggersRunning notaDisponível no Apache Airflow v2.7.2 e versões posteriores. |
aciona. Executando. |
Contagem |
Função, Trigger HostName, |
|
PoolDeferredSlots notaDisponível no Apache Airflow v2.7.2 e versões posteriores. |
pool.deferred_slots. |
Contagem |
Pool, {pool_name} |
|
DAGFileProcessingLastRunSecondsAgo |
dag_processing.last_run.seconds_ago.{dag_filename} |
Segundos |
Nome do arquivo DAG, {dag_filename} |
|
OpenSlots |
executor.open_slots |
Contagem |
Função, Executor |
|
OrphanedTasksAdopted |
scheduler.orphaned_tasks.adopted |
Contagem |
Função, Agendador |
|
OrphanedTasksCleared |
scheduler.orphaned_tasks.cleared |
Contagem |
Função, Agendador |
|
PokedExceptions |
smart_sensor_operator.poked_exception |
Contagem |
Função, Operador de sensor inteligente |
|
PokedSuccess |
smart_sensor_operator.poked_success |
Contagem |
Função, Operador de sensor inteligente |
|
PokedTasks |
smart_sensor_operator.poked_tasks |
Contagem |
Função, Operador de sensor inteligente |
|
PoolFailures |
pool.open_slots.{pool_name} |
Contagem |
Pool, {pool_name} |
|
PoolStarvingTasks |
pool.starving_tasks.{pool_name} |
Contagem |
Pool, {pool_name} |
|
PoolOpenSlots |
pool.open_slots.{pool_name} |
Contagem |
Pool, {pool_name} |
|
PoolQueuedSlots |
pool.queued_slots.{pool_name} |
Contagem |
Pool, {pool_name} |
|
PoolRunningSlots |
pool.running_slots.{pool_name} |
Contagem |
Pool, {pool_name} |
|
ProcessorTimeouts |
dag_processing.processor_timeouts |
Contagem |
Função, Processamento de DAG |
|
QueuedTasks |
executor.queued_tasks |
Contagem |
Função, Executor |
|
RunningTasks |
executor.running_tasks |
Contagem |
Função, Executor |
|
TasksExecutable |
scheduler.tasks.executable |
Contagem |
Função, Agendador |
|
TasksPending notaNão se aplica ao Apache Airflow v2.2 e versões posteriores. |
scheduler.tasks.pending |
Contagem |
Função, Agendador |
|
TasksRunning |
scheduler.tasks.running |
Contagem |
Função, Agendador |
|
TasksStarving |
scheduler.tasks.starving |
Contagem |
Função, Agendador |
|
TasksWithoutDagRun |
scheduler.tasks.without_dagrun |
Contagem |
Função, Agendador |
|
DAGFileProcessingLastNumOfDbQueries notaDisponível no Apache Airflow v2.10.1 e versões posteriores. |
dag_processing.last_num_of_db_queries.{dag_filename} |
Contagem |
Nome do arquivo DAG, {dag_filename} |
|
PoolScheduledSlots notaDisponível no Apache Airflow v2.10.1 e versões posteriores. |
pool.scheduled_slots.{pool_name} |
Contagem |
Pool, {pool_name} |
|
TaskCpuUsage notaDisponível no Apache Airflow v2.10.1 e versões posteriores. |
cpu.usage.{dag_id}.{task_id} |
Percentual |
DAG, {dag_id} Tarefa, {task_id} |
|
TaskMemoryUsage notaDisponível no Apache Airflow v2.10.1 e versões posteriores. |
mem.usage.{dag_id}.{task_id} |
Percentual |
DAG, {dag_id} Tarefa, {task_id} |
Temporizadores do Apache Airflow
As métricas do Apache Airflow nesta seção contêm dados sobre os temporizadores do Apache Airflow
| CloudWatch métrica | Métrica do Apache Airflow | Unidade | Dimensão |
|---|---|---|---|
|
Coletar DBDags |
collect_db_dags |
Milissegundos |
Função, Processamento de DAG |
|
CriticalSectionDuration |
scheduler.critical_section_duration |
Milissegundos |
Função, Agendador |
|
CriticalSectionQueryDuration notaDisponível para Apache Airflow v2.5.1 e versões posteriores. |
scheduler.critical_section_query_duration |
Milissegundos |
Função, Agendador |
|
DAGDependencyVerifique |
dagrun.dependency-check.{dag_id} |
Milissegundos |
DAG, {dag_id} |
|
DAGDurationFalhou |
dagrun.duration.failed.{dag_id} |
Milissegundos |
DAG, {dag_id} |
|
DAGDurationSucesso |
dagrun.duration.success.{dag_id} |
Milissegundos |
DAG, {dag_id} |
|
DAGFileProcessingLastDuration |
dag_processing.last_duration.{dag_filename} |
Segundos |
Nome do arquivo DAG, {dag_filename} |
|
DAGScheduleAtraso |
dagrun.schedule_delay.{dag_id} |
Milissegundos |
DAG, {dag_id} |
|
FirstTaskSchedulingDelay |
dagrun.{dag_id}.first_task_scheduling_delay |
Milissegundos |
DAG, {dag_id} |
|
SchedulerLoopDuration notaDisponível para Apache Airflow v2.5.1 e versões posteriores. |
scheduler.scheduler_loop_duration |
Milissegundos |
Função, Agendador |
|
TaskInstanceDuration |
dag.{dag_id}.{task_id}.duration |
Milissegundos |
DAG, {dag_id} Tarefa, {task_id} |
|
TaskInstanceQueuedDuration |
dag. notaDisponível para Apache Airflow v2.7.2 e versões posteriores. |
Milissegundos |
DAG, {dag_id} Tarefa, {task_id} |
|
TaskInstanceScheduledDuration notaDisponível para Apache Airflow v2.7.2 e versões posteriores. |
dag. |
Milissegundos |
DAG, {dag_id} Tarefa, {task_id} |
Como escolher quais métricas são relatadas
metrics.metrics_allow_list— Uma lista de prefixos separados por vírgula que você pode usar para selecionar quais métricas são emitidas pelo seu CloudWatch ambiente. Use essa opção se quiser que o Apache Airflow não envie todas as métricas disponíveis e, em vez disso, selecione um subconjunto de elementos. Por exemplo, .scheduler,executor,dagrunmetrics.metrics_block_list: uma lista de prefixos separados por vírgula para filtrar as métricas que começam com os elementos da lista. Por exemplo, .scheduler,executor,dagrun
Se você configurar metrics.metrics_allow_list emetrics.metrics_block_list, o Apache Airflow ignorará metrics.metrics_block_list. Se você configura metrics.metrics_block_list, mas não metrics.metrics_allow_list, o Apache Airflow filtra os elementos que você especifica em metrics.metrics_block_list.
nota
As opções de metrics.metrics_block_list configuração metrics.metrics_allow_list e se aplicam somente ao Apache Airflow v2.6.3 e versões posteriores. Para a versão anterior do Apache Airflow, use metrics.statsd_allow_list e metrics.statsd_block_list.
Próximas etapas
-
Explore a operação da API Amazon MWAA usada para publicar métricas de integridade do ambiente em. PublishMetrics