

AWS Data Pipeline não está mais disponível para novos clientes. Os clientes existentes do AWS Data Pipeline podem continuar usando o serviço normalmente. [Saiba mais](https://aws.amazon.com/blogs/big-data/migrate-workloads-from-aws-data-pipeline/)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Falhas e novas execuções em cascata
<a name="dp-manage-cascade-failandrerun"></a>

AWS Data Pipeline permite configurar a forma como os objetos do pipeline se comportam quando uma dependência falha ou é cancelada por um usuário. Você pode verificar se as falhas chegam em cascata até outros objetos de pipeline (clientes) para evitar uma espera indefinida. Todas as atividades, nós de dados e precondições têm um campo chamado `failureAndRerunMode` com um valor padrão `none`. Para habilitar falhas em cascata, defina o campo `failureAndRerunMode` como `cascade`. 

Quando esse campo está habilitado, haverá falhas em cascata se um objeto de pipeline for bloqueado no estado `WAITING_ON_DEPENDENCIES` e eventuais dependências tiverem falhado sem comando pendente. Durante uma falha em cascata, ocorrem os seguintes eventos:
+ Quando um objeto falha, os clientes são definidos como `CASCADE_FAILED`, e o objeto original e as precondições dos clientes são definidos como `CANCELED`.
+ Todos os objetos que já estejam em `FINISHED`, `FAILED` ou `CANCELED` são ignorados.

A falha em cascata não funciona em dependências (upstream) de um objeto com falha, exceto em precondições associadas ao objeto de falha original. Os objetos de pipeline afetados por uma falha em cascata podem disparar eventuais novas tentativas ou pós-ações, como `onFail`.

Os efeitos detalhados de uma falha em cascata dependem do tipo de objeto.

## Atividades
<a name="dp-manage-cascade-activity"></a>

Uma atividade será alterada para `CASCADE_FAILED` se alguma das dependências falhar e, assim, disparar uma falha em cascata nos clientes da atividade. Se um recurso do qual a atividade depende falhar, a atividade será `CANCELED`, e todos os clientes serão alterados para `CASCADE_FAILED`.

## Nós de dados e pré-condições
<a name="dp-manage-cascade-datanode"></a>

Se um nó de dados for configurado como a saída de uma atividade de falha, o nó de dados será alterado para o estado `CASCADE_FAILED`. A falha de um nó de dados é propagada para qualquer precondição associada, que muda para o estado `CANCELED`.

## Recursos
<a name="dp-manage-cascade-resources"></a>

Se os objetos dos quais um recurso dependa estiverem no estado `FAILED` e o recurso propriamente dito estiver no estado `WAITING_ON_DEPENDENCIES`, o recurso mudará para o estado `FINISHED`.

## Reexecutar objetos de falha em cascata
<a name="dp-manage-cascade-rerun"></a>

Por padrão, reexecutar qualquer atividade ou nó de dados reexecuta somente o recurso associado. No entanto, definir o campo `failureAndRerunMode` como `cascade` em um objeto de pipeline permite um comando rerun em um objeto de destino a ser propagado para todos os clientes, sob as seguintes condições: 
+ Os clientes do objeto de destino estão no estado `CASCADE_FAILED`.
+ As dependências do objeto de destino não têm comandos rerun pendentes.
+ As dependências do objeto de destino não estão no estado `FAILED`, `CASCADE_FAILED` ou `CANCELED`.

Se você tentar reexecutar um objeto `CASCADE_FAILED` e qualquer uma das dependências for `FAILED`, `CASCADE_FAILED` ou `CANCELED`, a nova execução vai falhar e retornar o objeto ao estado `CASCADE_FAILED`. Para reexecutar o objeto de falha, você deve rastrear a falha até a cadeia de dependência para localizar a origem da falha e reexecutar esse objeto. Ao executar um comando rerun em um recurso, você também tenta reexecutar todos os objetos que dependam dele. 

## Falha em cascata e preenchimentos
<a name="dp-manage-cascade-backfills"></a>

Se você habilitar a falha em cascata e tiver um pipeline que cria muitos preenchimentos, os erros de tempo de execução do pipeline podem fazer com que os recursos sejam criados e excluídos em rápida sucessão sem realizar um trabalho útil. AWS Data Pipeline tenta alertá-lo sobre essa situação com a seguinte mensagem de aviso ao salvar um pipeline: ` {{Pipeline_object_name}} has 'failureAndRerunMode' field set to 'cascade' and you are about to create a backfill with scheduleStartTime {{start_time}}. This can result in rapid creation of pipeline objects in case of failures. ` Isso acontece porque a falha em cascata pode definir rapidamente as atividades posteriores `CASCADE_FAILED` e desligar clusters do EMR e recursos do EC2 que não são mais necessários. Recomendamos testar pipelines com intervalos de tempo curtos para limitar os efeitos dessa situação. 