Práticas recomendadas de reversão do sistema - Managed Service for Apache Flink

Anteriormente, o Amazon Managed Service for Apache Flink (Amazon MSF) era conhecido como Amazon Kinesis Data Analytics for Apache Flink.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Práticas recomendadas de reversão do sistema

Com os recursos automáticos de reversão do sistema e visibilidade das operações no Amazon Managed Service for Apache Flink, você pode identificar e resolver problemas com seus aplicativos.

Reversões do sistema

Se a operação de atualização ou escalabilidade do seu aplicativo falhar devido a um erro do cliente, como uma falha de código ou problema de permissão, o Amazon Managed Service for Apache Flink tentará automaticamente reverter para a versão em execução anterior se você tiver optado por essa funcionalidade. Para obter mais informações, consulte Habilite reversões de sistema para seu aplicativo Managed Service for Apache Flink. Se essa reversão automática falhar ou você aderiu ou não a essa funcionalidade, seu aplicativo será colocado no estado READY. Para atualizar seu aplicativo, conclua as seguintes etapas:

Reversão manual

Se o aplicativo não estiver progredindo e estiver em um estado transitório por muito tempo, ou se a transição do aplicativo para Running for bem-sucedida, mas você observar problemas posteriores, como erros de processamento em um aplicativo Flink atualizado com sucesso, você poderá revertê-lo manualmente usando a API RollbackApplication.

  1. Chamada RollbackApplication - isso reverterá para a versão anterior em execução e restaurará o estado anterior.

  2. Monitore a operação de reversão usando a API DescribeApplicationOperation.

  3. Se a reversão falhar, use as etapas anteriores de reversão do sistema.

Visibilidade das operações

A API ListApplicationOperations mostra o histórico de todas as operações do cliente e do sistema em seu aplicativo.

  1. Obtenha o operationId da operação com falha na lista.

  2. Chame DescribeApplicationOperation e verifique o status e statusDescription.

  3. Se uma operação falhar, a descrição aponta para um possível erro a ser investigado.

Falhas comuns de código de erro: use os recursos de reversão para reverter para a última versão em funcionamento. Resolva as falhas e repita a atualização.

Problemas de permissão: use o DescribeApplicationOperation para ver as permissões necessárias. Atualize as permissões do aplicativo e tente novamente.

Amazon Managed Service para problemas com o serviço Apache Flink: verifique AWS Health Dashboard ou abra um caso de suporte.