Amazon Managed Service para Apache Flink Amazon (Amazon MSF) se denominaba anteriormente Amazon Kinesis Data Analytics para Apache Flink.
Prácticas recomendadas de reversión del sistema
Con las funciones de reversión automática del sistema y visibilidad de las operaciones de Amazon Managed Service para Apache Flink, se pueden identificar y resolver problemas con sus aplicaciones.
Restauraciones del sistema
Si la operación de actualización o escalado de la aplicación falla debido a un error del cliente, como un error de código o un problema de permisos, Amazon Managed Service para Apache Flink intentará volver de manera automática a la versión anterior en ejecución si ha optado por esta funcionalidad. Para obtener más información, consulte Habilitación de las restauraciones del sistema para la aplicación Amazon Managed Service para Apache Flink. Si esta reversión automática no se realiza correctamente o si no se ha optado por activarla, su solicitud se colocará en el estado READY. Complete los pasos que se indican a continuación para actualizar la aplicación:
Restauraciones manuales
Si la aplicación no progresa y permanece en un estado transitorio durante mucho tiempo, o si la aplicación ha realizado la transición a Running correctamente, pero observa problemas posteriores, como errores de procesamiento, en una aplicación de Flink que se ha actualizado correctamente, se puede revertir manualmente mediante la API de RollbackApplication.
-
Llamada
RollbackApplication: se revertirá a la versión anterior en ejecución y se restaurará el estado anterior. -
Monitoree la operación de reversión mediante la API de
DescribeApplicationOperation. -
Si la reversión falla, siga los pasos anteriores de reversión del sistema.
Visibilidad de las operaciones
La API de ListApplicationOperations muestra el historial de todas las operaciones de los clientes y del sistema en su aplicación.
-
Obtenga el ID de operación de la operación fallida de la lista.
-
Llame
DescribeApplicationOperationy compruebe el estado y statusDescription. -
Si una operación ha fallado, la descripción apunta a un posible error que hay que investigar.
Errores comunes en los códigos de error: utilice las funciones de reversión para volver a la última versión en funcionamiento. Resuelva los errores y vuelva a intentar la actualización.
Problemas con los permisos: utilice la DescribeApplicationOperation para ver los permisos necesarios. Actualice los permisos de la aplicación y vuelva a intentarlo.
Problemas con el servicio Amazon Managed Service para Apache Flink: consulte AWS Health Dashboard o abra un caso de soporte.