Amazon Managed Service for Apache Flink(Amazon MSF)는 이전에 Amazon Kinesis Data Analytics for Apache Flink로 알려져 있었습니다.
시스템 롤백 모범 사례
Amazon Managed Service for Apache Flink의 자동 시스템 롤백 및 운영 가시성 기능을 사용하여 애플리케이션의 문제를 식별하고 해결할 수 있습니다.
시스템 롤백
코드 버그 또는 권한 문제와 같은 고객 오류로 인해 애플리케이션 업데이트 또는 규모 조정 작업이 실패하는 경우 이 기능을 옵트인하면 Amazon Managed Service for Apache Flink는 자동으로 이전 실행 버전으로 롤백을 시도합니다. 자세한 내용은 Managed Service for Apache Flink 애플리케이션의 시스템 롤백 활성화 섹션을 참조하세요. 이 자동 롤백이 실패하거나 옵트인 또는 옵트아웃하지 않은 경우 애플리케이션은 READY 상태로 전환됩니다. 애플리케이션을 업데이트하려면 다음 단계를 완료합니다.
수동 롤백
애플리케이션이 진행되지 않고 일시적인 상태에 오래 머무르거나 Running 상태로 정상 전환되었지만 업데이트된 Flink 애플리케이션에서 처리 오류와 같은 다운스트림 문제가 발생하는 경우 RollbackApplication API를 사용하여 수동으로 롤백할 수 있습니다.
-
RollbackApplication직접 호출 - 이전 실행 버전으로 되돌리고 이전 상태를 복원합니다. -
DescribeApplicationOperationAPI를 사용하여 롤백 작업을 모니터링합니다. -
롤백에 실패하면 이전 시스템 롤백 단계를 사용합니다.
운영 가시성
ListApplicationOperations API는 애플리케이션의 모든 고객 기록 및 시스템 작업 기록을 보여줍니다.
-
목록에서 실패한 작업의 operationId를 가져옵니다.
-
DescribeApplicationOperation을 직접적으로 호출하여 상태와 statusDescription을 확인합니다. -
작업이 실패한 경우 설명은 조사해야 할 잠재적 오류를 나타냅니다.
일반적인 오류 코드 버그: 롤백 기능을 사용하여 마지막 정상 버전으로 되돌립니다. 버그를 해결하고 업데이트를 다시 시도합니다.
권한 문제: DescribeApplicationOperation을 사용하여 필요한 권한을 확인합니다. 애플리케이션 권한을 업데이트한 뒤 다시 시도합니다.
Amazon Managed Service for Apache Flink 서비스 문제: AWS Health Dashboard를 확인하거나 지원 사례를 엽니다.