

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 시스템 롤백 모범 사례
<a name="troubleshooting-system-rollback"></a>

Amazon Managed Service for Apache Flink의 자동 시스템 롤백 및 운영 가시성 기능을 사용하여 애플리케이션의 문제를 식별하고 해결할 수 있습니다.

## 시스템 롤백
<a name="troubleshooting-unsupported-kinesis-connectors-error"></a>

코드 버그 또는 권한 문제와 같은 고객 오류로 인해 애플리케이션 업데이트 또는 규모 조정 작업이 실패하는 경우 이 기능을 옵트인하면 Amazon Managed Service for Apache Flink는 자동으로 이전 실행 버전으로 롤백을 시도합니다. 자세한 내용은 [Managed Service for Apache Flink 애플리케이션의 시스템 롤백 활성화](how-system-rollbacks.md) 단원을 참조하십시오. 이 자동 롤백이 실패하거나 옵트인 또는 옵트아웃하지 않은 경우 애플리케이션은 `READY` 상태로 전환됩니다. 애플리케이션을 업데이트하려면 다음 단계를 완료합니다.   작업이 실패한 이유에 대한 오류 설명을 확인하려면 Amazon Managed Service for Apache Flink 콘솔을 확인하거나 `DescribeApplicationOperation` API를 사용합니다.   전체 오류 스택을 확인하려면 [Cloudwatch 로그](https://docs.aws.amazon.com/managed-flink/latest/java/logging.html)를 사용합니다.   일반적인 문제는 권한 부족, 호환되지 않는 코드 변경 또는 인프라 구성 오류입니다. 근본적인 문제를 해결합니다.   `UpdateApplicaton` API를 사용하여 새 애플리케이션 버전을 다시 배포합니다.   

## 수동 롤백
<a name="troubleshooting-unsupported-kinesis-connectors-error"></a>

애플리케이션이 진행되지 않고 일시적인 상태에 오래 머무르거나 `Running` 상태로 정상 전환되었지만 업데이트된 Flink 애플리케이션에서 처리 오류와 같은 다운스트림 문제가 발생하는 경우 `RollbackApplication` API를 사용하여 수동으로 롤백할 수 있습니다.

1. `RollbackApplication` 직접 호출 - 이전 실행 버전으로 되돌리고 이전 상태를 복원합니다.

1. `DescribeApplicationOperation` API를 사용하여 롤백 작업을 모니터링합니다.

1. 롤백에 실패하면 이전 시스템 롤백 단계를 사용합니다.

## 운영 가시성
<a name="troubleshooting-unsupported-kinesis-connectors-error"></a>

`ListApplicationOperations` API는 애플리케이션의 모든 고객 기록 및 시스템 작업 기록을 보여줍니다.

1. 목록에서 실패한 작업의 *operationId*를 가져옵니다.

1. `DescribeApplicationOperation`을 직접적으로 호출하여 상태와 *statusDescription*을 확인합니다.

1. 작업이 실패한 경우 설명은 조사해야 할 잠재적 오류를 나타냅니다.

**일반적인 오류 코드 버그:** 롤백 기능을 사용하여 마지막 정상 버전으로 되돌립니다. 버그를 해결하고 업데이트를 다시 시도합니다.

**권한 문제:** `DescribeApplicationOperation`을 사용하여 필요한 권한을 확인합니다. 애플리케이션 권한을 업데이트한 뒤 다시 시도합니다.

**Amazon Managed Service for Apache Flink 서비스 문제:**를 확인하거나 지원 사례를 AWS Health Dashboard 엽니다.