

# 반구조화된 스키마를 AWS Glue가 포함된 관계형 스키마로 변환하기
<a name="schema-relationalize"></a>

일반적으로 반구조화된 데이터를 관계형 테이블로 변환하고자 할 것입니다. 개념적으로는 계층적 스키마를 관계형 스키마로 평면화하는 것입니다. AWS Glue는 이 변환을 바로 실행할 수 있습니다.

반구조화된 데이터는 일반적으로 데이터 내 개체를 식별하기 위해서 마크업을 포함합니다. 고정된 스키마없이 중첩된 데이터 구조를 가질 수 있습니다. 반구조화된 데이터에 대한 자세한 내용은 Wikipedia에서 [반구조화된 데이터](https://en.wikipedia.org/wiki/Semi-structured_data)를 참조하십시오.

관계형 데이터는 행과 열로 조직된 테이블이 보여줍니다. 테이블간 관계는 기본 키(PK)와 외래 키(FK) 관계에 의해 표현됩니다. 자세한 내용은 Wikipedia의 [관계형 데이터베이스](https://en.wikipedia.org/wiki/Relational_database)를 참조하십시오.

AWS Glue는 크롤러를 사용하여 반구조화된 데이터용 스키마를 유추합니다. ETL(추출, 변환 및 로드) 작업을 사용하여 데이터를 관계형 스키마로 변환합니다. 예를 들어, JSON 데이터를 Amazon Simple Storage Service(Amazon S3) 소스 파일에서 Amazon Relational Database Service (Amazon RDS) 테이블로 구문 분석해야 할 경우가 있습니다. AWS Glue가 어떻게 스키마간 차이를 다루는지 알면 변환 절차를 이해할 수 있습니다.

이 다이어그램은 AWS Glue가 어떻게 반구조화된 스키마를 관계형 스키마로 변환하는지 보여줍니다.

![반구조환된 스키마를 관계형 스키마로 변환하는 절차를 보여주는 플로우](http://docs.aws.amazon.com/ko_kr/glue/latest/dg/images/HowItWorks-schemaconversion.png)


다이어그램은 다음을 보여 줍니다.
+ 단일 값 `A`는 관계형 열로 바로 변환됩니다.
+ `B1` 및 `B2`인 값 페어는 두 개의 관계형 열로 변환됩니다.
+ 하위 `X` 및 `Y`가 있는 `C` 구조는 두 개의 관계형 열로 변환됩니다.
+ `D[]` 배열은 다른 관계형 테이블을 가리키는 외래 키(FK)가 있는 관계형 열로 변환합니다. 기본 키(PK)와 함께 두 번째 관계형 테이블은 배열 아이템의 오프셋과 값을 포함하는 열을 보유하고 있습니다.