배치 로드 데이터 파일 준비 - Amazon Timestream

Amazon Timestream for LiveAnalytics와 유사한 기능을 원하는 경우 Amazon Timestream for InfluxDB를 고려해 보세요. 간소화된 데이터 수집과 실시간 분석을 위한 10밀리초 미만의 쿼리 응답 시간을 제공합니다. 여기에서 자세히 알아보세요.

배치 로드 데이터 파일 준비

소스 데이터 파일에는 구분 기호로 구분된 값이 있습니다. 보다 구체적인 용어인 쉼표로 구분된 값(CSV)은 일반적으로 사용됩니다. 유효한 열 구분 기호에는 쉼표와 파이프가 포함됩니다. 레코드는 새 줄로 구분됩니다. 파일은 Amazon S3에 저장해야 합니다. 새 배치 로드 태스크를 생성할 때 소스 데이터의 위치는 파일의 ARN에 의해 지정됩니다. 파일에는 헤더가 포함됩니다. 하나의 열은 타임스탬프를 나타냅니다. 하나 이상의 다른 열은 측정값을 나타냅니다.

배치 로드에 사용되는 S3 버킷은 배치 로드에 사용되는 Timestream for LiveAnalytics 테이블과 동일한 리전에 있어야 합니다. 배치 로드 태스크가 제출된 후에는 배치 로드에 사용된 S3 버킷에서 파일을 추가하거나 제거하지 마세요. S3 버킷 작업에 대한 자세한 내용은 Amazon S3 시작하기를 참조하세요.

참고

Excel과 같은 일부 애플리케이션에서 생성되는 CSV 파일에는 예상 인코딩과 충돌하는 바이트 순서 표시(BOM)가 포함될 수 있습니다. BOM이 있는 CSV 파일을 참조하는 Timestream for LiveAnalytics 배치 로드 태스크는 프로그래밍 방식으로 처리될 때 오류가 발생합니다. 이를 방지하려면 보이지 않는 문자인 BOM을 제거합니다.

예를 들어, Notepad++와 같이 새로운 인코딩을 지정할 수 있는 애플리케이션에서 파일을 저장할 수 있습니다. 첫 번째 줄을 읽고 해당 줄에서 문자를 제거한 후 파일의 첫 번째 줄을 새 값으로 덮어쓰는 프로그래밍 방식을 사용할 수도 있습니다.

Excel에서 저장할 때 여러 CSV 옵션이 있습니다. 다른 CSV 옵션으로 저장하면 설명된 문제를 방지할 수 있습니다. 그러나 인코딩 변경으로 인해 일부 문자가 영향을 받을 수 있으므로 결과를 확인해야 합니다.

CSV 형식 파라미터

이스케이프 문자는 형식 파라미터에 의해 예약된 값을 나타낼 때 사용합니다. 예를 들어 따옴표 문자가 큰따옴표인 경우 데이터에서 큰따옴표를 나타내려면 큰따옴표 앞에 이스케이프 문자를 배치합니다.

배치 로드 태스크를 생성할 때 이를 지정해야 하는 경우에 대한 자세한 내용은 배치 로드 태스크 생성 섹션을 참조하세요.

파라미터 옵션
열 구분자 (쉼표(',') | 파이프('|') | 세미콜론(';') | 탭('/t') | 공백(' '))
이스케이프 문자 없음
인용 문자 Console: (큰따옴표(") | 작은따옴표('))
Null 값 공백(' ')
공백 잘라내기 Console: (아니요 | 예)