Amazon Timestream for LiveAnalytics와 유사한 기능을 원하는 경우 Amazon Timestream for InfluxDB를 고려해 보세요. 간소화된 데이터 수집과 실시간 분석을 위한 10밀리초 미만의 쿼리 응답 시간을 제공합니다. 여기에서 자세히 알아보세요.
기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
쿼리
Timestream for Live Analytics를 사용하면 DevOps에 대한 지표, IoT 애플리케이션에 대한 센서 데이터, 장비 유지 보수를 위한 산업 원격 분석 데이터는 물론, 다양한 사용 사례를 쉽게 저장하고 분석할 수 있습니다. Timestream for LiveAnalytics의 목적별 적응형 쿼리 엔진을 사용하면 단일 SQL 문을 통해 스토리지 계층 전반의 데이터에 액세스할 수 있습니다. 스토리지 계층 전반에 걸쳐 데이터에 투명하게 액세스하고 결합하며, 사용자가 데이터 위치를 지정할 필요가 없습니다. SQL을 사용하여 Timestream for LiveAnalytics의 데이터를 쿼리해서 하나 이상의 테이블에서 시계열 데이터를 검색할 수 있습니다. 데이터베이스와 테이블에 대한 메타데이터 정보에 액세스할 수 있습니다. Timestream for LiveAnalytics SQL은 시계열 분석을 위한 내장 함수도 지원합니다. 추가적인 세부 사항은 쿼리 언어 참조에서 확인하세요.
Timestream for Live Analytics는 데이터 수집, 스토리지 및 쿼리 아키텍처가 완전히 분리되어 있어 각 구성 요소의 규모가 다른 구성 요소와 독립적으로 조정될 수 있도록 설계되었습니다. 이를 통해 애플리케이션 요구 사항에 따라 사실상 무한한 규모 조정이 가능합니다. 즉, Timestream for Live Analytics는 애플리케이션이 하루에 수백 테라바이트의 데이터를 전송하거나 소량 또는 대량의 데이터를 처리하는 수백만 건의 쿼리를 실행하더라도 ‘과부하’가 걸리지 않습니다. 시간이 지남에 따라 데이터가 증가하더라도 Timestream for Live Analytics의 쿼리 지연 시간은 거의 변하지 않습니다. 이는 Timestream for LiveAnalytics 쿼리 아키텍처가 대량의 병렬 처리를 활용하여 더 큰 데이터 볼륨을 처리하고 애플리케이션의 쿼리 처리량 요구 사항에 맞게 자동으로 규모를 조정할 수 있기 때문입니다.
데이터 모델
Timestream은 쿼리에 대해 플랫 모델과 시계열 모델의 두 가지 데이터 모델을 지원합니다.
참고
Timestream의 데이터는 플랫 모델을 사용하여 저장되며 데이터 쿼리를 위한 기본 모델입니다. 시계열 모델은 쿼리 시간 개념이며 시계열 분석에 사용됩니다.
플랫 모델
플랫 모델은 쿼리를 위한 Timestream의 기본 데이터 모델입니다. 시계열 데이터를 테이블 형식으로 표현합니다. 차원 이름, 시간, 측정 이름 및 측정값은 열로 표시됩니다. 테이블의 각 행은 시계열 내 특정 시점의 측정값에 해당하는 원자성 데이터 포인트입니다. Timestream 데이터베이스, 테이블 및 열에는 몇 가지 이름 지정 제약 조건이 있습니다. 해당 내용은 서비스 한도에 설명되어 있습니다.
아래 표는 데이터가 단일 측정 레코드로 전송될 때 Timestream이 EC2 인스턴스의 CPU 사용률, 메모리 사용률 및 네트워크 활동을 나타내는 데이터를 저장하는 방식을 보여주는 예시입니다. 이 경우 차원은 EC2 인스턴스의 리전, 가용 영역, 가상 프라이빗 클라우드 및 인스턴스 ID입니다. 측정값은 EC2 인스턴스의 CPU 사용률, 메모리 사용률 및 수신 네트워크 데이터입니다. region, az, vpc 및 instance_id 열에는 차원 값이 포함됩니다. Time 열에는 각 레코드의 타임스탬프가 포함됩니다. measure_name 열에는 cpu-utilization, memory_utilization 및 network_bytes_in으로 표현되는 측정의 이름이 포함됩니다. measure_value::double 열에는 double로 내보낸 측정값(예: CPU 사용률 및 메모리 사용률)이 포함됩니다. measure_value::bigint 열에는 정수로 내보낸 측정값(예: 수신 네트워크 데이터)이 포함됩니다.
| 시간 | 리전 | az | vpc | instance-id | measure_name | measure_value::double | measure_value::bigint |
|---|---|---|---|---|---|---|---|
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
35.0 |
null |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
38.2 |
null |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
cpu_utilization |
45.3 |
null |
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
54.9 |
null |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
42.6 |
null |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
memory_utilization |
33.3 |
null |
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
34,400 |
null |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
1,500 |
null |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
network_bytes |
6,000 |
null |
아래 표는 데이터가 다중 측정 레코드로 전송될 때 Timestream이 EC2 인스턴스의 CPU 사용률, 메모리 사용률 및 네트워크 활동을 나타내는 데이터를 저장하는 방식을 보여주는 예시입니다.
| 시간 | 리전 | az | vpc | instance-id | measure_name | cpu_utilization | memory_utilization | network_bytes |
|---|---|---|---|---|---|---|---|---|
|
2019-12-04 19:00:00.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
지표 |
35.0 |
54.9 |
34,400 |
|
2019-12-04 19:00:01.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
지표 |
38.2 |
42.6 |
1,500 |
|
2019-12-04 19:00:02.000000000 |
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
지표 |
45.3 |
33.3 |
6,600 |
시계열 모델
시계열 모델은 시계열 분석에 사용되는 쿼리 시간 구문입니다. (시간, 측정값) 페어의 순서가 지정된 시퀀스로 데이터를 나타냅니다. Timestream은 보간과 같은 시계열 함수를 지원하여 데이터의 격차를 메울 수 있도록 합니다. 이러한 함수를 사용하려면 create_time_series와 같은 함수를 사용하여 데이터를 시계열 모델로 변환해야 합니다. 자세한 내용은 쿼리 언어 참조 섹션을 참조하세요.
다음은 EC2 인스턴스의 이전 예제를 사용하여 CPU 사용률 데이터를 시계열로 표현한 것입니다.
| 리전 | az | vpc | instance-id | cpu_utilization |
|---|---|---|---|---|
|
us-east-1 |
us-east-1d |
vpc-1a2b3c4d |
i-1234567890abcdef0 |
[{time: 2019-12-04 19:00:00.000000000, value: 35}, {time: 2019-12-04 19:00:01.000000000, value: 38.2}, {time: 2019-12-04 19:00:02.000000000, value: 45.3}] |