Amazon Timestream for InfluxDB 3

Timestream for InfluxDB 3란 무엇인가요?

Amazon Timestream for InfluxDB 3는 애플리케이션 개발자와 DevOps 팀이 오픈 소스 API를 사용하여 대규모 시계열 분석 애플리케이션을 AWS 위해에서 InfluxDB 3 데이터베이스를 쉽게 실행할 수 있는 관리형 시계열 데이터베이스 서비스입니다. APIs Amazon Timestream for InfluxDB 3를 사용하면 카디널리티가 높은 데이터와 복잡한 분석 쿼리를 처리하도록 설계된 시계열 워크로드를 쉽게 설정 및 운영하고 규모를 조정할 수 있습니다.

InfluxDB 3는 InfluxDB 데이터베이스 엔진의 완전한 아키텍처 재구상을 나타냅니다. Time-Structured Merge 트리(TSM) 스토리지 엔진을 활용한 버전 1 및 2와 달리 InfluxDB 3는 처음부터 완전히 다른 기술 기반을 기반으로 구축되었습니다. 이 새 버전은 인 메모리 데이터 처리를 위해 Apache Arrow를, 쿼리 실행을 위해 Apache Data Fusion을, 객체 스토리지(Amazon S3)의 데이터 지속성을 위해 열 기반 스토리지 형식(Parquet)을 활용합니다. 이러한 아키텍처 전환을 통해 InfluxDB 3는 카디널리티가 높은 데이터에 대해 향상된 성능을 제공하고 대규모 분석 워크로드에 대해 효율적으로 규모를 조정할 수 있습니다. InfluxDB 3 아키텍처는 데이터 집약적인 사용 사례에 향상된 쿼리 성능과 리소스 사용률을 제공합니다.

Amazon Timestream for InfluxDB 3를 사용하면 이 차세대 시계열 데이터베이스 엔진의 기능에 액세스할 수 있습니다. 아키텍처 변환은 대규모 시계열 분석 워크로드를 활성화하고 열 기반 Parquet 스토리지 형식에 고유한 압축, 파티셔닝 및 쿼리 최적화 기능을 활용합니다. InfluxDB 3는 스토리지에서 컴퓨팅을 분리하여 비용 효율성을 유지하면서 사실상 무제한의 데이터 볼륨을 처리하도록 확장할 수 있습니다.

Amazon Timestream for InfluxDB 3는 데이터베이스를 자동으로 백업하고 데이터베이스 소프트웨어를 최신 버전으로 유지할 수 있습니다. 모든 것과 마찬가지로 선결제 투자 AWS 서비스는 필요하지 않으며 사용하는 리소스에 대해서만 비용을 지불합니다.

DB 클러스터

DB 클러스터는 Timestream for InfluxDB 3의 기본 구성 요소입니다. 기존 데이터베이스 인스턴스와 달리 InfluxDB 3는 컴퓨팅과 스토리지를 분리하는 클러스터 기반 아키텍처를 사용하며, Amazon S3를 활용하여 사실상 무제한의 비용 효율적인 데이터 스토리지를 제공합니다.

Core 또는 Enterprise 버전에서 InfluxDB 3 배포를 설정할 수 있습니다.

Core 버전

InfluxDB 3의 Core 버전은 단일 노드 클러스터 배포로 제한되며 압축 기능이 부족하여 특정 워크로드에 대한 적합성에 영향을 미칩니다. 이러한 제한으로 인해 Core 버전은 주로 최근 데이터(일반적으로 며칠 전)에 초점을 맞춘 거의 실시간에 가까운 워크로드를 위해 설계되었습니다. 장기 스토리지 및 분석과 관련된 사용 사례에는 권장되지 않습니다. 스토리지를 최적화하기 위한 압축 프로세스 없이 시간 경과에 따라 성능이 저하되기 때문입니다.

Enterprise 버전

InfluxDB 3의 Enterprise 버전은 다중 노드 클러스터 구성을 지원하며 필수 압축 기능을 포함하여 읽기 및 쓰기 작업 모두에 수평적 스케일링을 지원합니다. 이러한 다중 노드 배포는 가용성 향상, 동시 쿼리에 대한 성능 향상, 전반적인 시스템 복원력 향상을 제공합니다. Enterprise 버전의 압축 기능을 사용하면 기본 스토리지 형식을 지속적으로 최적화하므로 카디널리티가 높은 데이터 및 장기 분석 사용 사례에 적합합니다. 진행 중인 운영을 중단하지 않고 증가하는 워크로드를 수용할 수 있도록 노드를 추가하여 Enterprise 클러스터 규모를 조정할 수 있습니다.

각 DB 클러스터에는 DB 클러스터 식별자가 있습니다. 이 자동 생성된 이름은 Amazon Timestream for InfluxDB API 및 AWS CLI 명령과 상호 작용할 때 DB 클러스터를 고유하게 식별합니다. DB 클러스터 식별자는 한 AWS 리전내의 해당 고객에 대해 고유해야 합니다.

Timestream for InfluxDB는 클러스터에 DNS 엔드포인트를 할당합니다. 서비스 생성 식별자는 클러스터의 DNS 엔드포인트의 일부를 구성합니다. 예를 들어 클러스터의 서비스 생성 식별자가 xghozx1v79인 경우 DNS 엔드포인트는 xghozx1v79-3ksj4dla5nfjhi.timestream-influxdb3.us-east-1.on.aws입니다.

Amazon Timestream for InfluxDB를 사용하면 DB 클러스터를 생성하는 중 DB 클러스터의 마스터 사용자 계정과 암호를 생성할 수 있습니다. 이 마스터 사용자는 데이터베이스와 테이블을 생성하고 데이터에 대한 읽기, 쓰기, 삭제 및 업서트 작업을 수행할 수 있는 권한을 보유합니다.

시각적 웹 기반 사용자 인터페이스에 액세스하려면 InfluxData에서 다운로드하여 자체 인스턴스에서 실행할 수 있는 InfluxDB Explorer를 사용할 수 있습니다.

DB 클러스터 클래스

DB 클러스터 클래스는 Amazon Timestream for InfluxDB 3 클러스터 내 노드의 계산 및 메모리 용량을 결정합니다. 적절한 클러스터 클래스는 처리 능력과 메모리 요구 사항에 따라 다릅니다.

InfluxDB 3 클러스터 클래스

InfluxDB 3 클러스터는 Amazon S3 기반 스토리지 아키텍처에 특별히 최적화된 인스턴스 클래스를 사용합니다. db.influxIOIncluded로 지정된 이러한 클래스는 컴퓨팅 리소스와 객체 스토리지 작업의 I/O 요구 사항 간의 균형을 맞추도록 설계되었습니다. db.influxIOIncluded 컴퓨팅 인스턴스는 Amazon S3에 대해 수행되는 모든 I/O 작업을 이미 포함하도록 가격이 책정되므로 특정 I/O 패턴과 관계없이 고객에게 예측 가능한 비용을 제공합니다.

다음 표에는 InfluxDB 3 클러스터 노드 클래스의 하드웨어 세부 정보가 나와 있습니다.

인스턴스 클래스	vCPU	메모리(GiB)	[Storage Type]	네트워크 대역폭(Gbps)
db.influxIOIncluded.medium	1	8	S3 객체 스토리지	12
db.influxIOIncluded.large	2	16	S3 객체 스토리지	12
db.influxIOIncluded.xlarge	4	32	S3 객체 스토리지	15
db.influxIOIncluded.2xlarge	8	64	S3 객체 스토리지	20
db.influxIOIncluded.4xlarge	16	128	S3 객체 스토리지	25
db.influxIOIncluded.8xlarge	32	256	S3 객체 스토리지	30
db.influxIOIncluded.12xlarge	48	384	S3 객체 스토리지	22.5
db.influxIOIncluded.16xlarge	64	512	S3 객체 스토리지	30
db.influxIOIncluded.24xlarge	96	768	S3 객체 스토리지	40

db.influxIOIncluded 인스턴스 클래스는 다음과 같은 목적으로 특별히 설계되었습니다.

컴퓨팅 노드와 Amazon S3 객체 스토리지 간의 I/O 작업을 효율적으로 관리합니다.
Apache Arrow 프레임워크를 사용하여 시계열 데이터를 처리할 때 최적의 메모리-CPU 비율을 제공합니다.
Data Fusion 쿼리 엔진의 계산 요구 사항을 지원합니다.

다중 노드 클러스터가 있는 Enterprise 배포의 경우 모든 노드는 동일한 인스턴스 클래스를 사용하여 클러스터 전체에서 균형 잡힌 성능을 보장합니다. 워크로드가 증가함에 따라 클러스터의 모든 노드에 대해 더 큰 인스턴스 클래스를 선택하여 스케일 업하거나 클러스터에 동일한 클래스의 노드를 더 추가하여 스케일 아웃할 수 있습니다.

DB 클러스터 클래스의 하드웨어 사양

다음 용어는 DB 클러스터 클래스의 하드웨어 사양을 기술합니다.

vCPU - 가상 CPU(중앙 처리 디바이스)의 수입니다. 가상 CPU는 DB 클러스터 클래스를 비교하는 데 사용할 수 있는 용량 단위입니다.
메모리(GiB) - DB 클러스터 노드에 할당되는 RAM(단위: 기비바이트)입니다. 메모리와 vCPU 간 일정한 비율이 존재하는 경우가 많다는 점에 유의하세요.
스토리지 유형 - InfluxDB 3는 컴퓨팅 노드와 분리된 S3 객체 스토리지를 사용합니다.
네트워크 대역폭 - 다른 DB 클러스터 클래스에 상대적인 네트워크 속도입니다.

DB 클러스터 스토리지

Amazon Timestream for InfluxDB 3는 객체 스토리지에 Amazon S3를 활용하여 스토리지에서 컴퓨팅을 분리하는 다른 스토리지 아키텍처를 도입합니다. 이 아키텍처는 대규모 배포에서 비용을 제어하면서 거의 무제한의 스토리지 용량을 제공합니다.

InfluxDB 객체 스토리지

InfluxDB 3 클러스터는 Amazon S3를 기반으로 구축된 InfluxDB 객체 스토리지라는 단일 스토리지 클래스를 사용합니다. 이 스토리지 옵션은 다음을 제공합니다.

거의 무제한의 스토리지 용량
대용량 데이터 볼륨을 위한 비용 효율적인 스토리지(InfluxDB 2.x에 비해 16TB를 초과하는 배포의 경우 최대 75% 절감)
99.999999999%의 내구성
효율적인 압축 및 쿼리 성능을 위해 열 기반 Parquet 형식으로 저장된 데이터

스토리지가 컴퓨팅 노드에 직접 연결되는 기존 데이터베이스 아키텍처와 달리 InfluxDB 3의 객체 스토리지는 클러스터의 모든 노드에서 공유됩니다. 각 노드는 기본 데이터가 Amazon S3에 유지되는 동안 쿼리 성능을 최적화하기 위해 자주 액세스하는 데이터에 대한 로컬 인 메모리 캐시를 유지합니다.

InfluxDB 객체 스토리지 요금은 다음을 기반으로 합니다.

저장된 총 데이터 볼륨(GB/월), 최소 월별 요금 200GB

db.influxIOIncluded 인스턴스 클래스의 경우 I/O 작업 비용이 컴퓨팅 요금에 포함되므로 특정 I/O 패턴과 관계없이 고객에게 더 예측 가능한 비용을 제공합니다.

스토리지 아키텍처의 이점

InfluxDB 3의 Amazon S3 기반 스토리지 아키텍처는 다음과 같은 경우에 특히 유용합니다.

대규모 시계열 분석 워크로드
카디널리티가 높은 데이터 요구 사항
장기 데이터 보존 시나리오
대규모 시계열 데이터세트의 비용 효과적인 스토리지

이 스토리지 모델은 장기 스토리지 및 분석 사용 사례에 최적화된 객체 스토어 기반 Timestream for LiveAnalytics의 마그네틱 스토리지 티어와 유사합니다. InfluxDB 3의 스토리지 경제성은 대규모 시계열 워크로드 및 데이터를 장기간 실행하고 저장하려는 고객에게 적합한 것으로 검증된 모델인 LiveAnalytics의 마그네틱 스토어 요금과 경쟁하도록 설계되었습니다.

DB 클러스터 크기 조정

Timestream for InfluxDB 3 클러스터의 최적 구성은 수집 속도, 배치 크기, 시계열 카디널리티, 동시 쿼리 수, 쿼리 유형 등의 다양한 요소에 따라 달라집니다.

InfluxDB 3 클러스터의 크기를 조정할 때는 아키텍처가 다르기 때문에 다음과 같은 추가 요소를 고려하세요.

스토리지 효율성: 데이터가 16TB를 초과하는 배포의 경우 InfluxDB 3의 객체 스토리지는 Timestream for InfluxDB 2 배포에 비해 최대 75%의 비용 절감 효과를 제공할 수 있습니다.
워크로드 특성: InfluxDB 3는 더 짧은 시간 범위 쿼리를 위해 버전 1.x 및 2.x와 유사한 성능을 제공하면서 대규모 데이터세트에 비해 카디널리티가 높은 데이터 및 분석 쿼리에 최적화되어 있습니다. 또한 마지막 값 및 고유 값 캐시와 같은 기능을 사용하면 최신 데이터 포인트 또는 고유한 메타데이터 값 검색과 같은 특정 사용 사례에 대해 10ms 미만의 쿼리 지연 시간을 유지할 수 있습니다.
쿼리 패턴: 워크로드가 지속적(24/7 모니터링)인지 간헐적(정기 분석)인지 고려하세요.
압축 요구 사항: Enterprise 버전에는 장기 데이터 스토리지와 높은 카디널리티 워크로드에 필수적인 압축 기능이 포함되어 있습니다. 3노드 이상의 클러스터를 사용하는 배포의 경우 다른 개별 노드에서 라이터 및 리더 성능을 극대화하여 압축 프로세스가 쿼리 및 수집 작업을 통해 리소스와 경쟁하지 않도록 전용 압축기 노드를 사용하는 것이 좋습니다.

크기 조정 권장 사항을 제공하기 위해 다음과 같은 특성을 가진 대표적인 워크로드를 고려해 보겠습니다.

데이터 센터로부터 시스템, CPU, 메모리, 디스크, IO 등의 정보를 수집하는 Telegraf 에이전트 플릿에서 데이터를 수집하고 씁니다.
각 쓰기 요청에는 5,000줄이 포함됩니다.
시스템에서 실행되는 쿼리는 ‘중간 복잡도’ 쿼리로 분류되며 다음과 같은 특성을 보입니다.
- 여러 함수와 하나 또는 2개의 정규 표현식을 포함합니다.
- 그룹화 기준 절을 포함하거나 수 주의 시간 범위를 샘플링할 수 있습니다.
- 일반적으로 실행하는 데 수백 밀리초에서 수천 밀리초가 소요됩니다.
- CPU는 주로 쿼리 성능을 우선시합니다.
- 모든 테스트는 3,000만 개의 시계열 카디널리티가 포함된 데이터세트를 사용하여 수행되었습니다.

쓰기(초당 줄 수)	읽기(초당 쿼리 수)	인스턴스 클래스	버전
~150000	<25	db.influxIOIncluded.large	Core
~200,000	~25	db.influxIOIncluded.xlarge	Core
~250,000	~35	db.influxIOIncluded.2xlarge	엔터프라이즈
~500,000	~50	db.influxIOIncluded.4xlarge	엔터프라이즈
<750000	<100	db.influxIOIncluded.8xlarge	엔터프라이즈
>750000	>100	다중 노드 Enterprise 클러스터	엔터프라이즈

Amazon Timestream for InfluxDB 3의 DB 클러스터 청구

Amazon Timestream for InfluxDB 3 클러스터는 다음 구성 요소를 기준으로 요금이 청구됩니다.

DB 클러스터 노드 시간(시간당) - DB 클러스터 노드 클래스(예: db.influxIOIncluded.large)를 기준으로 합니다. 요금은 시간 단위로 고시되지만, 청구서는 초 단위로 계산되고 시간을 10진수 형식으로 표시합니다. 사용량은 1초 단위로 청구되며 최소 청구 시간은 10분입니다. 단일 노드 Core 배포 또는 다중 노드 Enterprise 배포의 경우 각 노드는 실행 시간에 따라 별도로 요금이 청구됩니다.
객체 스토리지(월별 GB당) - 프로비저닝된 용량이 아닌 InfluxDB 객체 스토리지에 저장된 실제 데이터 볼륨입니다. 이 모델은 사용하는 스토리지만큼만 비용을 지불하면 되므로 스토리지 용량을 사전에 프로비저닝할 필요가 없습니다.참고: 실제 스토리지 사용량이 더 적더라도 월 최소 200GB에 해당하는 스토리지 요금이 부과됩니다.
데이터 전송(GB당) - DB 클러스터에서 인터넷 또는 기타 AWS 리전으로 데이터를 전송합니다. 동일한 VPC 내 또는 트래픽 또는 동일한 내 가용 영역 간 데이터 전송 AWS 리전 은 무료입니다.
InfluxDB 3 Enterprise 라이선스(시간당 vCPU당) - InfluxDB 3 Enterprise 배포의 경우 시간당 vCPU당 추가 InfluxData 라이선스 비용이 부과됩니다. 이 라이선스 요금은를 통해 직접 청구 AWS Marketplace 되며 AWS 청구서에 별도의 품목으로 표시됩니다. 라이선스는 다중 노드 클러스터링, 압축 기능 및 고급 보안 기능과 같은 Enterprise 기능을 활성화합니다.

여러 노드가 있는 InfluxDB 3 Enterprise 클러스터의 경우 각 노드는 인스턴스 클래스 및 vCPU 수(라이선스 요금)에 따라 별도로 요금이 청구되는 반면, 모든 노드가 동일한 기본 객체 스토리지를 공유하므로 스토리지 비용이 통합됩니다.

청구 구성 요소 요약

청구 구성 요소	InfluxDB 3 Core	InfluxDB 3 Enterprise
컴퓨팅 청구	노드 시간당(db.influxIOIncluded 클래스)	노드 시간당(db.influxIOIncluded 클래스)
스토리지 청구	저장된 데이터 1GB당(최소 200GB)	저장된 데이터 1GB당(최소 200GB)
I/O 작업	컴퓨팅 노드 요금에 포함됨	컴퓨팅 노드 요금에 포함됨
스토리지 규모 조정	필요하지 않음, 사용된 스토리지에 대해서만 지불	필요하지 않음, 사용된 스토리지에 대해서만 지불
데이터 수신	무료	무료
VPC/AZ 내 데이터 전송	무료	무료
데이터 발신(인터넷/교차 리전)	GB당 요금 부과	GB당 요금 부과
최소 청구	10분	10분
청구 세부 수준	1초 간격	1초 간격
다중 노드 지원	아니요(단일 노드만 해당)	예
추가 라이선스	없음	를 통해 시간당 vCPU당 AWS Marketplace

비용 최적화 전략

올바른 크기 조정 -오버프로비저닝을 방지하려면 워크로드 요구 사항에 따라 적절한 노드 클래스를 선택합니다. 또한 평균 약 65%의 CPU 및 메모리 사용률을 유지하는 인스턴스를 선택하여 사용량 급증에 대한 복원력을 보장하고 정상적인 용량 계획을 위한 여유 공간을 확보하는 것이 좋습니다.
스토리지 효율성 - 데이터가 16TB를 초과하는 배포의 경우 InfluxDB 3의 객체 스토리지는 기존 EBS 기반 솔루션에 비해 최대 75%의 비용 절감 효과를 제공할 수 있습니다.
네트워크 트래픽 최적화 - 데이터 전송 요금을 방지하기 위해 가능하면 동일한 VPC 또는 리전 내에 데이터 전송을 유지합니다.
조정 전략 - InfluxDB 3 Enterprise의 경우 스케일 업(더 큰 노드 클래스) 또는 스케일 아웃(더 많은 노드)이 특정 워크로드 패턴에 대해 더 비용 효과적인지 고려합니다.
라이선스 최적화 - InfluxDB 3 Enterprise의 경우 vCPU 수(라이선스 비용에 영향을 미침)와 성능 요구 사항 간에 최적의 균형을 제공하는 노드 클래스를 선택합니다.

Amazon Timestream for InfluxDB 3 요금 정보는Amazon Timestream for InfluxDB 요금 페이지를 참조하세요.

AWS 리전 및 가용 영역

Amazon 클라우드 컴퓨팅 리소스는 세계 각지의 여러 곳에서 호스팅됩니다. 이러한 위치는 AWS 리전 및 가용 영역으로 구성됩니다. 각각은 별도의 지리적 영역 AWS 리전 입니다. 각 AWS 리전 에는 가용 영역이라고 하는 격리된 위치가 여러 개 있습니다.

Amazon Timestream for InfluxDB 3를 사용하면 DB 클러스터와 같은 리소스와 데이터를 여러 위치에 배치할 수 있습니다. 다중 노드 클러스터가 있는 Enterprise 배포의 경우 노드는 가용성을 높이기 위해 여러 가용 영역에 분산됩니다.

InfluxDB 3용 Amazon Timestream을 사용할 수 AWS 리전 있는 위치와 각 리전의 엔드포인트에 대한 자세한 내용은 Amazon Timestream 엔드포인트 및 할당량을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

문서 이력

InfluxDB 3 시작하기