스트림 처리를 위한 과제
실시간 데이터가 도착할 때 처리하면 기존 데이터 분석 기술보다 훨씬 빠르게 의사 결정을 내릴 수 있습니다. 하지만 자체 사용자 정의 스트리밍 데이터 파이프라인을 구축하고 운영하는 것은 복잡하고 리소스가 많이 필요한 작업입니다.
-
따라서 수천 개의 데이터 원본에서 동시에 들어오는 데이터를 비용 효율적으로 수집, 준비 및 전송할 수 있는 시스템을 구축해야 합니다.
최대 처리량과 짧은 대기 시간을 위해 데이터를 효율적으로 배치 처리하고 전송할 수 있도록 스토리지 및 컴퓨팅 리소스를 미세 조정해야 합니다.
-
다양한 속도의 데이터를 처리할 수 있도록 시스템을 확장하려면 여러 서버를 배포하고 관리해야 합니다.
버전 업그레이드는 복잡하고 비용이 많이 드는 프로세스입니다. 이 플랫폼을 구축한 후에는 중복 데이터를 생성하지 않고 스트림의 적절한 지점에서 데이터 처리를 추적하여 시스템을 모니터링하고 서버 또는 네트워크 장애로부터 복구해야 합니다. 인프라 관리를 위한 전담 팀도 필요합니다. 이 모든 작업에는 귀중한 시간과 비용이 필요하며, 결국 대부분의 기업은 결코 거기에 도달하지 못하고 현상 유지에 안주하며 몇 시간 또는 며칠이 지난 정보로 비즈니스를 운영해야 합니다.