filter 関数と reduce 関数 - Amazon Timestream

Amazon Timestream for LiveAnalytics に類似した機能をご希望の場合は Amazon Timestream for InfluxDB をご検討ください。リアルタイム分析に適した、シンプルなデータインジェストと 1 桁ミリ秒のクエリ応答時間を特徴としています。詳細については、こちらを参照してください。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

filter 関数と reduce 関数

Amazon Timestream は、時系列データに対してフィルタリングを実行し、オペレーションを減らすための関数をサポートしています。このセクションでは、Timestream for LiveAnalytics における filter 関数と reduce 関数の使用状況の情報とサンプルクエリについて説明します。

使用状況の情報

関数 出力データ型 説明

filter(timeseries(T), function(T, Boolean))

timeseries(T)

渡された functiontrue を返した値を使用して、入力時系列から時系列を作成します。

reduce(timeseries(T), initialState S, inputFunction(S, T, S), outputFunction(S, R))

R

時系列から減らされた単一の値を返します。inputFunction は、各要素で時系列順に呼び出されます。inputFunction は、現在の要素に加えて、現在の状態 (最初は initialState) を取得し、新しい状態を返します。outputFunction が呼び出され、最終状態が結果値になります。outputFunction は恒等関数にすることができます。

クエリの例

測定値が 70 を超えるホストポイントとフィルターポイントの CPU 使用率の時系列を作成します。

WITH time_series_view AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, ROUND(measure_value::double,2)), SEQUENCE(ago(15m), ago(1m), 10s)) AS cpu_user FROM sample.DevOps WHERE hostname = 'host-Hovjv' and measure_name = 'cpu_utilization' AND time > ago(30m) GROUP BY hostname ) SELECT FILTER(cpu_user, x -> x.value > 70.0) AS cpu_above_threshold from time_series_view

ホストの CPU 使用率の時系列を作成し、測定値の二乗和を求めます。

WITH time_series_view AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, ROUND(measure_value::double,2)), SEQUENCE(ago(15m), ago(1m), 10s)) AS cpu_user FROM sample.DevOps WHERE hostname = 'host-Hovjv' and measure_name = 'cpu_utilization' AND time > ago(30m) GROUP BY hostname ) SELECT REDUCE(cpu_user, DOUBLE '0.0', (s, x) -> x.value * x.value + s, s -> s) from time_series_view

ホストの CPU 使用率の時系列を作成し、CPU しきい値を超えるサンプルの割合を求めます。

WITH time_series_view AS ( SELECT INTERPOLATE_LINEAR( CREATE_TIME_SERIES(time, ROUND(measure_value::double,2)), SEQUENCE(ago(15m), ago(1m), 10s)) AS cpu_user FROM sample.DevOps WHERE hostname = 'host-Hovjv' and measure_name = 'cpu_utilization' AND time > ago(30m) GROUP BY hostname ) SELECT ROUND( REDUCE(cpu_user, -- initial state CAST(ROW(0, 0) AS ROW(count_high BIGINT, count_total BIGINT)), -- function to count the total points and points above a certain threshold (s, x) -> CAST(ROW(s.count_high + IF(x.value > 70.0, 1, 0), s.count_total + 1) AS ROW(count_high BIGINT, count_total BIGINT)), -- output function converting the counts to fraction above threshold s -> IF(s.count_total = 0, NULL, CAST(s.count_high AS DOUBLE) / s.count_total)), 4) AS fraction_cpu_above_threshold from time_series_view