Amazon Redshift は、2025 年 11 月 1 日以降、新しい Python UDF の作成をサポートしなくなります。Python UDF を使用する場合は、その日付より前に UDF を作成してください。既存の Python UDF は引き続き通常どおり機能します。詳細については、ブログ記事
SYS_STREAM_SCAN_STATES
ストリーミング取り込みによってロードされたレコードのスキャン状態を記録します。
SYS_STREAM_SCAN_STATES はすべてのユーザーに表示されます。スーパーユーザーはすべての行を表示できますが、通常のユーザーは自分のデータのみを表示できます。詳細については、「システムテーブルとビューのデータの可視性」を参照してください。
テーブルの列
| 列名 | データ型 | 説明 |
|---|---|---|
| external_schema_name | character(128) | 外部スキーマ名。大文字と小文字は区別されます。 |
| stream_name | character(255) | ストリーム名。大文字と小文字は区別されます。 |
| mv_name | character(128) | 関連するマテリアライズドビューの名前。何もない場合は空。大文字と小文字は区別されます。 |
| transaction_id | bigint | トランザクション ID。 |
| query_id | bigint | クエリ ID。 |
| record_time | タイムゾーンなしのタイムスタンプ | データが記録された時刻。 |
| partition_id | character(128) | パーティションまたはシャード ID。大文字と小文字は区別されます。 |
| latest_position | character(128) | バッチで最後に読み取られたレコードの位置。これは Kinesis のシーケンス番号または Amazon MSK のオフセットに対応します。大文字と小文字は区別されます。 |
| scanned_rows | bigint | バッチでスキャンされたレコードの数。 |
| skipped_rows | bigint | バッチでスキップされたレコードの数。 |
| scanned_bytes | bigint | バッチでスキャンされたバイト数。 |
| stream_record_time_min | タイムゾーンなしのタイムスタンプ | バッチ内の最も早いレコードの Kinesis または Amazon MSK の到着時刻。 |
| stream_record_time_max | タイムゾーンなしのタイムスタンプ | バッチ内の最新のレコードの Kinesis または Amazon MSK の到着時刻。 |
次のクエリは、特定のクエリのストリームとトピックデータを表示します。
select query_id,mv_name::varchar,external_schema_name::varchar,stream_name::varchar,sum(scanned_rows) total_records, sum(scanned_bytes) total_bytes from sys_stream_scan_states where query in (5401180,8601939) group by 1,2,3,4; query_id | mv_name | external_schema_name | stream_name | total_records | total_bytes ------------+----------------+----------------------+-----------------+---------------+---------------- 5401180 | kinesistest | kinesis | kinesisstream | 1493255696 | 3209006490704 8601939 | msktest | msk | mskstream | 14677023 | 31056580668 (2 rows)