バッチロードデータファイルの準備 - Amazon Timestream

Amazon Timestream for LiveAnalytics に類似した機能をご希望の場合は Amazon Timestream for InfluxDB をご検討ください。リアルタイム分析に適した、シンプルなデータインジェストと 1 桁ミリ秒のクエリ応答時間を特徴としています。詳細については、こちらを参照してください。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

バッチロードデータファイルの準備

ソースデータファイルには区切り文字で区切られた値があります。より具体的な用語でいうと、カンマ区切り値 (CSV) がよく使用されます。列の有効な区切り文字には、カンマとパイプなどがあります。レコードは新しい行で区切られます。ファイルは Amazon S3 に保存する必要があります。新しいバッチロードタスクを作成すると、ソースデータの場所はファイルの ARN によって指定されます。ファイルにはヘッダーが含まれています。1 つの列はタイムスタンプを表します。少なくとも 1 つの他の列はメジャーを表します。

バッチロードで使用される S3 バケットは、バッチロードで使用される Timestream for LiveAnalytics テーブルと同じリージョンに存在する必要があります。バッチロードタスクの送信後に、バッチロードで使用される S3 バケットにファイルを追加または削除しないでください。S3 バケットの取り扱いについて詳しくは、「Amazon S3 の開始方法」を参照してください。

注記

Excel などの一部のアプリケーションによって生成される CSV ファイルには、予想されるエンコーディングと競合するバイトオーダーマーク (BOM) が含まれている場合があります。BOM 付きの CSV ファイルを参照する Timestream for LiveAnalytics のバッチロードタスクは、プログラムで処理されるとエラーをスローします。これを回避するには、非表示の文字である BOM を削除します。

例えば、新しいエンコードを指定できる Notepad++ などのアプリケーションからファイルを保存できます。また、最初の行を読み取ってその行から BOM を削除し、ファイルの最初の行に新しい値を書き込むプログラムオプションを使用することもできます。

Excel から保存する場合、複数の CSV オプションがあります。別の CSV オプションで保存すると、説明した問題の発生を防止できる可能性があります。ただし、エンコードの変更が一部の文字に影響する可能性があるため、結果を確認する必要があります。

CSV 形式パラメータ

エスケープ文字は、形式パラメータで予約されている値を表すときに使用します。例えば、引用文字が二重引用符の場合、データ内で二重引用符を表すには、二重引用符の前にエスケープ文字を配置します。

バッチロードタスクの作成時にこれらを指定するタイミングについては、「バッチロードタスクを作成する」を参照してください。

パラメータ オプション
列区切り文字 (カンマ (',') | パイプ ('|') | セミコロン (';') | タブ ('/t') | 空白 (' '))
エスケープ文字 なし
引用文字 コンソール: (二重引用符 (") | 一重引用符 ('))
Null 値 空白 (' ')
空白を削除する コンソール: (いいえ | はい)