Amazon Redshift は、2025 年 11 月 1 日以降、新しい Python UDF の作成をサポートしなくなります。Python UDF を使用する場合は、その日付より前に UDF を作成してください。既存の Python UDF は引き続き通常どおり機能します。詳細については、ブログ記事
Amazon Redshift で空間データを使用する際の考慮事項
Amazon Redshift で空間データを使用する際の考慮事項は以下のとおりです。
GEOMETRYあるいはGEOGRAPHYオブジェクトの最大サイズは、1,048,447 バイトです。Amazon Redshift Spectrum では、空間データをネイティブにサポートしていません。したがって、
GEOMETRYもしくはGEOGRAPHYの列がある外部テーブルを作成または修正することはできません。Python のユーザー定義関数 (UDF) のデータでは、
GEOMETRYとGEOGRAPHYのデータ型はサポートされません。Amazon Redshift テーブルでは、
GEOMETRYやGEOGRAPHY列をソートキーとして、あるいは分散キーとして使用することはできません。SQL ORDER BY、GROUP BY、または DISTINCT 句の中で、
GEOMETRYやGEOGRAPHY列を使用することはできません。GEOMETRYとGEOGRAPHY列が使用できない SQL 関数は多数あります。GEOMETRYおよびGEOGRAPHY列に関しては、すべての形式で UNLOAD オペレーションを実行できる訳ではありません。テキストまたはコンマ区切り値 (CSV) ファイルに対しては、GEOMETRYあるいはGEOGRAPHYの列を UNLOAD することが可能です。この処理により、GEOMETRYあるいはGEOGRAPHYのデータは 16 進数の EWKB 形式で書き込まれます。EWKB データのサイズが 4 MB 以上の場合、後でテーブルにデータをロードできなくなるため、警告が表示されます。GEOMETRYとGEOGRAPHYのデータでサポートされている圧縮エンコードは RAW です。JDBC または ODBC ドライバを使用する際は、カスタム型マッピングを使います。この場合、クライアントアプリケーションには、
ResultSetオブジェクトのどのパラメータが、GEOMETRYもしくはGEOGRAPHYのオブジェクトであるかに関する情報が必要です。ResultSetMetadataのオペレーションにより、タイプVARCHARが返されます。SHAPEFILEから地理的データをコピーするには、まずGEOMETRY列の中にデータを取り込んだ後、対象のオブジェクトをGEOGRAPHYオブジェクトにキャストします。
以下に示す非空間関数では、GEOMETRY と GEOGRAPHY 型の入力または GEOMETRY と GEOGRAPHY 型の列に対応することができます。
集計関数 COUNT
条件式 COALESCE および NVL
CASE 式
GEOMETRYおよびGEOGRAPHYでのデフォルトのエンコーディングは RAW です。詳細については、「圧縮エンコード」を参照してください。