

# 統合の設定
<a name="zero-etl-configuring-integration"></a>

ゼロ ETL 統合を設定するときは、ソースシステムとターゲットシステム間のデータの同期方法を制御するために、さまざまなパラメータを設定できます。現在、以下の設定は SaaS ソースにのみ使用できます。

## 更新間隔の設定
<a name="zero-etl-config-refresh-interval"></a>

統合の作成時に、SaaS ソースの統合の更新間隔を設定できます。デフォルト値は 1 時間です。CDC (Change Data Capture) プルまたは増分ロードが発生する頻度を設定できます。これは、更新レートを特定のデータ更新パターン、システム負荷に関する考慮事項、パフォーマンス最適化の目標に柔軟に合わせることができます。時間増分は 15 分から 8640 分 (6 日間) に設定できます。ターゲットが Redshift の場合、統合の作成後に更新間隔を変更することはできません。他のターゲットでは、統合の作成後に更新間隔を変更できます。更新間隔が 24 時間以上の DynamoDB ソースの場合、シーケンシャル日次バッチ処理の詳細については「[DynamoDB ソースの連続した日次バッチ](#zero-etl-config-refresh-interval-ddb-batches)」を参照してください。

これは、レプリケーション設定内の更新間隔をアップデートすることで、コンソールから実行できます。

![このスクリーンショットは、ゼロ ETL 統合設定の refreshInterval パラメータ設定を示しています。](http://docs.aws.amazon.com/ja_jp/glue/latest/dg/images/refreshinterval.png)


時間増分は 15 分から 8640 分 (6 日) まで設定できるため、データの鮮度とシステムリソース使用率のバランスをとることができます。現在、更新間隔は DynamoDB ソースと SaaS ソースの両方でカスタマイズできます。
+ **最小間隔:** 15 分
+ **最大間隔:** 8640 分 (6 日間)
+ **デフォルト値:** DynamoDB ソースの場合は 15 分、SaaS ソースの場合は 60 分

更新間隔を選択するときに考慮すべき要素:
+ **データの変動性:** ソースデータの変更頻度
+ **ビジネス要件:** 分析データにおいて要求される最新状態
+ **コストに関する考慮事項:** 更新頻度が高いほど、処理コストとストレージコストが高くなる可能性があります

**注記**  
RefreshInterval パラメータは、CDC のトリガーの頻度を定義します。実際の更新頻度は、ソースデータの変更量とターゲットシステムの処理能力の影響を受ける可能性があります。統合パフォーマンスをモニタリングし、必要に応じて更新間隔を調整して特定のユースケースに合わせて最適化します。

または、API を使用して CreateIntegration リクエストの一部として [IntegrationConfig](https://docs.aws.amazon.com/glue/latest/webapi/API_IntegrationConfig.html) 内で `RefreshInterval` を渡します。更新間隔をプログラムで変更するには、IntegrationConfig パラメータで [ModifyIntegration API](https://docs.aws.amazon.com/glue/latest/webapi/API_ModifyIntegration.html#API_ModifyIntegration_RequestSyntax) を使用できます。

### DynamoDB ソースの連続した日次バッチ
<a name="zero-etl-config-refresh-interval-ddb-batches"></a>

Amazon DynamoDB ソースとのゼロ ETL 統合の場合、1440 分 (24 時間) 以上の更新間隔を設定すると、統合は 1 回のエクスポートオペレーションではなく、シーケンシャル日次バッチ処理を使用します。この動作は、最大エクスポート期間が 24 時間である [DynamoDB エクスポートウィンドウの制限](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/ServiceQuotas.html)によるものです。

更新間隔が 24 時間を超えると、統合は次のように動作します。

1. CDC プロセスは、完全な更新間隔の期間 (例えば、8640 分の間隔は 6 日間) 待機します。

1. 更新間隔が経過すると、統合は複数のシーケンシャル DynamoDB エクスポートを実行し、それぞれが最大 24 時間のウィンドウをカバーします。

1. CDC ジョブは各バッチを順番に処理して、更新間隔期間中に発生したすべての変更をキャプチャします。

例えば、更新間隔を 8640 分 (6 日) に設定すると、統合は 6 日間待機し、6 つまたは 7 つのシーケンシャルエクスポート (エクスポートオペレーションに費やされた余分な時間をカバーする 1 つのテールエクスポート) と CDC ジョブを実行して、その期間からのすべての変更を同期します。

## オンデマンドスナップショット
<a name="zero-etl-config-continuous-sync"></a>

ゼロ ETL にはデフォルトで連続データキャプチャ (CDC) が含まれていますが、フルデータを 1 回レプリケートできるユースケースがある場合は、オンデマンドスナップショット機能を使用すればそれを実行できます。現在 SaaS ソースに対してのみサポートされているこの機能を使用すれば、連続同期なしでデータを 1 回レプリケートできます。このオプションでは、連続アップデートなしの 1 回限りのデータレプリケーションが可能ですが、手動クリーンアップが必須です。レプリケーションが完了したら、アカウント統合の限界に達しないように、統合リソースを削除することをお勧めします。

![このスクリーンショットは、On-demand Snapshot の設定を示しています。](http://docs.aws.amazon.com/ja_jp/glue/latest/dg/images/ContinuousSync.png)


または、API を使用して、CreateIntegration リクエストの一部として [IntegrationConfig](https://docs.aws.amazon.com/glue/latest/webapi/API_IntegrationConfig.html) 内で `ContinuousSync` パラメータを `false` に設定します。

**注記**  
On-demand Snapshot 設定は、統合の作成後に変更することはできません。データ同期の要件に基づいて、このオプションを慎重に選択します。

## 更新間隔の変更
<a name="zero-etl-config-modify-refresh-interval"></a>

この機能は現在、AWS Glue ターゲットにのみ使用でき、既存の統合の更新間隔をアップデートできます。