Amazon RDS のブルー/グリーンデプロイのベストプラクティス - Amazon Relational Database Service

Amazon RDS のブルー/グリーンデプロイのベストプラクティス

ブルー/グリーンデプロイのベストプラクティスを以下に示します。

ブルー/グリーンデプロイの一般的なベストプラクティス

ブルー/グリーンデプロイを作成するときは、次の一般的なベストプラクティスを考慮してください。

  • 切り替える前に、DB インスタンスをグリーン環境で十分にテストしてください。

  • グリーン環境のデータベースは読み取り専用のまま維持してください。グリーン環境ではレプリケーションの競合が発生する可能性があるため、書き込み操作の有効にする場合は注意してください。また、スイッチオーバー後に本稼働データベースに意図しないデータが発生する可能性もあります。

  • ブルー/グリーンデプロイを使用してスキーマの変更を実装する場合は、レプリケーション互換の変更のみを行ってください。

    例えば、ブルーデプロイからグリーンデプロイへのレプリケーションを中断することなく、テーブルの最後に新しい列を追加することができます。ただし、列名の変更やテーブル名の変更などのスキーマの変更は、グリーンデプロイへのレプリケーションを中断させます。

    レプリケーションと互換性のある変更の詳細については、MySQL ドキュメントの「ソースとレプリカのテーブル定義が異なるレプリケーション」と PostgreSQL 論理レプリケーションドキュメントの「制限」を参照してください。

    注記

    この制限は、物理レプリケーションを使用する RDS for PostgreSQL ブルー/グリーンデプロイには適用されません。詳細については、「物理レプリケーションを使用した RDS for PostgreSQL のブルー/グリーンデプロイの制限事項」を参照してください。

  • ブルー/グリーンデプロイを作成した後、必要に応じて遅延読み込みを処理します。切り替える前に、データの読み込みが完了していることを確認してください。詳細については、「ブルー/グリーンデプロイの遅延読み込みとストレージの初期化」を参照してください。

  • ブルー/グリーンデプロイメントを切り替えるときは、切り替えのベストプラクティスに従ってください。詳細については、「切り替えのベストプラクティス」を参照してください。

RDS for MySQL のブルー/グリーンデプロイのベストプラクティス

RDS for MySQL DB インスタンスからブルー/グリーンデプロイを作成するときは、次のベストプラクティスを考慮してください。

  • MyISAM など、レプリケーション用に最適化されていない非トランザクションストレージエンジンの使用は避けてください。

  • リードレプリカとグリーン環境をバイナリログレプリケーション用に最適化します。DB エンジンでサポートされている場合は、ブルー/グリーンデプロイを作成する前に、GTID、並列、クラッシュセーフレプリケーションを有効にして、データの整合性と耐久性を確保します。詳細については、「GTID ベースレプリケーションを使用する」を参照してください。

  • グリーン環境でレプリカの遅延が発生した場合は、以下の点を考慮します。

    • グリーン DB パラメータグループで innodb_flush_log_at_trx_commit パラメータを一時的に 2 に設定します。レプリケーションが追い付いたら、スイッチオーバーの前にデフォルト値 1 に戻します。一時的なパラメータ値で予期しないシャットダウンやクラッシュが発生した場合は、検出されないデータ破損を避けるためにグリーン環境を再構築します。

    • 書き込みレイテンシーを短縮し、レプリケーションスループットを向上させるには、一時的にグリーンマルチ AZ DB インスタンスをシングル AZ DB インスタンスに変更します。スイッチオーバーの直前にマルチ AZ を再度有効にします。

RDS for PostgreSQL のブルー/グリーンデプロイのベストプラクティス

RDS for PostgreSQL DB インスタンスからブルー/グリーンデプロイを作成するときは、次のベストプラクティスを考慮してください。

RDS for PostgreSQL のブルー/グリーンデプロイの一般的なベストプラクティス

RDS for PostgreSQL DB インスタンスからブルー/グリーンデプロイを作成するときは、次の一般的なベストプラクティスを考慮してください。

  • ブルー/グリーンデプロイを作成するときには、すべての PostgreSQL 拡張機能を最新バージョンに更新してください。詳細については、「RDS for PostgreSQL データベースでの PostgreSQL 拡張機能のアップグレード」を参照してください。

  • トランザクションの実行時間が長いと、レプリカの遅延が大きくなる可能性があります。レプリカの遅延を減らすには、以下を検討します。

    • グリーン環境がブルー環境に追いつくまで、遅延が発生する可能性があり長時間実行されるトランザクションを減らします。

    • グリーン環境がブルー環境に追いつくまで、ブルー環境での一括オペレーションを減らします。

    • ブルー/グリーンデプロイを作成する前に、ビジーテーブルで手動バキュームフリーズオペレーションを開始します。

    • PostgreSQL バージョン 12 以降では、大きなテーブルまたはビジーテーブルで index_cleanup パラメータを無効にして、ブルーデータベースの通常のメンテナンスのレートを高くします。詳細については、「テーブルをできるだけ早くバキューム処理する」を参照してください。

      注記

      バキューム中にインデックスのクリーンアップを定期的にスキップすると、インデックスが肥大化し、スキャンパフォーマンスが低下する可能性があります。ベストプラクティスとして、このアプローチはブルー/グリーンデプロイの使用時にのみ使用してください。デプロイが完了したら、インデックスの定期的なメンテナンスとクリーンアップを再開することをお勧めします。

  • レプリケーションが遅い場合、送信者と受信者が頻繁に再起動し、同期が遅れる可能性があります。送信者と受信者が再起動しないようにするには、ブルー環境で wal_sender_timeout パラメータを 0 に設定し、グリーン環境で wal_receiver_timeout パラメータを 0 に設定してタイムアウトを無効にします。

  • ブルー環境からログ先行書き込み (WAL) セグメントが削除されないようにするには、PostgreSQL バージョン 13 以前では wal_keep_segments パラメータを 15625 に設定します。バージョン 14 以降では、十分な空きストレージ容量がある場合は、wal_keep_size パラメータを 1 TiB に設定します。

物理レプリケーションを使用した RDS for PostgreSQL のブルー/グリーンデプロイのベストプラクティス

物理レプリケーションを使用して、Amazon RDS はソース DB インスタンスのリードレプリカを作成します。関連するパラメータ、モニタリング、チューニング、トラブルシューティングについては、「Amazon RDS for PostgreSQL でのリードレプリカの使用」を参照してください。

ブルー/グリーンデプロイが論理レプリケーションではなく物理レプリケーションを使用する状況については、「ブルー/グリーンデプロイの PostgreSQL レプリケーション方法」を参照してください。

論理レプリケーションを使用した RDS for PostgreSQL のブルー/グリーンデプロイのベストプラクティス

論理レプリケーションを使用するブルー/グリーンデプロイを作成するときは、次のベストプラクティスを考慮してください。ブルー/グリーンデプロイが物理レプリケーションではなく論理レプリケーションを使用する状況については、「ブルー/グリーンデプロイの PostgreSQL レプリケーション方法」を参照してください。

  • データベースが に十分な空きメモリがある場合は、ブルー環境の logical_decoding_work_mem DB パラメータの値を増やします。そうすることで、ディスク上でのデコード回数が減り、代わりにメモリを消費します。詳細については、PostgreSQL ドキュメントをご参照ください。

    • ReplicationSlotDiskUsage CloudWatch メトリクスを使用して、ディスクに書き込まれるトランザクションのオーバーフローをモニタリングできます。このメトリクスは、レプリケーションスロットのディスク使用状況に関するインサイトを提供し、トランザクションデータがメモリ容量を超えてディスクに保存されるタイミングを特定するのに役立ちます。FreeableMemory CloudWatch メトリクスを使用して空きメモリをモニタリングできます。詳細については、「Amazon RDS の Amazon CloudWatch インスタンスレベルのメトリクス」を参照してください。

    • RDS for PostgreSQL バージョン 14 以降では、pg_stat_replication_slots システムビューを使用して論理オーバーフローファイルのサイズをモニタリングできます。

  • aws_s3 拡張機能を使用している場合は、グリーン環境が作成された後に、必ず IAM ロールを通じてグリーン DB インスタンスに Amazon S3 へのアクセスを許可してください。これにより、インポートコマンドとエクスポートコマンドは、スイッチオーバー後も機能し続けることができます。手順については、「Amazon S3 バケットへのアクセスを設定する」を参照してください。

  • UPDATE ステートメントと DELETE ステートメントのパフォーマンスを確認し、WHERE 句で使用する列にインデックスを作成することで、これらのクエリを最適化できるかどうかを評価します。これにより、グリーン環境でオペレーションを再生するときのパフォーマンスを向上させることができます。

  • トリガーを使用する場合は、名前が「rds」で始まる pg_catalog.pg_publicationpg_catalog.pg_subscriptionpg_catalog.pg_replication_slots オブジェクトの作成、更新、削除を妨げないようにしてください。

  • グリーン環境でより上位のエンジンバージョンを指定する場合は、すべてのデータベースに対して ANALYZE オペレーションを実行して pg_statistic テーブルを更新します。Optimizer の統計情報はメジャーバージョンのアップグレード時に転送されないため、パフォーマンスの問題を回避するためにすべての統計情報を再生成する必要があります。メジャーバージョンアップグレード時のその他のベストプラクティスについては、「RDS for PostgreSQL のメジャーバージョンアップグレードを実行する方法」を参照してください。

  • ソースでトリガーを使用してデータを操作している場合は、トリガーを ENABLE REPLICA または ENABLE ALWAYS として設定しないでください。レプリケーションシステムが変更を伝播してトリガーを実行し、重複を引き起こします。