Utilisation de l’utilitaire de chargement de données dans Aurora PostgreSQL Limitless Database - Amazon Aurora

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de l’utilitaire de chargement de données dans Aurora PostgreSQL Limitless Database

Aurora fournit un utilitaire permettant de charger des données directement dans Limitless Database à partir d’un cluster de bases de données Aurora PostgreSQL ou d’une instance de base de données RDS pour PostgreSQL.

Pour utiliser l’utilitaire de chargement de données, procédez comme suit :

Limitations

L’utilitaire de chargement de données présente les limitations suivantes :

  • Les types de données suivants ne sont pas pris en charge : enum, ARRAY, BOX, CIRCLE, LINE, LSEG, PATH, PG_LSN, PG_SNAPSHOT, POLYGON, TSQUERY, TSVECTOR et TXID_SNAPSHOT.

  • Les zéros de tête (0) sont supprimés du type de données VARBIT lors du chargement.

  • La migration des données échoue si les tables de destination contiennent des clés étrangères.

  • Le chargement de données à partir de clusters de bases de données multi-AZ RDS pour PostgreSQL n’est pas pris en charge.

Prérequis

L’utilitaire de chargement de données présente les prérequis suivants :

  • La base de données source utilise Aurora PostgreSQL ou RDS pour PostgreSQL version 11.x ou ultérieure.

  • La base de données source se trouve dans les même Compte AWS et Région AWS que dans le groupe de partitions de base de données de destination.

  • Le cluster de bases de données ou l’instance de base de données source présente l’état available.

  • Les tables de la base de données source et de la base de données sans limite présentent les mêmes noms de tables, noms de colonnes et types de données de colonne.

  • Les tables source et de destination possèdent des clés primaires qui utilisent les mêmes colonnes et les mêmes ordres de colonnes.

  • Vous devez disposer d’un environnement permettant de vous connecter à une base de données sans limite pour exécuter des commandes de chargement de données. Les commandes disponibles sont les suivantes :

    • rds_aurora.limitless_data_load_start

    • rds_aurora.limitless_data_load_cancel

  • Pour CDC :

    • La base de données source et le groupe de partitions de base de données de destination doivent utiliser le même groupe de sous-réseaux de base de données, le même groupe de sécurité VPC et le même port de base de données. Ces configurations concernent les connexions réseau à la fois à la base de données source et aux routeurs du groupe de partitions de base de données.

    • Vous devez activer la réplication logique sur la base de données source. L’utilisateur de la base de données source doit disposer des privilèges nécessaires pour lire la réplication logique.

Préparation de la base de données source

Pour accéder à la base de données source lors du chargement des données, vous devez autoriser le trafic réseau entrant vers celle-ci. Procédez comme suit.

Pour autoriser le trafic réseau vers la base de données source
  1. Connectez-vous à la AWS Management Console et ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.

  2. Accédez à la page Groupes de sécurité.

  3. Choisissez ID du groupe de sécurité pour le groupe de sécurité utilisé par le cluster ou l’instance de base de données source.

    Son groupe de sécurité, par exemple, porte l’ID sg-056a84f1712b77926.

  4. Dans l’onglet Règles entrantes :

    1. Choisissez Modifier les règles entrantes.

    2. Ajoutez une nouvelle règle entrante pour le cluster ou l’instance de base de données source :

      • Plage de ports : port de base de données pour la base de données source, généralement 5432

      • ID du groupe de sécurité : sg-056a84f1712b77926 dans cet exemple

      Ajoutez une règle entrante pour la base de données source.
  5. Dans l’onglet Règles sortantes :

    1. Choisissez Edit outbound rules (Modifier les règles sortantes).

    2. Ajoutez une nouvelle règle sortante pour le cluster ou l’instance de base de données source :

      • Port de base de données : All traffic (comprend les ports 0-65535)

      • ID du groupe de sécurité : sg-056a84f1712b77926 dans cet exemple

      Ajoutez une règle sortante pour la base de données source.
  6. Connectez-vous à la AWS Management Console et ouvrez la console Amazon VPC à l’adresse https://console.aws.amazon.com/vpc/.

  7. Accédez à la page Network ACLs (ACL réseau).

  8. Ajoutez la configuration ACL réseau par défaut comme indiqué dans ACL réseau par défaut.

Préparation de la base de données de destination

Suivez les procédures décrites dans Création de tables Aurora PostgreSQL Limitless Database pour créer les tables de destination dans le groupe de partitions de base de données.

Vos tables de destination doivent utiliser les mêmes schémas, noms de tables et clés primaires que celles des tables sources.

Création des informations d’identification de base de données

Vous devez créer des utilisateurs de base de données dans les bases de données source et de destination, et leur accorder les privilèges nécessaires. Pour plus d’informations, consultez CREATE USER et GRANT dans la documentation de PostgreSQL.

Création des informations d’identification de base de données source

L’utilisateur de la base de données source est spécifié dans la commande permettant de lancer le chargement. Cet utilisateur doit disposer des privilèges nécessaires pour effectuer la réplication à partir de la base de données source.

  1. Utilisez l’utilisateur principal de base de données (ou un autre utilisateur disposant du rôle rds_superuser) pour créer un utilisateur de base de données source bénéficiant de privilèges LOGIN.

    CREATE USER source_db_username WITH PASSWORD 'source_db_user_password';
  2. Accordez le rôle rds_superuser à l’utilisateur de la base de données source.

    GRANT rds_superuser to source_db_username;
  3. Si vous utilisez le mode full_load_and_cdc, accordez le rôle rds_replication à l’utilisateur de la base de données source. Le rôle rds_replication accorde les autorisations permettant de gérer des emplacements logiques et de diffuser les données à l’aide d’emplacements logiques.

    GRANT rds_replication to source_db_username;

Création des informations d’identification de base de données de destination

L’utilisateur de la base de données de destination doit disposer de l’autorisation d’écriture sur les tables de destination du groupe de partitions de base de données.

  1. Utilisez l’utilisateur principal de base de données (ou un autre utilisateur disposant du rôle rds_superuser) pour créer un utilisateur de base de données de destination bénéficiant de privilèges LOGIN.

    CREATE USER destination_db_username WITH PASSWORD 'destination_db_user_password';
  2. Accordez le rôle rds_superuser à l’utilisateur de la base de données de destination.

    GRANT rds_superuser to destination_db_username;