Limitations Conditions préalables Préparation de la base de données source Préparation de la base de données de destination Création des informations d’identification de base de données

Utilisation de l’utilitaire de chargement de données dans Aurora PostgreSQL Limitless Database

Aurora fournit un utilitaire permettant de charger des données directement dans Limitless Database à partir d’un cluster de bases de données Aurora PostgreSQL ou d’une instance de base de données RDS pour PostgreSQL.

Pour utiliser l’utilitaire de chargement de données, procédez comme suit :

Limitations

L’utilitaire de chargement de données présente les limitations suivantes :

Les types de données suivants ne sont pas pris en charge : enum, ARRAY, BOX, CIRCLE, LINE, LSEG, PATH, PG_LSN, PG_SNAPSHOT, POLYGON, TSQUERY, TSVECTOR et TXID_SNAPSHOT.
Les zéros de tête (0) sont supprimés du type de données VARBIT lors du chargement.
La migration des données échoue si les tables de destination contiennent des clés étrangères.
Limitless Data Utility prend en charge les configurations source suivantes pour les clusters de base de données Amazon RDS for Multi-AZ PostgreSQL :
- Instance principale
  - Modes pris en charge : snapshot, snapshot_then_cdc
- Instance de réplica
  - Mode pris en charge : instantané uniquement
    
    Exigence : hot_standby_feedback doit être activé
  - Non pris en charge : snapshot_then_cdc

Conditions préalables

L’utilitaire de chargement de données présente les prérequis suivants :

La base de données source utilise Aurora PostgreSQL ou RDS pour PostgreSQL version 11.x ou ultérieure.
La base de données source se trouve dans le même groupe de partitions de base Compte AWS de données Région AWS que dans le groupe de partitions de base de données de destination.
Le cluster de bases de données ou l’instance de base de données source présente l’état available.
Les tables de la base de données source et de la base de données sans limite présentent les mêmes noms de tables, noms de colonnes et types de données de colonne.
Les tables source et de destination possèdent des clés primaires qui utilisent les mêmes colonnes et les mêmes ordres de colonnes.
Vous devez disposer d’un environnement permettant de vous connecter à une base de données sans limite pour exécuter des commandes de chargement de données. Les commandes disponibles sont les suivantes :
- rds_aurora.limitless_data_load_start
- rds_aurora.limitless_data_load_cancel
Pour CDC :
- La base de données source et le groupe de partitions de base de données de destination doivent utiliser le même groupe de sous-réseaux de base de données, le même groupe de sécurité VPC et le même port de base de données. Ces configurations concernent les connexions réseau à la fois à la base de données source et aux routeurs du groupe de partitions de base de données.
- Vous devez activer la réplication logique sur la base de données source. L’utilisateur de la base de données source doit disposer des privilèges nécessaires pour lire la réplication logique.

Préparation de la base de données source

Pour accéder à la base de données source lors du chargement des données, vous devez autoriser le trafic réseau entrant vers celle-ci. Procédez comme suit.

Pour autoriser le trafic réseau vers la base de données source

Connectez-vous à la console Amazon EC2 AWS Management Console et ouvrez-la à l'adresse. https://console.aws.amazon.com/ec2/
Accédez à la page Groupes de sécurité.
Choisissez ID du groupe de sécurité pour le groupe de sécurité utilisé par le cluster ou l’instance de base de données source.

Son groupe de sécurité, par exemple, porte l’ID sg-056a84f1712b77926.
Dans l’onglet Règles entrantes :
1. Choisissez Modifier les règles entrantes.
2. Ajoutez une nouvelle règle entrante pour le cluster ou l’instance de base de données source :
  - Plage de ports : port de base de données pour la base de données source, généralement 5432
  - ID du groupe de sécurité : sg-056a84f1712b77926 dans cet exemple
Dans l’onglet Règles sortantes :
1. Choisissez Edit outbound rules (Modifier les règles sortantes).
2. Ajoutez une nouvelle règle sortante pour le cluster ou l’instance de base de données source :
  - Port de base de données : All traffic (comprend les ports 0-65535)
  - ID du groupe de sécurité : sg-056a84f1712b77926 dans cet exemple
Connectez-vous à la console Amazon VPC AWS Management Console et ouvrez-la à l'adresse. https://console.aws.amazon.com/vpc/
Accédez à la page Network ACLs (ACL réseau).
Ajoutez la configuration ACL réseau par défaut comme indiqué dans ACL réseau par défaut.

Préparation de la base de données de destination

Suivez les procédures décrites dans Création de tables Aurora PostgreSQL Limitless Database pour créer les tables de destination dans le groupe de partitions de base de données.

Vos tables de destination doivent utiliser les mêmes schémas, noms de tables et clés primaires que celles des tables sources.

Création des informations d’identification de base de données

Vous devez créer des utilisateurs de base de données dans les bases de données source et de destination, et leur accorder les privilèges nécessaires. Pour plus d’informations, consultez CREATE USER et GRANT dans la documentation de PostgreSQL.

Création des informations d’identification de base de données source

L’utilisateur de la base de données source est spécifié dans la commande permettant de lancer le chargement. Cet utilisateur doit disposer des privilèges nécessaires pour effectuer la réplication à partir de la base de données source.

Utilisez l’utilisateur principal de base de données (ou un autre utilisateur disposant du rôle rds_superuser) pour créer un utilisateur de base de données source bénéficiant de privilèges LOGIN.
```
CREATE USER source_db_username WITH PASSWORD 'source_db_user_password';
```
Accordez le rôle rds_superuser à l’utilisateur de la base de données source.
```
GRANT rds_superuser to source_db_username;
```
Si vous utilisez le mode full_load_and_cdc, accordez le rôle rds_replication à l’utilisateur de la base de données source. Le rôle rds_replication accorde les autorisations permettant de gérer des emplacements logiques et de diffuser les données à l’aide d’emplacements logiques.
```
GRANT rds_replication to source_db_username;
```

Création des informations d’identification de base de données de destination

L’utilisateur de la base de données de destination doit disposer de l’autorisation d’écriture sur les tables de destination du groupe de partitions de base de données.

Utilisez l’utilisateur principal de base de données (ou un autre utilisateur disposant du rôle rds_superuser) pour créer un utilisateur de base de données de destination bénéficiant de privilèges LOGIN.
```
CREATE USER destination_db_username WITH PASSWORD 'destination_db_user_password';
```
Accordez le rôle rds_superuser à l’utilisateur de la base de données de destination.
```
GRANT rds_superuser to destination_db_username;
```

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation de la commande COPY avec Limitless Database

Configuration de l’accès à l’aide d’un script