Laden von Daten aus einem DB-Cluster von Aurora PostgreSQL oder einer DB-Instance von RDS für Postgre

Nachdem Sie die Ressourcen- und Authentifizierungseinrichtung abgeschlossen haben, stellen Sie eine Verbindung zum Cluster-Endpunkt her und rufen Sie die gespeicherte Prozedur rds_aurora.limitless_data_load_start von einer Limitless-Datenbank wie postgres_limitless aus auf. Die Limitless-Datenbank ist eine Datenbank in der DB-Shard-Gruppe, in die Sie Daten migrieren möchten.

Diese Funktion stellt im Hintergrund asynchron eine Verbindung zu der im Befehl angegebenen Quelldatenbank her, liest die Daten aus der Quelle und lädt die Daten auf die Shards. Für eine bessere Leistung werden die Daten mithilfe paralleler Threads geladen. Die Funktion ruft einen Point-in-Time-Tabellen-Snapshot ab, indem sie einen SELECT-Befehl zum Lesen der Daten der im Befehl angegebenen Tabelle(n) ausführt.

Sie können Daten in Sharded-, Referenz- und Standardtabellen laden.

Sie können Daten in rds_aurora.limitless_data_load_start-Aufrufen auf Datenbank-, Schema- oder Tabellenebene laden.

Datenbank: Sie können bei jedem Aufruf jeweils eine Datenbank laden. Die Anzahl der Schemata oder Tabellen innerhalb der Datenbank ist dabei nicht begrenzt.
Schema: Sie können bei jedem Aufruf maximal 15 Schemata laden. Die Anzahl der Tabellen innerhalb jedes Schemas ist dabei nicht begrenzt.
Tabelle: Sie können bei jedem Aufruf maximal 15 Tabellen laden.

Anmerkung

Diese Funktion verwendet keine Amazon-RDS-Snapshots oder Point-in-Time-Isolierung der Datenbank. Aus Gründen der tabellenübergreifenden Konsistenz empfehlen wir, die Quelldatenbank zu klonen und auf diese geklonte Datenbank als Quelle zu verweisen.

Die gespeicherte Prozedur hat die folgende Syntax.


CALL rds_aurora.limitless_data_load_start('source_type',
    'source_DB_cluster_or_instance_ID',
    'source_database_name',
    'streaming_mode',
    'data_loading_IAM_role_arn',
    'source_DB_secret_arn',
    'destination_DB_secret_arn',
    'ignore_primary_key_conflict_boolean_flag',
    'is_dry_run',
    (optional parameter) schemas/tables => ARRAY['name1', 'name2', ...]);

Es werden folgende Eingabeparameter verwendet:

source_type: Der Quelltyp: aurora_postgresql oder rds_postgresql
source_DB_cluster_or_instance_ID: Die ID des DB-Clusters von Aurora-PostgreSQL oder die ID der DB-Instance von RDS für PostgreSQL
source_database_name— Der Name der Quelldatenbank, z. B. postgres
streaming_mode: Ob die Erfassung von Datenänderungen (Change Data Capture, CDC) einbezogen werden soll: full_load oder full_load_and_cdc
data_loading_IAM_role_arn: Der Amazon-Ressourcenname (ARN) der IAM-Rolle für aurora-data-loader
source_DB_secret_arn: Der geheime ARN der Quell-DB
destination_DB_secret_arn: Der geheime ARN der Ziel-DB
ignore_primary_key_conflict_boolean_flag: Ob fortgefahren werden soll, wenn ein Primärschlüssel-Konflikt auftritt:
- Wenn auf true gesetzt, werden beim Laden von Daten neue Änderungen für Zeilen mit einem Primärschlüssel-Konflikt ignoriert.
- Wenn auf false gesetzt, werden beim Laden von Daten die vorhandenen Zeilen in Zieltabellen überschrieben, wenn ein Primärschlüssel-Konflikt auftritt.
is_dry_run: Ob getestet werden soll, ob der Auftrag zum Laden von Daten eine Verbindung zu den Quell- und Zieldatenbanken herstellen kann:
- Wenn auf true gesetzt, werden die Verbindungen getestet, ohne dass Daten geladen werden
- Wenn auf false gesetzt, werden Daten geladen
(optional) schemas oder tables: Ein Array von Schemata oder Tabellen, die geladen werden sollen. Sie können einen der folgenden Werte angeben:
- Eine Liste von Tabellen im Format tables => ARRAY['schema1.table1', 'schema1.table2', 'schema2.table1', ...]
- Eine Liste von Schemata im Format schemas => ARRAY['schema1', 'schema2', ...]
Wenn Sie diesen Parameter nicht einschließen, wird die gesamte angegebene Quelldatenbank migriert.

Der Ausgabeparameter ist die Auftrags-ID mit einer Nachricht.

Im folgenden Beispiel wird veranschaulicht, wie die gespeicherte Prozedur rds_aurora.limitless_data_load_start zum Laden von Daten aus einem DB-Cluster von Aurora PostgreSQL verwendet wird.


CALL rds_aurora.limitless_data_load_start('aurora_postgresql',
    'my-db-cluster',
    'postgres',
    'full_load_and_cdc',
    'arn:aws:iam::123456789012:role/aurora-data-loader-8f2c66',
    'arn:aws:secretsmanager:us-east-1:123456789012:secret:secret-source-8f2c66-EWrr0V',
    'arn:aws:secretsmanager:us-east-1:123456789012:secret:secret-destination-8f2c66-d04fbD',
    'true',
    'false',
    tables => ARRAY['public.customer', 'public.order', 'public.orderdetails']);

INFO: limitless data load job id 1688761223647 is starting.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Manuelles Einrichten des Zugriffs

Überwachen des Ladens von Daten