

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Stufe 4 — Datenmigration
<a name="stage-4-data-migration"></a>

Jetzt, da Ihre Zielumgebung bereit ist, können Sie die Datenmigrationsstrategie implementieren, die Sie in der Planungsphase ausgewählt haben.

In diesem Abschnitt werden die Implementierungsschritte für die vier verschiedenen Muster beschrieben:
+ [Aus einer Momentaufnahme aufbauen](build-from-snapshot.md)
+ [Aus der Quelle heraus bauen](build-from-source.md)
+ [Neuindizierung aus der Ferne](remote-reindexing.md)
+ [Logstash verwenden](logstash.md)

# 1. Aus einem Snapshot erstellen
<a name="build-from-snapshot"></a>

Wenn Sie den Snapshot-Restore-Ansatz verwenden, kopieren Sie Daten aus dem OpenSearch Elasticsearch-Quell-Cluster oder -Cluster in die Amazon Service-Zieldomäne. OpenSearch 

Im Großen und Ganzen besteht der Snapshot-Wiederherstellungsprozess aus den folgenden Schritten:

1. Erstellen Sie einen Snapshot der erforderlichen Daten (Indizes) aus dem vorhandenen Cluster und laden Sie den Snapshot in einen S3-Bucket hoch.

1. Erstellen Sie eine Amazon OpenSearch Service-Domain.

1. Erteilen Sie Amazon OpenSearch Service Berechtigungen für den Zugriff auf den Bucket und geben Sie Ihrem Benutzerkonto die Erlaubnis, mit Snapshots zu arbeiten. Erstellen Sie ein Snapshot-Repository und verweisen Sie es auf Ihren Bucket.

1. Stellen Sie den Snapshot auf der Amazon OpenSearch Service-Domain wieder her.

1. Verweisen Sie Ihre Client-Anwendungen auf die Amazon OpenSearch Service-Domain.

1. Erstellen Sie Index State Management (ISM) -Richtlinien für die Konfiguration der Aufbewahrung (optional).

Snapshots sind inkrementell. Daher kann ein Snapshot inkrementell ausgeführt und wiederhergestellt werden. Mithilfe von Snapshots können Sie Daten in großen Mengen als Dateien auf einem Speichersystem (z. B. Amazon S3) extrahieren. Sie können diese Dateien dann mithilfe der `_restore` API-Operation in die Zielumgebung laden. Dadurch entfällt die Notwendigkeit einer Neuindizierung, was zeitaufwändig ist, und es reduziert auch den Netzwerkverkehr.

## Überlegungen zu Snapshots
<a name="snapshot-considerations"></a>

Wenn Sie den Snapshot-Restore-Ansatz verwenden, sollten Sie Folgendes berücksichtigen:
+ Sie können nicht suchen oder neu indizieren, während ein Index wiederhergestellt wird. Sie können jedoch einen Index durchsuchen und neu indizieren, während der Snapshot erstellt wird.
+ Die Elasticsearch-Quell- und OpenSearch Zielversionen müssen kompatibel sein. Ein Snapshot eines Indexes, der erstellt wurde in:
  + 5.x kann auf 6.x wiederhergestellt werden
  + 2.x kann auf 5.x wiederhergestellt werden
  + 1.x kann auf 2.x wiederhergestellt werden
+ Da es sich um eine point-in-time Wiederherstellung von Elasticsearch oder OpenSearch Snapshot handelt, werden nachfolgende Änderungen im Quell-Cluster nicht auf die Amazon OpenSearch Service-Zieldomain repliziert. Sie können die Aufnahme der Daten in den Elasticsearch- oder OpenSearch Quellcluster beenden, bis die Wiederherstellung abgeschlossen ist, oder Sie können den Snapshot-Wiederherstellungsvorgang einige Male wiederholen. Da der Snapshot inkrementell ist, werden nur die Änderungen in kürzerer Zeit als bei der ersten Wiederherstellung kopiert und in der Zielumgebung wiederhergestellt. Nachdem die Wiederherstellung erfolgreich abgeschlossen wurde, verweisen Sie die Aufnahmeanwendungen auf die Amazon OpenSearch Service-Domain.
+ Das Erstellen eines Snapshots umfasst standardmäßig einen Snapshot des Cluster-Status und aller Indizes. Bei der Migration von Elasticsearch müssen Sie möglicherweise mithilfe der ISM-Funktion in der Zielumgebung entsprechende Richtlinien für den Index-Lebenszyklus erstellen. OpenSearch Elasticsearch Index Lifecycle Management (ILM) wird in Amazon OpenSearch Service nicht unterstützt.
+ Sie können einen Snapshot nicht auf einer früheren Version von Elasticsearch oder wiederherstellen. OpenSearch Sie können beispielsweise keinen Snapshot der Versionen 7.10 bis 7.9 wiederherstellen. Ebenso können Sie Snapshots aus Elasticsearch 7.11 oder höher nicht in einer Amazon OpenSearch Service-Domain wiederherstellen. Wenn Sie Ihre selbstverwaltete Elasticsearch-Umgebung auf Version 7.11 oder höher migriert haben, können Sie Logstash verwenden, um Daten aus dem Elasticsearch-Cluster zu laden und in die Domain zu schreiben. OpenSearch
+ Sie exportieren einen Snapshot an einen bestimmten Speicherort, ein sogenanntes Repository. Elasticsearch oder OpenSearch erstellt eine Reihe von Dateien im Repository. Sie können diese Dateien nicht ändern oder löschen. Dies kann zu Inkonsistenzen führen oder dazu führen, dass der Wiederherstellungsvorgang fehlschlägt.

# 2. Aus der Quelle bauen
<a name="build-from-source"></a>

Wie bereits beschrieben, ist das Erstellen aus der Quelle der Ansatz, bei dem Sie keine Daten aus der aktuellen Elasticsearch- oder Umgebung migrieren. OpenSearch Stattdessen erstellen Sie Indizes in der Zieldomain direkt aus Ihrer Protokoll- oder Produktkatalog-Datenquelle oder Inhaltsquelle.

Für die Erstellung aus der Quelle stehen zwei Optionen zur Verfügung. Welche Option Sie wählen, hängt vom Datentyp Ihrer Daten ab:
+ Verwenden von AWS Database Migration Service — Wenn die Quelle Ihrer Daten ein relationales Datenbankmanagementsystem (RDBMS) ist und die Quelle vom AWS Database Migration Service (AWS DMS) unterstützt wird, können Sie AWS DMS verwenden, um Daten aus Ihrer Datenquelle in Ihre Amazon Service-Zieldomäne zu kopieren. OpenSearch AWS DMS unterstützt Volllast- und CDC-Optionen (Change Data Capture). Bei der Vollladeoption kopiert die AWS-DMS-Aufgabe alle Daten aus der Quelldatenbanktabelle in einen OpenSearch Zielindex. Sie können die Standardzuordnung verwenden oder benutzerdefinierte Zuordnungskonfigurationen bereitstellen. Bei der CDC-Option erstellt AWS DMS zunächst eine vollständige Kopie der Quelltabelleneinträge in einem OpenSearch Zielindex. Dann erfasst es geänderte Daten (Aktualisierungen und Einfügungen) und kopiert sie in den OpenSearch Index. Weitere Informationen finden Sie in den Blogbeiträgen [Introducing Amazon Elasticsearch Service as a target in AWS Database Migration Service](https://aws.amazon.com/blogs/database/introducing-amazon-elasticsearch-service-as-a-target-in-aws-database-migration-service/) und [Scale Amazon Elasticsearch Service for AWS Database Migration Service Service-Migrationen](https://aws.amazon.com/blogs/database/scale-amazon-elasticsearch-service-for-aws-database-migration-service-migrations/).
+ Aus der Dokumentenquelle aufbauen — Wenn es sich bei Ihrer Datenquelle nicht um ein RDBMS handelt oder sie nicht von AWS DMS unterstützt wird, müssen Sie möglicherweise eine benutzerdefinierte Lösung mit Open-Source-Tools oder einer Kombination aus Open-Source-Tools und AWS-Services erstellen. Sie müssen Ihre Quelldaten in JSON-Dokumente konvertieren, bevor sie geladen werden können. OpenSearch Wenn Sie bereits Pipelines von Ihrer Quelle zu Ihrer aktuellen Elasticsearch- oder OpenSearch Umgebung eingerichtet haben, können Sie OpenSearch mit entsprechenden Änderungen in den Client-Bibliotheken und (falls erforderlich) Datenmodelländerungen in Indizes in der Amazon Service-Domain auf diese Daten-Pipelines verweisen. OpenSearch Wenn Sie Indizes aus der Quelle erstellen, sollten Sie die folgenden Überlegungen berücksichtigen:
  + Der Speicherort der Dokumente — Die Dokumente könnten bereits in der AWS-Cloud, in Objektspeichern wie Amazon S3 verfügbar sein, oder sie könnten an einem lokalen Speicherort wie einem Dateisystem gespeichert sein.
  + Das Format der Dokumente — Die Dokumente könnten bereits im JSON-Format vorliegen und bereit sein, in die Amazon OpenSearch Service-Domain aufgenommen zu werden, oder sie müssen möglicherweise bereinigt, verarbeitet und in JSON formatiert werden, bevor sie in die Amazon Service-Domain aufgenommen werden können. OpenSearch 

Die Erstellung aus der Quelle umfasst die folgenden grundlegenden Schritte:

1. Definieren Sie die Indexzuweisung und die Einstellungen in der Amazon OpenSearch Service-Domain.

1. Extrahieren Sie Daten aus der Dokumentenquelle und kopieren Sie sie in einen Objektspeicher wie Amazon S3. Sie können ein Open-Source-Tool (z. B. Logstash), einen AWS-Serviceclient (z. B. Amazon Kinesis Agent), ein kommerzielles Tool eines Drittanbieters oder ein benutzerdefiniertes Programm verwenden.

1. Konfigurieren Sie ein Open-Source-Tool (z. B. Logstash oder Fluent Bit) oder einen nativen AWS-Service (z. B. AWS Lambda oder AWS DMS), um Daten in JSON-Dokumente zu konvertieren und sie regelmäßig oder kontinuierlich aus dem Objektspeicher in die Amazon Service-Domain zu laden. OpenSearch 

Weitere Informationen finden Sie unter [Streaming-Daten in Amazon OpenSearch Service laden](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/integrations.html).

# 3. Neuindizierung aus der Ferne
<a name="remote-reindexing"></a>

In diesem Fall werden die Indizes des selbstverwalteten Elasticsearch- oder OpenSearch Clusters der Quelle mithilfe des API-Vorgangs „Dokument [neu](https://opensearch.org/docs/latest/opensearch/reindex-data) indizieren“ in die Amazon OpenSearch Service-Domain migriert. Sie können den API-Vorgang „Dokument neu indizieren“ verwenden, um einen Index aus einem vorhandenen Elasticsearch oder Index zu erstellen. OpenSearch Der vorhandene Index kann sich in demselben Cluster befinden, in dem Sie die Neuindizierung ausführen, oder er kann sich in einem Remote-Cluster befinden. Amazon OpenSearch Service unterstützt die Verwendung des API-Vorgangs zur Neuindizierung von Dokumenten mit Remote-Clustern. Sie können von einem Index in einem selbstverwalteten Elasticsearch zu einem Index in Amazon Service neu indizieren. OpenSearch 

Remote Reindex unterstützt Elasticsearch 1.5 und höher für den Remote-Elasticsearch-Cluster und Amazon OpenSearch Service 6.7 und höher für die lokale Domain. Weitere Informationen finden Sie im Blogbeitrag [Daten mithilfe von Remote-Reindex nach Amazon ES migrieren](https://aws.amazon.com/blogs/big-data/migrate-data-into-amazon-es-using-remote-reindex/). Der Blogbeitrag bezieht sich auf Amazon Elasticsearch, aber die Anleitung gilt auch für Amazon OpenSearch Service-Domains.

# 4. Logstash verwenden
<a name="logstash"></a>

[Logstash](https://www.elastic.co/guide/en/logstash/current/index.html) ist ein Open-Source-Datenverarbeitungstool, das Daten aus der Quelle sammeln, transformieren oder filtern und Daten an ein oder mehrere Ziele senden kann. Um Daten in die Amazon OpenSearch Service-Domain zu schreiben, bietet Logstash die folgenden Plugins:
+ logstash-input-elasticsearch
+ logstash-input-opensearch
+ logstash-output-opensearch

Weitere Informationen finden Sie unter [Daten mit Logstash in Amazon OpenSearch Service laden](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/managedomains-logstash.html) und im OpenSearch Blogbeitrag [Einführung in das logstash-input-opensearch Plugin](https://opensearch.org/blog/community/2022/05/introducing-logstash-input-opensearch-plugin-for-opensearch/) für. OpenSearch