Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Speichern Sie Speicherplatz, indem Sie eine abgeleitete Quelle verwenden
Standardmäßig speichert OpenSearch Serverless jedes aufgenommene Dokument in dem _source Feld, das den ursprünglichen JSON-Dokumentkörper enthält, und indexiert einzelne Felder für die Suche. Das _source Feld ist zwar nicht durchsuchbar, wird aber beibehalten, sodass bei der Ausführung von Abrufanforderungen wie Abrufen und Suchen das vollständige Dokument zurückgegeben werden kann. Wenn die abgeleitete Quelle aktiviert ist, überspringt OpenSearch Serverless das Speichern des _source Felds und rekonstruiert es stattdessen dynamisch bei Bedarf, z. B. bei Such-, Get-, Mget-, Reindex- oder Aktualisierungsvorgängen. Durch die Verwendung der Einstellung für abgeleitete Quellen kann der Speicherverbrauch um bis zu 50% reduziert werden.
Konfiguration
Um die abgeleitete Quelle für Ihren Index zu konfigurieren, erstellen Sie den Index mit der index.derived_source.enabled folgenden Einstellung:
PUT my-index1 { "settings": { "index": { "derived_source": { "enabled": true } } } }
Wichtige Überlegungen
-
Nur bestimmte Feldtypen werden unterstützt. Eine Liste der unterstützten Felder und Einschränkungen finden Sie in der OpenSearch Dokumentation
. Wenn Sie einen Index mit einer abgeleiteten Quelle und einem nicht unterstützten Feld erstellen, schlägt die Indexerstellung fehl. Wenn Sie versuchen, ein Dokument mit einem nicht unterstützten Feld in einem Index mit abgeleiteten Quellen aufzunehmen, schlägt die Aufnahme fehl. Verwenden Sie diese Funktion nur, wenn Sie wissen, welche Feldtypen Ihrem Index hinzugefügt werden. -
Die Einstellung
index.derived_source.enabledist eine statische Einstellung. Dies kann nicht geändert werden, nachdem der Index erstellt wurde.
Einschränkungen bei Abfrageantworten
Wenn die abgeleitete Quelle aktiviert ist, gelten bestimmte Einschränkungen bei der Generierung und Rückgabe von Abfrageantworten.
-
Datumsfelder mit mehreren angegebenen Formaten verwenden immer das erste Format in der Liste für alle angeforderten Dokumente, unabhängig vom ursprünglich aufgenommenen Format.
-
Geopunktwerte werden in einem festen
{"lat": lat_val, "lon": lon_val}Format zurückgegeben und können an Genauigkeit verlieren. -
Arrays mit mehreren Werten können sortiert und Schlüsselwortfelder können dedupliziert werden.
Weitere Einzelheiten finden Sie im Blog. OpenSearch
Leistungs-Benchmarking
Basierend auf Benchmark-Tests mit dem nyc_taxi-Datensatz erzielte die abgeleitete Quelle eine Reduzierung der Indexgröße um 58% gegenüber dem Ausgangswert.
| Metrik | Abgeleitete Quelle |
|---|---|
| Reduzierung der Indexgröße | 58,3% |
| Änderung des Indizierungsdurchsatzes | 3,7% |
| Indizierung: Änderung der p90-Latenz | 6,9% |
| Verbesserung der Latenz von Match-All Query p90 | 19% |
| Verbesserung der Latenz bei Range Query p90 | -18,8% |
| Entfernungsmenge p90 Verbesserung der Agg-Latenz | -7,3% |
Weitere Informationen finden Sie im OpenSearch Blog.