Apache HBase - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Apache HBase

HBaseist eine nicht relationale, verteilte Open-Source-Datenbank, die im Rahmen des Hadoop-Projekts der Apache Software Foundation entwickelt wurde. HBase läuft auf dem Hadoop Distributed File System (HDFS), um nicht-relationale Datenbankfunktionen für das Hadoop-Ökosystem bereitzustellen. HBase ist in Amazon-EMR-Version 4.6.0 und höher enthalten.

HBase arbeitet nahtlos mit Hadoop zusammen, nutzt das Dateisystem gemeinsam und dient als direkte Eingabe und Ausgabe für das MapReduce Framework und die Ausführungs-Engine. HBase lässt sich auch in Apache Hive integrieren und ermöglicht SQL-ähnliche Abfragen über HBase Tabellen, Verknüpfungen mit Hive-basierten Tabellen und Unterstützung für Java Database Connectivity (JDBC). Weitere Informationen dazu finden Sie unter Apache und in der HBase Dokumentation auf der Apache-Website HBase. HBase Ein Beispiel für die Verwendung HBase mit Hive finden Sie im AWS Big Data-Blogbeitrag Combine NoSQL and Massively Parallel Analytics Using Apache HBase and Apache Hive in Amazon EMR.

Mit HBase Amazon EMR können Sie Ihre HBase Daten auch direkt in Amazon Simple Storage Service Amazon EMR sichern und aus einer zuvor erstellten Sicherung wiederherstellen, wenn Sie einen HBase Cluster starten. Amazon EMR bietet zusätzliche Optionen für die Integration Amazon S3 für eine dauerhafte Datenspeicherung und die Notfallwiederherstellung.

  • HBase auf Amazon S3 — Ab Amazon-EMR-Version 5.2.0 können Sie HBase Amazon S3 verwenden, um das HBase Stammverzeichnis und die Metadaten eines Clusters direkt in Amazon S3 zu speichern. Anschließend können Sie einen neuen Cluster starten; dieser muss auf den Speicherort im Stammverzeichnis in Amazon S3 verweisen. Es kann nur jeweils ein Cluster den HBase Standort in Amazon S3 verwenden, mit Ausnahme eines Lesereplikat-Clusters. Weitere Informationen finden Sie unter HBase auf Amazon S3 (Amazon-S3-Speichermodus).

  • HBase Lesereplikate — Amazon EMR ab Version 5.7.0 HBase auf Amazon S3 unterstützt Lesereplikat-Cluster. Ein Read Replica-Cluster bietet schreibgeschützten Zugriff auf die Dateien und Metadaten des Speichers eines primären Clusters, um schreibgeschützte Operationen durchzuführen. Weitere Informationen finden Sie unter Verwenden eines Lesereplikat-Clusters.

  • HBase Snapshots — Als Alternative zu HBase Amazon S3 können Sie mit EMR ab Amazon S3 Snapshots Ihrer HBase Daten erstellen und dann Daten mithilfe der Snapshots wiederherstellen. Weitere Informationen finden Sie unter Schnappschüsse verwenden HBase .

Wichtig

Für die HBase Amazon-EMR-Clusterskalierung empfehlen wir nicht, verwaltete Skalierung oder Skalierung mit benutzerdefinierten Richtlinien mit HBase Clustern zu verwenden.

Die folgende Tabelle listet die Version von auf, die in der neuesten Version der Amazon-EMR-7.x-Serie HBase enthalten ist, zusammen mit den Komponenten, mit denen Amazon EMR installiert wird. HBase

Die Version der Komponenten, die mit dieser Version installiert HBase wurden, finden Sie unter Komponentenversionen der Version 7.9.0.

HBase Versionsinformationen für emr-7.9.0
Amazon-EMR-Versionsbezeichnung HBase Version Mit installierte Komponenten HBase

emr-7.9.0

HBase 2.6.2

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Die folgende Tabelle listet die Version von auf, die in der neuesten Version der Amazon-EMR-6.x-Serie HBase enthalten ist, zusammen mit den Komponenten, mit denen Amazon EMR installiert wird. HBase

Die Version der Komponenten, die mit dieser Version installiert HBase wurden, finden Sie unter Komponentenversionen der Version 6.15.0.

HBase Versionsinformationen für emr-6.15.0
Amazon-EMR-Versionsbezeichnung HBase Version Mit installierte Komponenten HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Anmerkung

Apache HBase HBCK2 ist ein separates Betriebstool für die Reparatur von HBase Regionen und Systemtabellen. In Amazon-EMR-Version 6.1.0 und höher wird die Datei hbase-hbck2.jar /usr/lib/hbase-operator-tools/ auf dem Primärknoten bereitgestellt. Weitere Informationen zur Erstellung und Verwendung des Tools finden Sie unter. HBaseHBCK2

Die folgende Tabelle listet die Version von auf, die in der neuesten Version der Amazon-EMR-5.x-Serie HBase enthalten ist, zusammen mit den Komponenten, mit denen Amazon EMR installiert wird. HBase

Die Version der Komponenten, die mit dieser Version installiert HBase wurden, finden Sie unter Komponentenversionen der Version 5.36.2.

HBase Versionsinformationen für emr-5.36.2
Amazon-EMR-Versionsbezeichnung HBase Version Mit installierte Komponenten HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server