本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Apache HBase
HBase
HBase 与 Hadoop 无缝协作,共享其文件系统,并充当 MapReduce 框架和执行引擎的直接输入和输出。 HBase 还可与 Apache Hive 集成,可通过表实现类似 SQL 的查询、与基于 Hive 的 HBase 表连接以及对 Java 数据库连接(JDBC)的支持。有关的更多信息 HBase,请参阅 Apache HBase 和 Apach
HBase 在 Amazon EMR 上,您还可将 HBase 数据直接备份到 Amazon Simple Storage Service(Amazon S3),并在启动集群时从之前创建的备份还原。 HBase Amazon EMR 提供与 Amazon S3 集成的其它选项以实现数据持久性和灾难恢复。
-
HBase 在 Amazon S3 上 ——对于 Amazon EMR 版本 5.2.0 及更高版本,您可使用 A HBase mazon S3 将集群的 HBase 根目录和元数据直接存储到 Amazon S3。随后,您可以启动新集群,将其指向 Amazon S3 中的根目录位置。一次仅一个集群可使用 Amazon S3 中的 HBase 位置,只读副本集群例外。有关更多信息,请参阅 HBase on Amazon S3(Amazon S3 存储模式)。
-
HBase 只读副本 — 具有 Amazon HBase S3 的 Amazon EMR 版本 5.7.0 及更高版本支持只读副本集群。在只读操作中,只读副本集群提供对主集群的存储文件和元数据的只读访问权限。有关更多信息,请参阅 使用只读副本集群。
HBase 快照 — 作为 Amaz HBase on S3 的替代方案,对于 EMR 版本 4.0 及更高版本,您可为 HBase 数据直接创建到 Amazon S3 中的快照,然后使用快照恢复数据。有关更多信息,请参阅 使用 HBase 快照。
重要
对于 Amazon EMR HBase 集群扩展,我们不建议对集群使用托管扩展或使用自定义策略进行 HBase 扩展。
下表列出了 Amazon EMR 7.x 系列的最新发行版 HBase 附带的版本,以及 Amazon EMR 一起安装的组件。 HBase
有关此发行版 HBase 中安装的组件版本,请参阅发行版 7.9.0 组件版本。
Amazon EMR 发行版标签 | HBase 版本 | 随安装的组件 HBase |
---|---|---|
emr-7.9.9.0 |
HBase 2.6.2 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server |
下表列出了 Amazon EMR 6.x 系列的最新发行版 HBase 附带的版本,以及 Amazon EMR 一起安装的组件。 HBase
有关此发行版 HBase 中安装的组件版本,请参阅发行版 6.15.0 组件版本。
Amazon EMR 发行版标签 | HBase 版本 | 随安装的组件 HBase |
---|---|---|
emr-6.15.0 |
HBase 2.4.17 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server |
注意
Apache HBase HBCK2 是一个独立的操作工具,用于修复 HBase 区域和系统表。在 Amazon EMR 版本 6.1.0 及更高版本中,主节点上的 /usr/lib/hbase-operator-tools/
中提供 hbase-hbck2.jar。有关如何构建和使用该工具的更多信息,请参阅HBaseHBCK2
下表列出了 Amazon EMR 5.x 系列的最新发行版 HBase 附带的版本,以及 Amazon EMR 一起安装的组件。 HBase
有关此发行版 HBase 中安装的组件版本,请参阅发行版 5.36.2 组件版本。
Amazon EMR 发行版标签 | HBase 版本 | 随安装的组件 HBase |
---|---|---|
emr-5.36.2 |
HBase 1.4.13 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server |