从早期版本的 HBase 迁移 - Amazon EMR

从早期版本的 HBase 迁移

要从之前的 HBase 版本迁移数据,请参阅 Apache HBase 参考指南中的升级HBase 版本号和兼容性。您可能需要特别注意从 HBase 1.0 版本之前的版本升级的要求。

迁移到 Amazon EMR 7.4.0 或更高版本

注意

如果您要从 7.4.0 之前的 EMR 版本迁移到 7.3.0 以上的版本,请遵循以下准则。

如果您当前运行的 EMR 版本已启用 Amazon 的存储文件跟踪功能(包含在 6.2.0 到 7.3.0 版本中),并且您想要升级到具有 OSS 存储文件跟踪的版本(该功能在 7.3.0 之后的 EMR 版本上可用),请按照以下步骤进行操作:

  1. 在现有集群中:

    1. 禁用 hbase:storefile 表。

    2. 删除 hbase:storefile表。

    3. 刷新 hbase:meta

    4. 等待元数据更新。

  2. 在新集群中:

    1. 将同一个 Amazon S3 目录设置为根目录。

    2. 使用 DefaultStoreFileTracker 实现启动集群:

      { "Classification": "hbase-site", "Properties": { hbase.store.file-tracker.impl: "org.apache.hadoop.hbase.regionserver.storefiletracker.DefaultStoreFileTracker" } }
    3. 在表或列系列级别,使用以下命令更改存储文件跟踪器:

      1. 更改表或表列系列的存储文件跟踪器:

        hbase> change_sft 't1','FILE' hbase> change_sft 't2','cf1','FILE'
      2. 更改表中所有与给定正则表达式 (regex) 匹配的存储文件跟踪器:

        hbase> change_sft_all 't.*','FILE' hbase> change_sft_all 'ns:.*','FILE' hbase> change_sft_all 'ns:t.*','FILE'