Apache HBase - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Apache HBase

HBaseè un database distribuito, non relazionale, open source sviluppato come parte del progetto Hadoop di Apache Software Foundation. HBase viene eseguito su Hadoop Distributed File System (HDFS) per fornire funzionalità di database non relazionali per l'ecosistema Hadoop. HBase è incluso con Amazon EMR versione 4.6.0 e successive.

HBase funziona perfettamente con Hadoop, condividendone il file system e fungendo da input e output diretti per il framework e il motore di esecuzione. MapReduce HBase si integra inoltre con Apache Hive, abilitando query simili a SQL su tabelle, si unisce a HBase tabelle basate su Hive e supporta Java Database Connectivity (JDBC). Per ulteriori informazioni su, consulta Apache e la documentazione sul sito Web di Apache. HBase HBase HBase Per un esempio di come utilizzare HBase Hive, consulta l'articolo pubblicato sul Blog sui AWS Big Data Combine NoSQL and Massively Parallel Analytics Using Apache HBBBlog on Amazon EMR (Combinazione di NoSQL e analisi dei dati MPP (Massively Parallel Processing) HBase utilizzando Apache Hive su Amazon EMR).

Con HBase Amazon EMR puoi anche eseguire il backup HBase dei dati direttamente in Amazon Simple Storage Service (Amazon S3) e il ripristino da un backup creato in precedenza all'avvio di un cluster. HBase Amazon EMR offre opzioni aggiuntive per l'integrazione con Amazon S3 per la persistenza dei dati e il ripristino di emergenza.

  • HBase su Amazon S3: con Amazon EMR versione 5.2.0 e successive, puoi utilizzare Amazon HBase S3 per archiviare la HBase directory principale e i metadati del cluster direttamente in Amazon S3. In seguito puoi avviare un nuovo cluster, indirizzandolo alla posizione della directory principale in Amazon S3. Il HBase percorso in Amazon S3 può essere utilizzato da un solo cluster alla volta, a eccezione di una replica di lettura al cluster. Per ulteriori informazioni, consulta HBase su Amazon S3 (modalità di archiviazione Amazon S3).

  • HBase repliche di lettura: Amazon EMR versione 5.7.0 e successive con Amazon HBase S3 supporta la replica di lettura ai cluster. Una replica di lettura al cluster fornisce accesso in sola lettura ai file e ai metadati dello store di un cluster principale per operazioni di sola lettura. Per ulteriori informazioni, consulta Utilizzo della replica di lettura al cluster.

  • HBase Snapshot: in alternativa ad HBase Amazon S3, con EMR versione 4.0 e successive puoi creare snapshot dei dati HBase direttamente in Amazon S3 e, di conseguenza, recuperare dati utilizzando gli snapshot. Per ulteriori informazioni, consulta Utilizzo delle istantanee HBase .

Importante

Per la scalabilità dei HBase cluster Amazon EMR, non consigliamo di utilizzare la scalabilità gestita o la scalabilità con politiche personalizzate con cluster. HBase

La seguente tabella indica la versione HBase inclusa nell'ultimo rilascio della serie Amazon EMR 7.x insieme ai componenti con cui Amazon EMR viene installato. HBase

Per la versione dei componenti installati con HBase questo rilascio, consulta la sezione Versioni dei componenti del rilascio 7.9.0.

HBase informazioni sulla versione per emr-7.9.0
Etichetta di rilascio di Amazon EMR HBase versione Componenti installati con HBase

emr-7.9.0

HBase 2.6.2

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

La seguente tabella indica la versione HBase inclusa nell'ultimo rilascio della serie Amazon EMR 6.x insieme ai componenti con cui Amazon EMR viene installato. HBase

Per la versione dei componenti installati con HBase questo rilascio, consulta la sezione Versioni dei componenti del rilascio 6.15.0.

HBase informazioni sulla versione di emr-6.15.0
Etichetta di rilascio di Amazon EMR HBase versione Componenti installati con HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Nota

Apache HBase HBCK2 è uno strumento operativo separato per la riparazione di HBase regioni e tabelle di sistema. In Amazon EMR versione 6.1.0 e successive, hbase-hbck2.jar viene fornito nel nodo /usr/lib/hbase-operator-tools/ primario. Per ulteriori informazioni su come creare e utilizzare lo strumento, consulta. HBaseHBCK2

La seguente tabella indica la versione HBase inclusa nell'ultimo rilascio della serie Amazon EMR 5.x insieme ai componenti con cui Amazon EMR viene installato. HBase

Per la versione dei componenti installati con HBase questo rilascio, consulta la sezione Versioni dei componenti del rilascio 5.36.2.

HBase informazioni sulla versione per emr-5.36.2
Etichetta di rilascio di Amazon EMR HBase versione Componenti installati con HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server