Apache HBase - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Apache HBase

HBaseest une base de données distribuée open source, non relationnelle, développée dans le cadre du projet Hadoop de l'Apache Software Foundation. HBase fonctionne sur le système de fichiers distribué Hadoop (HDFS) pour fournir des fonctionnalités de base de données non relationnelles à l'écosystème Hadoop. HBase est inclus avec Amazon EMR version 4.6.0 ou ultérieure.

HBase fonctionne parfaitement avec Hadoop, partage son système de fichiers et sert d'entrée et de sortie directes au MapReduce framework et au moteur d'exécution. HBase s'intègre également à Apache Hive, permettant des requêtes de type SQL sur des tables, des jointures avec HBase des tables basées sur Hive et la prise en charge de la connectivité de base de données Java (JDBC). Pour plus d'informations HBase, consultez Apache HBase et HBase la documentation sur le site Web d'Apache. Pour obtenir un exemple d'utilisation HBase avec Hive, consultez le billet du blog sur le AWS Big Data Combine NoSQL and massively parallel analytics using Apache Hive on Amazon EMR (Combiner NoSQL et les analytics massivement parallèles à l'aide d' HBase Apache Hive sur Amazon EMR).

Avec Amazon EMR, vous pouvez également restaurer vos HBase données directement HBase sur Amazon Simple Storage Service (Amazon S3) et les restaurer à partir d'une sauvegarde précédemment créée lors du lancement d'un cluster. HBase Amazon EMR offre d'autres options d'intégration avec Amazon S3 pour la persistance des données et la reprise après sinistre.

  • HBase sur Amazon S3 — Avec Amazon EMR version 5.2.0 et ultérieure, vous pouvez l'utiliser sur Amazon HBase S3 pour stocker le répertoire HBase racine et les métadonnées d'un cluster directement sur Amazon S3. Vous pouvez par la suite démarrer un nouveau cluster, en le désignant à l'emplacement du répertoire racine dans Amazon S3. Seulement un cluster à la fois peut utiliser l' HBase emplacement dans Amazon S3, à l'exception d'un cluster réplica en lecture. Pour de plus amples informations, veuillez consulter HBase sur Amazon S3 (mode de stockage Amazon S3).

  • HBase réplicas en lecture — Les versions 5.7.0 et ultérieures d'Amazon EMR avec Amazon HBase S3 prennent en charge les clusters de réplicas en lecture. Un cluster réplica en lecture offre un accès en lecture seule aux fichiers et métadonnées de stockage d'un cluster principal pour des opérations en lecture seule. Pour de plus amples informations, veuillez consulter Utilisation d'un cluster réplica en lecture.

  • HBase Instantanés — En tant qu'alternative à HBase Amazon S3, les versions 4.0 et ultérieures d'EMR vous permettent de créer des instantanés de HBase vos données directement dans Amazon S3, puis de récupérer des données à l'aide des instantanés. Pour de plus amples informations, veuillez consulter Utilisation de HBase snapshots.

Important

Pour le dimensionnement des HBase clusters Amazon EMR, nous vous déconseillons d'utiliser le dimensionnement géré ou le dimensionnement avec des politiques personnalisées pour les clusters. HBase

Le tableau suivant répertorie la version HBase incluse dans la dernière version d'Amazon EMR série 7.x, ainsi que les composants avec lesquels Amazon EMR est installé. HBase

Pour connaître la version des composants installés avec HBase cette version, consultez les versions des composants de la version 7.9.0.

HBase informations de version pour emr-7.9.0
Étiquette de version Amazon EMR HBase Version Composants installés avec HBase

emr-7.9.0

HBase 2.6.2

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Le tableau suivant répertorie la version HBase incluse dans la dernière version d'Amazon EMR série 6.x, ainsi que les composants avec lesquels Amazon EMR est installé. HBase

Pour connaître la version des composants installés avec HBase cette version, consultez les versions des composants de la version 6.15.0.

HBase informations sur la version de emr-6.15.0
Étiquette de version Amazon EMR HBase Version Composants installés avec HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Note

Apache HBase HBCK2 est un outil opérationnel distinct pour réparer HBase les régions et les tables système. Dans Amazon EMR version 6.1.0 et versions ultérieures, le fichier hbase-hbck2.jar est fourni /usr/lib/hbase-operator-tools/ sur le nœud primaire. Pour plus d'informations sur la création et l'utilisation de l'outil, consultez HBaseHBCK2.

Le tableau suivant répertorie la version HBase incluse dans la dernière version d'Amazon EMR série 5.x, ainsi que les composants avec lesquels Amazon EMR est installé. HBase

Pour connaître la version des composants installés avec HBase cette version, consultez les versions des composants de la version 5.36.2.

HBase informations de version pour emr-5.36.2
Étiquette de version Amazon EMR HBase Version Composants installés avec HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server