Apache HBase - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apache HBase

HBaseadalah database terdistribusi sumber terbuka sumber terbuka dan non-relasional yang dikembangkan sebagai bagian dari proyek Hadoop Apache Software Foundation. HBase berjalan di atas Sistem File Terdistribusi Hadoop (HDFS) untuk menyediakan kemampuan database non-relasional untuk ekosistem Hadoop. HBase termasuk dalam rilis Amazon EMR versi 4.6.0 dan versi yang lebih tinggi.

HBase bekerja secara mulus dengan Hadoop, yang membagikan sistem file dan berfungsi sebagai input dan output langsung ke MapReduce kerangka kerja dan mesin eksekusi. HBase juga terintegrasi dengan Apache Hive, yang mengaktifkan kueri seperti SQL di atas HBase tabel, bergabung dengan tabel berbasis Hive, dan dukungan untuk Java Database Connectivity (JDBC). Untuk informasi selengkapnya HBase, lihat Apache HBase dan HBase dokumentasi di situs web Apache. Untuk contoh bagaimana menggunakan HBase dengan Hive, lihat Posting Blog AWS Big Data Gabungkan NoSQL dan analisis paralel besar-besaran HBase menggunakan Apache dan Apache Hive di Amazon EMR.

Dengan HBase Amazon EMR, Anda juga dapat mencadangkan HBase data secara langsung ke Amazon Simple Storage Service (Amazon S3), dan mengembalikan dari cadangan sebelumnya yang dibuat saat meluncurkan klaster. HBase Amazon EMR menawarkan opsi tambahan untuk mengintegrasikan dengan Amazon S3 untuk ketekunan data dan pemulihan bencana.

  • HBase di Amazon S3 - Dengan Amazon EMR versi 5.2.0 dan yang lebih baru, Anda dapat menggunakan Amazon HBase S3 untuk menyimpan direktori HBase root klaster dan metadata langsung ke Amazon S3. Anda kemudian dapat memulai sebuah klaster baru, menunjuk ke lokasi direktori root di Amazon S3. Hanya satu klaster pada suatu waktu yang dapat menggunakan HBase lokasi di Amazon S3, dengan pengecualian dari klaster replika baca. Untuk informasi selengkapnya, lihat HBase di Amazon S3 (mode penyimpanan Amazon S3).

  • HBase baca replika - Amazon EMR versi 5.7.0 dan yang lebih baru dengan di Amazon HBase S3 mendukung klaster baca replika baca. Klaster replika baca menyediakan akses baca-saja ke file penyimpanan dan metadata klaster utama untuk operasi baca-saja. Untuk informasi selengkapnya, lihat Menggunakan klaster replika baca..

  • HBase Snapshot - Sebagai alternatif untuk HBase di Amazon S3, dengan EMR versi 4.0 dan yang lebih baru Anda dapat membuat snapshot dari data Anda HBase langsung ke Amazon S3 dan kemudian memulihkan data menggunakan snapshot. Untuk informasi selengkapnya, lihat Menggunakan HBase snapshot.

penting

Untuk penskalaan HBase klaster EMR Amazon, sebaiknya jangan gunakan penskalaan terkelola atau penskalaan dengan kebijakan khusus dengan klaster. HBase

Tabel berikut mencantumkan versi yang HBase tercakup dalam rilis terbaru dari Amazon EMR seri 7.x, bersama dengan komponen yang diinstal Amazon EMR. HBase

Untuk versi komponen yang diinstal dengan HBase rilis ini, lihat Rilis 7.9.0 Versi Komponen.

HBase informasi versi untuk emr-7.9.0
Label Rilis Amazon EMR HBase Versi Komponen Dipasang Dengan HBase

emr-7.0

HBase 2.6.2

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Tabel berikut mencantumkan versi yang HBase tercakup dalam rilis terbaru dari Amazon EMR seri 6.x, bersama dengan komponen yang diinstal Amazon EMR. HBase

Untuk versi komponen yang diinstal dengan HBase rilis ini, lihat Rilis 6.15.0 Versi Komponen.

HBase informasi versi untuk emr-6.15.0
Label Rilis Amazon EMR HBase Versi Komponen Dipasang Dengan HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

catatan

Apache HBase HBCK2 adalah alat operasional terpisah untuk memperbaiki HBase daerah dan tabel sistem. Di Amazon EMR versi 6.1.0 dan yang lebih baru, hbase-hbck2.jar disediakan /usr/lib/hbase-operator-tools/ pada simpul utama. Untuk informasi selengkapnya tentang cara membangun dan menggunakan ini, lihat HBaseHBCK2.

Tabel berikut mencantumkan versi yang HBase tercakup dalam rilis terbaru dari Amazon EMR seri 5.x, bersama dengan komponen yang diinstal Amazon EMR. HBase

Untuk versi komponen yang diinstal dengan HBase rilis ini, lihat Rilis 5.36.2 Versi Komponen.

HBase informasi versi untuk emr-5.36.2
Label Rilis Amazon EMR HBase Versi Komponen Dipasang Dengan HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server