Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Migrasi dari versi sebelumnya HBase
Untuk memigrasikan data dari HBase versi sebelumnya, lihat Upgrade
Migrasi ke Amazon EMR versi 7.4.0 atau yang lebih baru
catatan
Ikuti panduan ini jika Anda bermigrasi dari rilis EMR lebih awal dari 7.4.0 ke rilis yang lebih besar dari 7.3.0.
Jika saat ini Anda menjalankan versi EMR dengan fitur Pelacakan File Store Amazon diaktifkan, yang disertakan dalam versi 6.2.0 ke 7.3.0, dan Anda ingin meningkatkan ke versi dengan OSS Store File Tracking, yang tersedia pada versi EMR lebih lambat dari 7.3.0, ikuti langkah-langkah berikut:
Di cluster yang ada:
Nonaktifkan
hbase:storefiletabel.Jatuhkan
hbase:storefilemeja.Siram
hbase:meta.Tunggu metadata diperbarui.
Di cluster baru:
Tetapkan direktori Amazon S3 yang sama dengan direktori root.
Mulai cluster dengan
DefaultStoreFileTrackerimplementasi:{ "Classification": "hbase-site", "Properties": { hbase.store.file-tracker.impl: "org.apache.hadoop.hbase.regionserver.storefiletracker.DefaultStoreFileTracker" } }Pada tingkat keluarga tabel atau kolom, gunakan perintah berikut untuk mengubah pelacak file toko:
Ubah Store File Tracker keluarga kolom tabel atau tabel:
hbase> change_sft 't1','FILE' hbase> change_sft 't2','cf1','FILE'Ubah semua Store File Tracker tabel yang cocok dengan ekspresi reguler yang diberikan (regex):
hbase> change_sft_all 't.*','FILE' hbase> change_sft_all 'ns:.*','FILE' hbase> change_sft_all 'ns:t.*','FILE'
Migrasi HBase di cluster Amazon S3 ke Amazon EMR Versi 7.12.0 atau yang lebih baru menggunakan cluster Read-Replica
Dimulai dengan EMR 7.12.0, Anda dapat mengganti replika baca HBase di klaster Amazon S3 dari mode hanya-baca ke mode aktif, memungkinkan operasi baca dan tulis. Fungsionalitas ini disediakan melalui dua perintah HBase shell baru.
readonly_stateMengambil status operasional read-write saat ini dari cluster.
Output:
TIDAK AKTIF - Cluster dalam mode hanya-baca dan tulis tidak aktif.
ACTIVE - Cluster mendukung operasi baca dan tulis.
readonly_switchMengaktifkan atau menonaktifkan mode hanya-baca dengan opsi yang dapat dikonfigurasi untuk proses peralihan.
Sintaksis:
readonly_switch <readonly>,<force_flush>,<force_refresh_meta>,<force_refresh_hfile>Parameter:
readonly (required) - Nilai Boolean untuk mengaktifkan (true) atau menonaktifkan mode read-only (false)
force_flush (opsional) - Memaksa pembilasan data sebelum beralih dari mode aktif ke mode hanya-baca (default: true)
force_refresh_meta (opsional) - Memaksa penyegaran tabel meta saat beralih dari mode read-only ke mode aktif (default: true)
force_refresh_hfile (opsional) - Memaksa HFile penyegaran saat beralih dari mode read-only ke mode aktif (default: true)
Langkah migrasi
Jika saat ini Anda menjalankan EMR 6.0.0+ di klaster Amazon HBase S3 dan ingin bermigrasi ke kluster EMR 7.12.0 atau yang lebih baru, ikuti langkah-langkah berikut:
Pastikan cluster sumber Anda dalam keadaan stabil tanpa inkonsistensi menggunakan laporan hbck atau prosedur macet dari UI master. HBase
sudo -u hbase hbase hbck > hbck_report.txtPastikan tidak ada wilayah dalam status SPLIT di cluster sumber:
Jika ada wilayah dalam status SPLIT, jalankan pemadatan utama pada tabel masing-masing dan tunggu sampai selesai
major_compact <table_name>Jalankan
catalogjanitor_rundi HBase shell setelah pemadatan selesai
Buat kluster EMR 7.12.0+ baru yang dikonfigurasi sebagai replika baca yang menunjuk ke lokasi Amazon S3 yang sama dengan cluster sumber Anda. Lihat blog
ini untuk detail lebih lanjut tentang cara mengatur cluster replika baca. Luncurkan cluster baru dengan DefaultStoreFileTracker konfigurasi seperti yang disebutkan dalam langkah-langkah di atas jika Anda ingin meningkatkan ke pelacakan file OSS Store. Tunggu node master untuk menginisialisasi sepenuhnya. Verifikasi aksesibilitas data dengan membaca tabel dan mengonfirmasi klaster baru dalam mode hanya-baca
hbase:001:0> readonly_state Took 0.4612 seconds => "INACTIVE"Nonaktifkan penyeimbangan dan pemadatan pada cluster sumber:
echo "balance_switch false" | hbase shell echo "compaction_switch false" | hbase shellPastikan tidak ada yang overlaps/inconsistencies muncul di UI cluster read-replica dan verifikasi bahwa wilayah menunjukkan status OPEN dan ditetapkan dengan benar.
Konversikan pelacakan file Store menggunakan perintah pada cluster read-replica yang disebutkan di bagian di atas jika Anda ingin mengubahnya. FileBasedTracker
Hentikan pekerjaan yang menunjuk ke cluster sumber, siram semua tabel, dan matikan cluster sumber. Tunggu penghentian total sebelum melanjutkan.
echo "flush 'usertable'" | hbase shell echo "flush 'hbase:meta'" | hbase shell echo "flush 'hbase:namespace'" | hbase shellGanti cluster baca-replika ke mode aktif untuk mengaktifkan operasi tulis. Setelah menyelesaikan langkah ini, cluster baru Anda akan mendukung operasi baca dan tulis, dan migrasi selesai.
hbase:010:0> readonly_switch false Took 38.1568 secondsValidasi penulisan di klaster baru dan pastikan semua wilayah melayani permintaan.
catatan
Hanya ada satu cluster aktif yang menunjuk ke lokasi Amazon S3 kapan saja. Oleh karena itu, mengalihkan replika baca ke aktif harus dilakukan hanya setelah cluster sumber dihentikan.