本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon EMR 6.8.0 – Hive 版本備註
Amazon EMR 6.8.0 – Hive 變更
| Type | 說明 |
|---|---|
| 改進項目 | 減少 msck 命令中的檔案系統呼叫。效能改進 (在 1 萬個以上的分割區上提高約 15-20 倍) |
| 向後移植 | HIVE-20678 |
| 向後移植 | HIVE-21040 |
| 向後移植 | HIVE-21460 |
| 向後移植 | HIVE-21660 |
| 向後移植 | HIVE-22505 |
| 向後移植 | HIVE-22513 |
| 向後移植 | HIVE-23435 |
| 向後移植 | HIVE-24209 |
| 向後移植 | HIVE-24934 |
| 向後移植 | HIVE-25278 |
| 向後移植 | HIVE-25505 |
| 向後移植 | HIVE-26080 |
| 向後移植 | HIVE-26235 |
| 錯誤 | 修正在啟動期間 stderr 中的多個 SLF4J 繫結警告日誌 |
| 錯誤 | 修正當分割區和資料表位於不同檔案系統時,SHOW TABLE EXTENDED 查詢失敗並顯示 Wrong FS 錯誤的問題。 |
Amazon EMR 6.8.0 – Hive 已知問題
在 Amazon EMR 6.6.0 至 6.9.x 中,具有動態分割區和 ORDER BY 或 SORT BY 子句的 INSERT 查詢將始終具有兩個縮減器。此問題是因 OSS 變更 HIVE-20703
所造成,此變更會將動態排序分割區優化置於成本型決策下。如果您的工作負載不需要對動態分割區進行排序,建議將 hive.optimize.sort.dynamic.partition.threshold屬性設定為-1,以停用新功能並取得計算正確的縮減器數量。此問題已作為 HIVE-22269的一部分在 OSS Hive 中修正,並已在 Amazon EMR 6.10.0 中修正。