HBase 常见问题总结(一)
admin
2024-01-21 00:21:51
0

前言

本文隶属于专栏《大数据异常问题汇总》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!


问题一:业务表出现大量空Region

应用背景

业务流水表的Rowkey设计是按照字典序严格递增的,采用分桶机制由多个进程向一个或多个独享的分桶写人数据。

产生问题

随着数据持续不断地人库到 HBase 表,该表的 Region 不断发生分裂,分裂后前一个 Region 不再会有数据写人,数据继续写入新生成的 Region。

一段时间后,当一个Region中的数据全部过期,RegionServer触发 major compaction 后,Region 中的数据就会被物理删除,此时该 Region 就会变成一个没有用的空 Region。

当集群中的空 Region 过多时,会给集群管理带来麻烦,meta 表持续增大,增大了 HMaster 节点的压力。

解决措施

HBase 支持在线合并 Region,我们只需要例行化检查该表中 Region 的状态,如果出现多个连续空 Region 时,我们将这些空 Region 合并成一个 Region 即可。


问题二:业务 HBase 客户端 RPC 连接异常关闭

应用背景

业务系统数据是从 MySQL 同步人库 HBase,同步入库频率跟业务系统的用户使用频率直接相关。

产生问题

我们从业务 HBase 客户端日志中观察到在某些时间段总是打印 RPC 连接异常关闭。

解决措施

调整 HBase 客户端参数,将 RPC 超时时间从 60s 调整到 180s,同时客户端强制每分钟或是满 1000 条记录就执行一次 flush commit,从 DB 同步一次 HBase,保证 RPC 长连接不会自动关闭。


问题三:单台 RegionServer 的 I/O 使用率一直为100%,HBase 集群请求量为0

应用背景

为了提高数据的人库速率,业务 HBase 客户端采用 putlist 接口减少客户端与服务端 RPC 连接的次数。

产生问题

当单台 RegionServer 出现磁盘异常时,某个磁盘 IO 使用率一直 100% 时,整个集群出现不可用,集群请求量直接为0。

解决措施

对集群机器增加磁盘 IO 异常的监控,发现有分区磁盘使用率过高,就自动将该机器从集群中剔除。

相关内容

热门资讯

【MySQL】锁 锁 文章目录锁全局锁表级锁表锁元数据锁(MDL)意向锁AUTO-INC锁...
【内网安全】 隧道搭建穿透上线... 文章目录内网穿透-Ngrok-入门-上线1、服务端配置:2、客户端连接服务端ÿ...
GCN的几种模型复现笔记 引言 本篇笔记紧接上文,主要是上一篇看写了快2w字,再去接入代码感觉有点...
数据分页展示逻辑 import java.util.Arrays;import java.util.List;impo...
Redis为什么选择单线程?R... 目录专栏导读一、Redis版本迭代二、Redis4.0之前为什么一直采用单线程?三、R...
【已解决】ERROR: Cou... 正确指令: pip install pyyaml
关于测试,我发现了哪些新大陆 关于测试 平常也只是听说过一些关于测试的术语,但并没有使用过测试工具。偶然看到编程老师...
Lock 接口解读 前置知识点Synchronized synchronized 是 Java 中的关键字,...
Win7 专业版安装中文包、汉... 参考资料:http://www.metsky.com/archives/350.htm...
3 ROS1通讯编程提高(1) 3 ROS1通讯编程提高3.1 使用VS Code编译ROS13.1.1 VS Code的安装和配置...
大模型未来趋势 大模型是人工智能领域的重要发展趋势之一,未来有着广阔的应用前景和发展空间。以下是大模型未来的趋势和展...
python实战应用讲解-【n... 目录 如何在Python中计算残余的平方和 方法1:使用其Base公式 方法2:使用statsmod...
学习u-boot 需要了解的m... 一、常用函数 1. origin 函数 origin 函数的返回值就是变量来源。使用格式如下...
常用python爬虫库介绍与简... 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库&...
药品批准文号查询|药融云-中国... 药品批文是国家食品药品监督管理局(NMPA)对药品的审评和批准的证明文件...
【2023-03-22】SRS... 【2023-03-22】SRS推流搭配FFmpeg实现目标检测 说明: 外侧测试使用SRS播放器测...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
初级算法-哈希表 主要记录算法和数据结构学习笔记,新的一年更上一层楼! 初级算法-哈希表...
进程间通信【Linux】 1. 进程间通信 1.1 什么是进程间通信 在 Linux 系统中,进程间通信...
【Docker】P3 Dock... Docker数据卷、宿主机与挂载数据卷的概念及作用挂载宿主机配置数据卷挂载操作示例一个容器挂载多个目...