2022-05-09 11:27 浙江大学 Java

关注

请谈下你对 HBase 的认识？

简介

HBase 是一个面向列式存储的分布式数据库，其设计思想来源于 Google 的 BigTable 论文。HBase 底层存储基于 HDFS 实现，集群的管理基于 ZooKeeper 实现。HBase 良好的分布式架构设计为海量数据的快速存储、随机访问提供了可能，基于数据副本机制和分区机制可以轻松实现在线扩容、缩容和数据容灾，是大数据领域中 Key-Value 数据结构存储最常用的数据库方案。

特点

易扩展

Hbase 的扩展性主要体现在两个方面，一个是基于运算能力（RegionServer）的扩展，通过增加 RegionSever 节点的数量，提升 Hbase 上层的处理能力；另一个是基于存储能力的扩展（HDFS），通过增加 DataNode 节点数量对存储层的进行扩容，提升 HBase 的数据存储能力。（拓展：图文详解 HDFS 的工作机制及其原理）

海量存储

HBase 作为一个开源的分布式 Key-Value 数据库，其主要作用是面向 PB 级别数据的实时入库和快速随机访问。这主要源于上述易扩展的特点，使得 HBase 通过扩展来存储海量的数据。

列式存储

Hbase 是根据列族来存储数据的。列族下面可以有非常多的列。列式存储的最大好处就是，其数据在表中是按照某列存储的，这样在查询只需要少数几个字段时，能大大减少读取的数据量。（拓展：为什么列式存储会被广泛用在 OLAP 中？）

高可靠性

WAL 机制保证了数据写入时不会因集群异常而导致写入数据丢失，Replication 机制保证了在集群出现严重的问题时，数据不会发生丢失或损坏。而且 Hbase 底层使用 HDFS，HDFS 本身也有备份。

稀疏性

在 HBase 的列族中，可以指定任意多的列，为空的列不占用存储空间，表可以设计得非常稀疏。

模块组成

HBase 可以将数据存储在本地文件系统，也可以存储在 HDFS 文件系统。在生产环境中，HBase 一般运行在 HDFS 上，以 HDFS 作为基础的存储设施。HBase 通过 HBase Client 提供的 Java API 来访问 HBase 数据库，以完成数据的写入和读取。HBase 集群主由HMaster、Region Server 和 ZooKeeper 组成。

HMaster

负责管理 RegionServer，实现其负载均衡；
管理和分配 Region，比如在 Region split时分配新的 Region，在 RegionServer 退出时迁移其内的 Region 到其他 RegionServer上；
管理namespace和table的元数据（实际存储在HDFS上）；
权限控制（ACL）。

RegionServer

存放和管理本地 Region；
读写HDFS，管理Table中的数据；
Client 从 HMaster 中获取元数据，找到 RowKey 所在的 RegionServer 进行读写数据。

ZooKeeper

存放整个 HBase集群的元数据以及集群的状态信息；

实现HMaster主从节点的failover。

另外，非常欢迎大家扫描下方二维码，加我VX：Abox_0226，备注「进群」，有关大数据技术的问题在群里一起探讨。

# 谈一下你对 HBase 的认识？

全部评论

推荐最新楼层

04-17 01:41

已编辑

快手_电商_后端开发(实习员工)

实习的快乐与痛苦

来快手实习三个半月了，第一次实习，学到很多有用的知识。但是因为我入职时间很微妙，以至于暑期实习开的时候感觉自己还啥都没学会，所以就没有赶上刚开的时候投递，快手晚上十点下班，平时上班就很累了，下班了还要准备背八股和投递简历和练习算法题，感觉自己根本忙不过来，现在四月中旬了，我已经错过了暑期实习的最佳投递时间，目前也只面了一场，总感觉自己没准备好面试来了就使劲儿往后推。残存余力备战。牛友们都是怎么平衡实习和面试的啊？如何变成时间管理大师？

monfremonfre：我说一下我的经验 1. 每天写好每天的工作计划, 尽量设置一下粗糙的截止时间 2. 不要接太多活, 一定要留下1-2个小时的自我充电时间 3. 做好工作留痕, 避免资源搜集占用太多时间

投递快手等公司10个岗位 >

点赞评论收藏

分享

今天 13:33

华为_产品经理(准入职员工)

再见了，能让我在华子面前犹豫的小厂

工作三个月，几乎每天到点下班偶尔提前走，周末双休。打卡制度很松，工作是售前+产品经理的活，工作量很少，工作难度很小，薪资13k（楼主双非本科），正儿八经的管培生，公司重点培养，还能接触到长安、吉利、运营商等客户资源。-------分割线---------接受offer24年12月我同时接到了华子的三面通知和华苏的三面通知。在当时我眼里，一个是世界头部企业之一，也是我目前的bg能接触到的最Top级别的企业，另外一个则是我在boss上海投的一个重庆本地的没听说过的企业。应届生都有“海王本质”。华子闻名世界的“泡池子。”让我很难不骑驴找马，于12.13接受了华苏的管培生offer，接到通知下周要去南...

哪些瞬间让你真切感受到了工作的乐趣牛客激励计划

点赞评论收藏

分享

03-29 14:19

门头沟学院 Java

如图挂完了直接放弃暑期

你背过凌晨4点的八股文么：加油同学，人生的容错率很高，只是一个暑期罢了，后面还有很多机会！

点赞评论收藏

分享

03-29 19:11

门头沟学院 Java

这也是百度的招聘流程吗？

这是正常环节吗😳

wyp_davis：是可以这样的，不过只要交钱就是假的

点赞评论收藏

分享

04-17 14:11

西安交通大学后端

暑期实习总结-节孝子启动

楼主的BG是2本9硕，两段中厂实习，一段是大三，一段是去年9月到今年2月底，第一段纯java后端，第二段是做大模型训练平台后端，3月中开始投递暑期实习，目前拿到了字节和美团两个Offer，写一下自己暑期的总结，希望可以帮助到牛友们。一、Offer选择早早看到很多牛客的UU拿到了Offer面临着选择，分享下自己的选择的思路：1、Offer选择心态首先在三月或者四月初拿到大厂Offer的同学，无非是几种情况：学历比较好、实习比较硬、笔试面试基础比较扎实，不论暑期实习选择哪家，秋招应该都是乱杀，所以心态上不用慌张2、招聘趋势从今年的招聘趋势来看，美团、阿里等大厂纷纷喊出all in ai，在面试环节...

美团求职进展汇总字节求职进展汇总

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

携程进展讨论区

热聊中

创作者周榜

更多

正在热议

更多

# 京东美团大战，你怎么看？ #

40292次浏览 247人参与

# 工作经验重要还是工资重要？ #

120726次浏览 813人参与

# 平安产险科技中心求职汇总 #

245057次浏览 2614人参与

# 实习进度记录 #

182401次浏览 2102人参与

# 毕业论文怎么查AI率 #

7941次浏览 485人参与

# 产品人求职现状 #

192245次浏览 1787人参与

# 一觉醒来，我成论文导师了… #

6396次浏览 123人参与

# 租房找室友 #

13290次浏览 95人参与

# 拼多多工作体验 #

15804次浏览 149人参与

# 哪个瞬间让你对大厂祛魅了？ #

288635次浏览 2079人参与

# 我的求职精神状态 #

7598次浏览 142人参与

# 大城市找工作会更容易吗 #

18966次浏览 147人参与

# 读研or工作，哪个性价比更高？ #

54263次浏览 658人参与

# 好未来求职进展汇总 #

7692次浏览 61人参与

# 顺丰求职进展汇总 #

47448次浏览 267人参与

# 腾讯云智研发工作体验 #

19832次浏览 138人参与

# 金山WPS工作体验 #

22632次浏览 141人参与

# 4399求职进展汇总 #

17719次浏览 141人参与

# 海康威视求职进展 #

62765次浏览 355人参与

# 讲讲我经历过的转正 #

32209次浏览 190人参与

# 小红书求职进展汇总 #

50163次浏览 446人参与

牛客网
牛客企业服务