Kudu

Kudu项目的初衷是在Hive的批量处理和HBase的随机读写之间找一个平衡点
kudu的批量处理性能优于hbase,随机读写优于hive。
hive的一般用于构建数据仓库,kudu一般用于做近实时的查询分析。
hive一般要配合impala或者presto或者kylin等做交互式查询
kudu一般配合impala做交互式查询,也可以配合其他的做数据查询。
hbase一般可以配合apache Phoenix提供查询功能。
使用hive、kudu、hbase还要看需求:如果是建立数据仓库,做T+1天的BI系统,还是要选择Hive。
如果希望数据是分钟级别的延时,希望尽量快的看到结果,而且是结构数据,选kudu是没错的。
如果需求是大量快速的写,经常单条的读,那必须是hbase,kudu和hive都不行。

作者:老冯
链接:https://www.zhihu.com/question/431957266/answer/1595808341
来源:知乎

其他好的文章

全部评论

相关推荐

三年之期已到我的offer快到碗里来:9硕都比不上9本
点赞 评论 收藏
分享
11-01 20:03
已编辑
门头沟学院 算法工程师
Amazarashi66:这种也是幸存者偏差了,拿不到这个价的才是大多数
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务