【大数据学习-实验-3】分布式数据库应用hbase

分布式数据库应用
一、 实验目的
1.理解HBase在Hadoop体系结构中的角***r> 2.熟练使用HBase操作常用的Shell命令;
3.熟悉HBase操作常用的Java API。
二、 实验内容
1.用Hbase Shell命令完成如下操作。


(1) 使用version命令查看版本信息;

(2) 使用list命令来查看一下有哪些表;

(3) 创建一张表,表的参数如下:表名为table_name,列族名为f1;

(4)使用exists命令查看table_name表是否存在;

(5)使用desc命令来查看一下table_name表结构;

(6)现在我们使用put命令向table_name表中插入几行数据,rowkey001中的f1下的col1的值为value1,rowkey002中的f1下的col2的值为value2,rowkey002中的f1下的col1的值为value1;

(7)使用get命令来查询一下table_name表,rowkey001中的f1下的col1的值;

(8)查询表table_name,rowkey001中的f1下的所有列值;

(9)使用scan命令扫描全表;

(10)使用count命令,查看table_name表中的数据行数;

(11)使用count命令,查看table_name表中的数据行数;

(12)使用delete命令删除table_name表中,rowkey001中的f1:col2的数据;

(13)使用deleteall命令,删除table_name表中rowkey002这行数据;

(14) 使用truncate命令,删除table_name表中的所有数据;

2.用Hbase API编程完成如下操作。
(1)在创建的项目下创建类,名为CreateMyTable,功能为在HBase中创建名为mytb,列族为mycf的表;


(2)创建类,命名为DeleteMyTable,功能为将HBase中表mytb删除;


(3)创建类,名为PutData,功能为将以上三条数据写入到buyer表中;


(4)创建类GetData,功能为查询HBase的buyer表中rowkey为20386的数据。

三、实验总结
实验时遇到很多问题,hbase环境安装问题,按照教程安装,主要是版本问题,hadoop的版本,一定要和hbase的版本配套,我的hadoop安装的3.2.1,hbase安装的时2.2.4,安装使用没有问题,但是启动的hbase的时候,有一些警告错误,

但是这个错误不影响实验,不知道什么原因导致的,希望不会影响课程的学习。
还有一个注意的hadoop启动后,jps会输出六条记录

Hbase启动后,jps会输出9条记录

当eclipse启动后,jps会输出10条记录
这些启动的程序一定要注意,万一少了一条shell就会运行报超时连接错误,还有就是,一开始我的虚拟机运行eclipse时总是闪退,自己瞎捣鼓了好久,后来发现时虚拟机配置低,当hadoop,hbase启动后会非常占内存,我的虚拟机总是卡死,一开始我的虚拟机时3g内存,2核处理器,后来直接被我调节到了8G内存加8核处理,现在运行不会再卡顿了,有时再加上运行火狐浏览器的时候,有点卡顿,再做javaAPI的时候,实验中给的代码有问题,实验过程中的参考文档需要导入的包,我通过章鱼平台下载到本地电脑,再通过本地电脑上传到百度网盘,再在虚拟机上下载百度网盘,再在虚拟机上的百度网盘将jar包下载下来,后来jar包导进去了,代码也导进去了,结果发现总是报超时错误,郁闷了很久,后台去寻找网上资料修改了源码,修改了jar包,个人感觉应该时hbase版本的问题,版本太高了,和大章鱼平台上的jsr包不匹配,后来查了网上资料才知道需要导入的lib包人家hbase自带的有。
下面的截图就是存储的位置。


导入jar包还不算完,参考文档中给的函数有些也不能使用,需要改进。自己做了一些改进,实现了实验要求。通过本次实验使我收获了很多,更加熟悉了hadoop,与hbase之间的关系,以及和hbase的启动关闭shell的操作。

全部评论

相关推荐

牛客868257804号:九个中铁八个中建
点赞 评论 收藏
分享
评论
点赞
收藏
分享
牛客网
牛客企业服务