【大数据学习-实验-2】分布式文件系统应用

分布式文件系统应用

一、 实验目的

1. 理解HDFS在Hadoop体系结构中的角***r> 2. 掌握HDFS操作常用的Shell命令;
3. 熟悉HDFS操作常用的Java API。

二、 实验内容

1.利用Hadoop提供的Shell命令完成以下任务:

(1)在Hadoop的/目录下创建一个test1文件夹;

(2)在Hadoop的test1文件夹中创建一个file.txt文件;

(3)查看Hadoop的根目录下所有文件;

(4)将Hadoop根下test1目录中的file.txt文件,移动到根下并重命名为file2.txt;

(5)将Hadoop根下的file2.txt文件复制到test1目录下;

(6)在Linux本地/data目录下,创建一个data.txt文件,并向其中写入“hello hadoop!”;

(7)将Linux本地/data目录下的data.txt文件,上传到HDFS中的/test1目录下;

(8)查看Hadoop中/test1目录下的data.txt文件;

(9)将Hadoop中/test1目录下的data.txt文件,下载到Linux本地/apps目录中;

(10)查看一下/apps目录下是否存在data.txt文件;

(11)删除Hadoop根下的file2.txt文件;

(12)删除Hadoop根下的test1目录;

(13)使用Shell命令执行Hadoop自带的WordCount。



2.编程实现以下任务:

(1)编写一个Java程序,创建类LocateFile.class,查看HDFS文件系统上,文件/hdfstest/sample_data的文件块信息;


(2)编写一个Java程序,创建类WriteFile.class,在HDFS上,创建/hdfstest/writefile文件,并在文件中写入内容“hello world hello data!”。


三、实验总结

实验过程中遇到不少问题,由于考虑到后期我会继续使用自己笔记本上的虚拟机,本次实验我在自己笔记本上做的实验,实验过程中遇到很多自己虚拟机上没有的文件和文件夹,自己创建了相应的文件进行了替代。在usr文件夹中创建文件,总是报错,没有创建文件的权限。后来相应的文件我创建到了主目录,也就是‘~/’这个目录,在做javaAPI编程实验的时候,发现需要自己安装eclipse,安装软件花了很多时间,后来安装完了后,我特地写了一遍安装博客,目的是为了,当我后期需要对eclipse做出修改时,我能够有一个参考文档,记录每一个文件夹存储的位置。通过这次试验,使我熟悉了hadoop对文件和文本的基本操作,以及掌握了怎样使用java代码控制文件操作。

全部评论

相关推荐

老粉都知道小猪猪我很久没更新了,因为秋招非常非常不顺利,emo了三个月了,接下来说一下我的情况吧本人是双非本 专业是完全不着计算机边的非科班,比较有优势的是有两段大厂实习,美团和字节。秋招面了50+场泡池子泡死的:滴滴 快手 去哪儿 小鹏汽车 不知名的一两个小厂其中字节13场 两次3面挂 两次2面挂 一次一面挂其中有2场面试题没写出来,其他的都是全a,但该挂还是挂,第三次三面才面进去字节,秋招加暑期总共面了22次字节,在字节的面评可以出成书了快手面了8场,2次实习的,通过了但没去,一次2面挂 最后一次到录用评估 至今无消息滴滴三面完 没几天挂了 所有技术面找不出2个问题是我回答不上来的,三面还来说我去过字节,应该不会考虑滴滴吧,直接给我干傻了去哪儿一天速通 至今无消息小鹏汽车hr 至今无消息美团2面挂 然后不捞我了,三个志愿全部结束,估计被卡学历了虾皮二面挂 这个是我菜,面试官太牛逼了拼多多二面挂 3道题也全写了 也没问题是回答不出来的 泡一周后挂腾讯面了5次 一次2面挂 三次一面挂,我宣布腾讯是世界上最难进的互联网公司然后还有一些零零散散的中小厂,但是数量比较少,约面大多数都是大厂。整体的战况非常惨烈,面试机会少,就算面过了也需要和各路神仙横向对比,很多次我都是那个被比下去的人,不过这也正常,毕竟谁会放着一个985的硕士不招,反而去招一个双非读化学的小子感觉现在互联网对学历的要求越来越高了,不仅仅要985还要硕士了,双非几乎没啥生存空间了,我感觉未来几年双非想要进大厂开发的难度应该直线上升了,唯一的打法还是从大二刷实习,然后苟个转正,不然要是去秋招大概率是炮灰。而且就我面字节这么多次,已经开始问很多ai的东西了,你一破本科生要是没实习没科研懂什么ai啊,纯纯白给了
不知名牛友_:爸爸
秋招你被哪家公司挂了?
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务