计忆芳华

2020-08-15 19:26 已编辑北华航天工业学院 Java

关注

Hadoop Shell基本操作(大章鱼版)

任务目标

1.熟练掌握常用的hadoop shell命令

任务内容

1.学习在开启、关闭Hadoop
2.学习在Hadoop中创建、修改、查看、删除文件夹及文件
3.学习改变文件的权限及文件的拥有者
4.学习使用shell命令提交job任务
5.Hadoop安全模式的进入与退出

任务步骤

1.打开终端模拟器，切换到/apps/hadoop/sbin目录下，启动Hadoop（使用自己安装的目录即可）

1.	cd /apps/hadoop/sbin  
2.	./start-all.sh

除了直接执行start-all.sh外，还可以分步启动start-dfs.sh和start-yarn.sh。
2.执行jps，检查一下Hadoop相关进程是否启动

1.	jps

3.在/目录下创建一个test1文件夹（hadoop fs也可用hdfs dfs替换）

1.	hadoop fs -mkdir /test1

4.在Hadoop中的test1文件夹中创建一个file.txt文件

1.	hadoop fs -touchz /test1/file.txt

5.查看根目录下所有文件

1.	hadoop fs -ls /

6.还可以使用ls -R的方式递归查看根下所有文件

1.	hadoop fs -ls -R /

7.将Hadoop根下test1目录中的file.txt文件，移动到根下并重命名为file2.txt

1.	hadoop fs -mv /test1/file.txt /file2.txt

Hadoop中的mv用法同Linux中的一样，都可以起到移动文件和重命名的作用。
8.将Hadoop根下的file2.txt文件复制到test1目录下

1.	hadoop fs -cp /file2.txt /test1

9.在Linux本地/data目录下，创建一个data.txt文件，并向其中写入hello hadoop！（若不存在data目录则新建该目录）

1.	cd /data  
2.	touch data.txt  
3.	echo hello hadoop! >> data.txt

10.将Linux本地/data目录下的data.txt文件，上传到HDFS中的/test1目录下

1.	hadoop fs -put /data/data.txt /test1

11.查看Hadoop中/test1目录下的data.txt文件

1.	hadoop fs -cat /test1/data.txt

12.除此之外还可以使用tail方法

1.	hadoop fs -tail /test1/data.txt

tail方法是将文件尾部1K字节的内容输出。支持-f选项，行为和Unix中一致。
13.查看Hadoop中/test1目录下的data.txt文件大小

1.	hadoop fs -du -s /test1/data.txt

-du 后面可以不加-s，直接写目录表示查看该目录下所有文件大小
14.text方法可以将源文件输出为文本格式。允许的格式是zip和TextRecordInputStream。

1.	hadoop fs -text /test1/data.txt

15.stat方法可以返回指定路径的统计信息，有多个参数可选，当使用-stat选项但不指定format时候，只打印文件创建日期，相当于%y

1.	hadoop fs -stat /test1/data.txt

下面列出了format的形式：
%b：打印文件大小（目录为0）
%n：打印文件名
%o：打印block size （我们要的值）
%r：打印备份数
%y：打印UTC日期 yyyy-MM-dd HH:mm:ss
%Y：打印自1970年1月1日以来的UTC微秒数
%F：目录打印directory, 文件打印regular file
16.将Hadoop中/test1目录下的data.txt文件，下载到Linux本地/apps目录中（若目录不存在则新建该目录）

1.	hadoop fs -get /test1/data.txt /apps

17.查看一下/apps目录下是否存在data.txt文件

1.	ls /apps

18.使用chown方法，改变Hadoop中/test1目录中的data.txt文件拥有者为root，使用-R将使改变在目录结构下递归进行。

1.	hadoop fs -chown root /test1/data.txt

19.使用chmod方法，赋予Hadoop中/test1目录中的data.txt文件777权限

1.	hadoop fs -chmod 777 /test1/data.txt

20.删除Hadoop根下的file2.txt文件

1.	hadoop fs -rm /file2.txt

21.删除Hadoop根下的test1目录

1.	hadoop fs -rm -r /test1

22.当在Hadoop中设置了回收站功能时，删除的文件会保留在回收站中，可以使用expunge方法清空回收站。

1.	hadoop fs -expunge

在分布式文件系统启动的时候，开始的时候会有安全模式，当分布式文件系统处于安全模式的情况下，文件系统中的内容不允许修改也不允许删除，直到安全模式结束。安全模式主要是为了系统启动的时候检查各个DataNode上数据块的有效性，同时根据策略必要的复制或者删除部分数据块。运行期通过命令也可以进入安全模式。在实践过程中，系统启动的时候去修改和删除文件也会有安全模式不允许修改的出错提示，只需要等待一会儿即可。
23.使用Shell命令执行Hadoop自带的WordCount
首先切换到/data目录下，使用vim编辑一个data.txt文件，内容为:hello world hello hadoop hello ipieuvre

1.	cd /data  
2.	vim data.txt

在HDFS的根下创建in目录，并将/data下的data.txt文件上传到HDFS中的in目录

1.	hadoop fs -put /data/data.txt /in

执行hadoop jar命令，在hadoop的/apps/hadoop/share/hadoop/mapreduce路径下存在hadoop-mapreduce-examples-2.6.0-cdh5.4.5.jar包，我们执行其中的worldcount类，数据来源为HDFS的/in目录，数据输出到HDFS的/out目录

1.	hadoop jar /apps/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.4.5.jar wordcount /in /out

查看HDFS中的/out目录

1.	hadoop fs -ls /out  
2.	hadoop fs -cat /out/*

24.进入Hadoop安全模式

1.	hdfs dfsadmin -safemode enter

25.退出Hadoop安全模式

1.	hdfs dfsadmin -safemode leave

26.切换到/apps/hadoop/sbin目录下，关闭Hadoop

1.	cd /apps/hadoop/sbin  
2.	./stop-all.sh

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

07-08 14:15

谁懂，同期实习生中只有我做dirty work？

同期的实习生比我早来三天，我们两人被mentor安排的任务技术含量完全不同，也许是因为她之前的实习经验比我多一点？所以她的活都比较有挑战性，而且很容易做出彩的项目，相反我的工作都是重复性极强，很机械，根本写不到简历里。被区别对待的感觉很不爽！我还特意私下找了mt评理，但他也没有给我什么实质性的回答，我现在只能每天不停地调整好自己的心态，熬完三个月就跑路吧！

不是上谷：1.两个人面试表现不同，简历不同，能力不同 2.社会本质是人组成的，你组长或者导师更愿意留下他转正 3.实习给你的小任务，你没有很好的完成，你导师评估你无法承担更难的任务。三点都有可能。本质上还是你自己的原因

实习生的蛐蛐区

点赞评论收藏

不愿透露姓名的神秘牛友

07-07 13:46

转Go七天，面三中三全20k

双9科班零Offer！弃C++转Go七天，狂背GMP调度/微服务，收割3个20k offer，看来不会Go的C++程序员＝当代兵马俑

Java抽象小篮子：go批这招太狠了

点赞评论收藏

06-26 17:24

已编辑

宁波大学 golang

某为od岗位

hr为了KPI演都不演了

迷失西雅图：别给，纯kpi，别问我为什么知道

点赞评论收藏

06-11 22:00

西南交通大学嵌入式硬件工程师

佬们求康康

各位大佬帮我看看简历呗😊，现在真纯混子了，写的都是一些校内课程项目，打算根据这些恶补知识，不知道这样到校招够不够找到一些工作😂

zYvv：双一流加大加粗再标红，然后广投。主要是获奖荣誉不够，建议开始不用追求大厂，去别的厂子刷下实习。

点赞评论收藏

不愿透露姓名的神秘牛友

07-10 12:28

有没有和我一样的

汇报一下进度，7.10日仍然还在找实习中...offer快来吧，快来吧从六月找到七月，我的实习你在哪里？！！

点赞评论收藏

全站热榜

创作者周榜

正在热议

Hadoop Shell基本操作(大章鱼版)

任务目标

相关知识

任务内容

任务步骤

全站热榜

创作者周榜