2019-10-28 22:29 已编辑清华大学 Java

关注

Hadoop

1.hadoop1和hadoop2的区别

2.HDFS架构

1.NameNode:存储文件的元数据，比如文件名、文件目录结构、文件属性、以及每个文件的块列表和所在的DataNode等。

2.DataNode：在本地文件系统中存储文件块数据，以及块数据的校验和

3.SecondaryNameNode：用来监控HDFS状态和辅助后台运行，并非 NameNode 的热备。当NameNode 挂掉的时候，它并不能马上替换 NameNode 并提供服务。每隔一段时间获取NameNode元数据的快照，在紧急情况下，可辅助恢复 NameNode。

3.yarn的架构

MapReduce架构概述

MapReduce将计算过程分为两个阶段：Map和Reduce

1）Map阶段并行处理输入数据

2）Reduce阶段对Map结果进行汇总

----------------------

Zookeeper内部原理

1. zookeeper的选举机制

半数机制：集群中半数以上机器存活，集群可用。所以Zookeeper适合安装奇数台服务器。

2）Zookeeper虽然在配置文件中并没有指定Master和Slave。但是，Zookeeper工作时，是有一个节点为Leader，其他则为Follower，Leader是通过内部的选举机制临时产生的。

3）以一个简单的例子来说明整个选举的过程。

假设有五台服务器组成的Zookeeper集群，它们的id从1-5，同时它们都是最新启动的，也就是没有历史数据，在存放数据量这一点上，都是一样的。假设这些服务器依序启动，来看看会发生什么，如下图所示。

（1）服务器1启动，此时只有它一台服务器启动了，它发出去的报文没有任何响应，所以它的选举状态一直是LOOKING状态。

（2）服务器2启动，它与最开始启动的服务器1进行通信，互相交换自己的选举结果，由于两者都没有历史数据，所以id值较大的服务器2胜出，但是由于没有达到超过半数以上的服务器都同意选举它(这个例子中的半数以上是3)，所以服务器1、2还是继续保持LOOKING状态。

（3）服务器3启动，根据前面的理论分析，服务器3成为服务器1、2、3中的老大，而与上面不同的是，此时有三台服务器选举了它，所以它成为了这次选举的Leader。

（4）服务器4启动，根据前面的分析，理论上服务器4应该是服务器1、2、3、4中最大的，但是由于前面已经有半数以上的服务器选举了服务器3，所以它只能接收当小弟的命了。

（5）服务器5启动，同4一样当小弟。

zookeeper***原理

zookeeper写数据流程

2.大数据生态体系

--------------------------

全部评论

推荐最新楼层

11-19 13:40

西安电子科技大学 Java

马斯克招人策略曝光：9 轮面试

作者：量子位事情是这样的。Business Insider 最近获得了特斯拉内部薪酬数据库（截至 2021 年 12 月）的访问权限，里面有 10 万名员工的薪酬数据。然后他们发现了有关特斯拉薪酬的一系列猛料：面试 9 轮只为招聘特斯拉铁粉；采用低底薪 + 股票奖励策略，打出 “高风险、高回报” 口号；特斯拉底薪低于同行，不及苹果、谷歌、英伟达、Meta、福特等科技公司和传统汽车制造商；工程师更有可能获得股票奖励；仅有 4% 的员工通过激励股票期权（ISOs） 获得股票，且通常授予高管；……（顺手推几个技术大厂的机会，前、后端or测试，感兴趣可以试试 ）更多爆料细节如下——马斯克招人策略：低底...

投递谷歌等公司10个岗位 >

点赞评论收藏

11-19 00:02

广东工业大学网页产品经理

北邮网安就业前景如何？

听说秋招的offer几乎没有，感觉就业形势相当严峻。作为大一新生，我越是关注这些信息，越是感到迷茫和无助。希望能从学长学姐们那里得到一些真实的反馈，了解一下我们这个专业的工作机会到底如何。

牛客创作赏金赛

点赞评论收藏

09-24 18:03

华中科技大学 Java

还是有点难过的

点赞评论收藏

09-24 17:03

广东女子职业技术学院测试开发

这题20分

牛客339922477号：都不用reverse，直接-1。一行。啥送分题

点赞评论收藏

11-21 13:08

蚌埠坦克学院 C++

金山WPS

服从性笔试吗，发这么多笔，现在还在发。

蟑螂恶霸zZ：傻 x 公司，发两次笔试，两次部门匹配挂，

投递金山WPS等公司10个岗位 >

点赞评论收藏

点赞 1 评论

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #