问WD鼎

2018-09-27 10:35 已编辑重庆邮电大学 Java

关注

大数据面经好少啊，我来写点

面过阿里（拿到意向书）、网易（无情拒绝）、海康，问题都总结一块了分不出来哪个公司问的了（见谅）。。。

（1）spark运行流程、源码架构

（2）Hbase主键设计、hbase为啥比mysql快、为什么项目选用hbase

（3）Hbase读写流程，数据compact流程

（4）Hadoop mapreduce流程

（5）Spark standalone模型、yarn架构模型（画出来架构图）

（6）Spark算子（map、flatmap、reducebykey和reduce、groupbykey和reducebykey、join、distinct）原理

（7）Spark stage的切分、task资源分配、任务调度、master计算资源分配

（8）Sparksql自定义函数、怎么创建dateframe

（9）Sparkstreaming项目多久一个批次数据

（10）Kafka复制机制、分区多副本机制

（11）Hdfs读写流程，数据checkpoint流程

（12）Sparkshuffle和hadoopshuffle原理、对比

（13）Hivesql怎么转化为MapReduce任务

（14）Spark调优

（15）Spark数据倾斜解决方案

（16）Yarn工作流程、组成架构

（17）Zookeeper首领选取、节点类型、zookeeper实现原理

（18）hbase的ha，zookeeper在其中的作用

（19）spark的内存管理机制，spark1.6前后对比分析

（21）spark rdd、dataframe、dataset区别

（22）spark里面有哪些参数可以设置，有什么用

（23）hashpartitioner与rangePartitioner的实现

（24）spark有哪几种join

（25）spark jdbc(mysql)读取并发度优化

（26）Spark join算子可以用什么替代

（27）HBase region切分后数据是怎么分的

（28）项目集群结构（spark和hadoop集群）

（29）spark streaming是怎么跟kafka交互的，具体代码怎么写的，程序执行流程是怎样的，这个过程中怎么确保数据不丢（直连和receiver方式）

（30）kafka如何保证高吞吐的，kafka零拷贝，具体怎么做的

（31）hdfs的容错机制

（32）zookeeper怎么保证原子性，怎么实现分布式锁

（33）kafka存储模型与网络模型

（34）Zookeeper脑裂问题

Scala

（1）隐式转换

（2）柯理化

#面经##秋招##阿里巴巴##网易#

全部评论

推荐最新楼层

牛客小王

重庆邮电大学 Java

请问巨佬有木有女朋友

2 回复分享

发布于 2018-09-27 09:34

Cecilia_Hu

重庆邮电大学

请问巨佬喜不喜欢师妹

点赞回复分享

发布于 2018-09-27 10:11

激光豆

北京化工大学 Java

楼主是校招还是社招啊？笔试中不会考算法的吗？还有数据结构的内容？

点赞回复分享

发布于 2018-09-30 14:11

buptzyc

北京邮电大学

懂得这么多。。。

点赞回复分享

发布于 2018-09-27 09:22

叶子在这儿

西安科技大学 Java

膜拜

点赞回复分享

发布于 2018-09-27 09:26

叶子在这儿

西安科技大学 Java

请问大佬是本科生还是

点赞回复分享

发布于 2018-09-27 09:27

RussellHoward

中国石油大学（北京） Java

我面的几家数据研发岗，这部分占的比重真不大，全是java基础，数据库，感觉我面的是后台开发不是大数据

点赞回复分享

发布于 2018-09-27 09:38

天凉凉地凉凉

上海大学 Java

大佬能讲讲spark中***的话会把这个rdd存到哪几个executor↑吗

点赞回复分享

发布于 2018-09-27 09:59

Mge.

中南大学安卓

大佬

点赞回复分享

发布于 2018-09-27 10:02

🌸娟

重庆邮电大学前端工程师

708发来贺电

点赞回复分享

发布于 2018-09-27 10:04

nancy1024

南京师范大学 Java

不是大数据方向，但是不明觉厉，帮顶🤗

点赞回复分享

发布于 2018-09-27 10:12

Cecilia_Hu

重庆邮电大学

708再发一遍贺电

点赞回复分享

发布于 2018-09-27 10:13

偏方三八面体

重庆邮电大学 Java

本人男需求男大佬有兴趣没

点赞回复分享

发布于 2018-09-27 10:21

13579

山西大学 Java

我擦，我面大数据，就不问我这些

点赞回复分享

发布于 2018-09-27 10:25

牛客124531号

门头沟学院 Java

big old

点赞回复分享

发布于 2018-09-28 09:59

七彩祥云吞天

京东_数据开发

大佬暑假有实习的经历嘛 😁

点赞回复分享

发布于 2019-04-17 15:26

别问，问就是稳了再拒

门头沟学院算法工程师

大佬，是阿里数据研发工程师吗，进去具体是干嘛呀

点赞回复分享

发布于 2019-04-17 15:29

BallOffer

阿里巴巴_数据

大佬都看的什么书啊？求推荐

点赞回复分享

发布于 2020-03-19 00:20

2024-11-27 10:08

顺丰集团_大数据挖掘与分析工程师(准入职员工)

顺丰内推顺丰面经

顺丰前端面经base：武汉一面时长：27min自我介绍实习、负责内容与收获挑一个能体现能力的需求说为什么换实习、不转正如何学习前端项目是否上线、人员配比说说原型和原型链Object.porotype 的父级是什么，porotype 上有什么属性跨域问题如何解决TS 内置映射类型用过哪些一个类型要取出某些字段如何实现说说 TS 的泛型说说哈希表，什么情况使用对顺丰的了解反问面试流程：听 hr 安排部门业务：有许多业务板块，本质都属于物流领域的某个环节，协作关系，app、小程序、微前端、pc、h5、bff、低代码、可视化都有技术栈：React、Vue 为主，看部门二面时长：34min自我介绍说说前...

点赞评论收藏

2024-11-21 01:15

门头沟学院大数据开发工程师

网易实习一面数据开发

#软件开发笔面经# 自我介绍第一个项目中的成员分工数据规模是多少数据模型是怎样考虑的项目中有没有遇到过什么问题，是如何解决的当时考虑接外部软件是吧，为什么没有考虑在数据可视化部分自己做一些定制化的开发第二个项目是部署上线的，可使用的项目是吧SQL中做行列转换如何操作如何找到脏数据中十条重复数据并删除如果直接筛，可能导致被锁住，有其他办法么SQL中几种删除方式的区别索引有了解吗，有哪些索引的类型什么情况下会导致索引失效分区有了解过吗大数据量处理慢SQL的解决和优化方法雪花模型和星型模型的区别事实表和维度表有什么区别Hive中内外部表有什么区别Hive和Spark有什么区别Sqoop在项目中主要做什么如何用Sqoop实现增量数据的处理常用Linux命令具体讲解改文件执行权限用什么命令做定时任务用什么命令找到某一目录下，找到占用空间的最大的文件创建文件呢校园经历，写过PPT是吧

查看27道真题和解析软件开发笔面经

点赞评论收藏

2024-11-21 12:23

门头沟学院大数据开发工程师

实习货拉拉一面数仓

#软件开发笔面经# 实习 货拉拉1面-数仓自我介绍 被打断哈哈项目深挖数仓怎么分层的？分层的好处？数据倾斜怎么解决的？ADS指标怎么开发的？实时数仓过程中遇到的问题？比如数据一致性？数据治理过程中怎么和业务方沟通，怎么推进（leader&amp;下游），有什么问题？有么有遇到数据漂移，怎么解决（说实话突然就卡住了，解决方法基本上就是业务时间落盘保障时间，然后就是dqc 监控）技术题（基本等于没问）：sql了解多少，说一下开窗函数有哪些（老生常谈了）为什么选择我们公司？你对我们公司业务有多少的了解

查看10道真题和解析软件开发笔面经

点赞评论收藏

2024-11-18 15:56

门头沟学院算法工程师

美团数据开发面经

秋招结束咯～写写之前的面经攒人品～自我介绍为什么选数据开发，对数据开发的理解。HDFS的读写机制什么是数仓（不是只有结构化如果副本机制只有2，会有什么优点和危害？spark的计算都是在内存里吗项目中怎么进行数据清洗数据库的主键、唯一、外键索引（主键索引是唯一索引的一种，一个表中可以有多个唯一索引但只能有一个主键，主键列不能有空值，而唯一索引允许空值，主键可以作为其他表的外键）如果有大量客户注册，应该怎么优化数据库？Python的进程，线程和协程（进程是资源分配和调度的基本单位，有自己的独立空间，开销大；线程是CPU调度的基本单位，进程的实体；协程是用户态的轻量级线程，单线程内执行多任务；切换效率：协程＞线程＞进程）Python的复制，浅拷贝，深拷贝（浅拷贝只拷贝最外层，深拷贝拷贝所有完全独立。当原始对象的最外层改变时，两者都不变；当原始对象的子对象改变时，浅拷贝随之变化。修改浅拷贝的子对象会影响原始对象，但深拷贝不会。）学习大数据的时候遇到的一些难点手撕：链表反转，积分最高sql反问：需要做的主要工作，工作氛围，工作地点

查看13道真题和解析

点赞评论收藏

2024-11-21 12:35

门头沟学院大数据开发工程师

美团校招一面数仓

#软件开发笔面经# 美团一面1. 说一说对Hadoop体系的理解及其核心组件的功能。2. 数据上传到HDFS时如何划分数据块以及块与文件的对应关系。3. Hive常见的优化方案以及具体的实施方法。4. 数据仓库的分层结构DWD和DWS层是必须的吗？它们分别是做什么的。5. MySQL事务的四个原则（ACID）及其含义。6. MySQL中索引的分类及其区别（如聚集索引、簇状索引、非簇状索引）。7. 前缀索引及最左匹配原则的理解。8. Spark中RDD的宽窄依赖的区分，并举例说明哪些算子属于宽依赖或窄依赖。9. 简历深挖10. 遇到的最大的困难写sql，次日留存率讲讲你对维度建模的理解你觉得什么样的数仓是一个比较好的数仓？写sql，最大连续登录天数

查看14道真题和解析软件开发笔面经

点赞评论收藏

236

全站热榜

正在热议

# 工作中，你有没有遇到非常爱骂人的领导？ #

# 找工作，你会甘心进小厂还是猛冲大厂 #

180941次浏览 2059人参与