叶南天

2020-09-09 16:49 已编辑北华大学 Java

关注

百度大数据外包岗面试题附录答案

1. 自我介绍

2. 聊一下最近的项目，项目过程中遇到哪些问题，是怎样解决的

3. Linkedhashmap和hashmap的区别

LinkedHashMap是继承于HashMap，是基于HashMap和双向链表来实现的；

HashMap无序，LinkedHashMap有序，可分为插入顺序和访问顺序两种，可基于访问顺序实现缓存

4. 说一下java虚拟机垃圾回收机制

对象回收算法包括引用计数法和可达性分析算法。引用计数法简单高效，唯一缺点是当两个对象互相引用时无法被回收。可达性分析算法是通过一系列gc root的对象作为起点，搜索走过的路径形成引用链，当一个对象没有与任何引用链相连，表示对象不可达，可以内存回收

垃圾回收算法包括标记、清理算法、复制算法，标记整理算法，分代回收算法，其中新生代一般采用复制算法，老生代采用标记整理算法

5. Final修饰的int .sting map可以改变吗

Final修饰基本数据类型值不可以改变，但是String，Map，数组等，都可以改变其内部的值，因为他们隶属于类，而类里面的属性还是可更改的。

6. Spark工作中你会用到哪些rdd？

工作中常用到map、flatmap、filter、sortBy、join

7. Map和mapPartition的区别？

Map整体遍历，mapPartition按照每一个分区进行遍历，效率更高

8. Spark有遇到过内存溢出吗？

Map过程中产生大量对象会导致内存溢出；

数据分布不平衡在Shuffer过程中会导致内存溢出

9. Spark调优有了解吗？

基本调优和高级调优

10. 讲一下mr shuffer 的过程吧

首先map生成k.v键值对会收集在环形缓冲区中，当缓冲区达到80%会溢出到本地磁盘，在溢出过程中会按照key进行分区以及排序，然后reducer会根据自己的分区号去本地读取数据文件，读到后会进行合并以及排序，然后进入reducer流程

11. Shuffer过程中的排序算法了解吗？

Map溢出过程中用到的是快排，时间复杂度是nlogn，空间复杂度最优为logn

12. 来写个sql吧，不记得具体的sql了

13. 有什么想了解的吗

#面经##数据开发工程师##百度##社招#

全部评论

推荐最新楼层

牛客社区助手006

北京警察学院运营

楼主你好，请问你是实习、校招还是社招？

点赞回复分享

发布于 2020-09-09 16:39

ros1n

作业帮_数据平台部_大数据工程师

老哥，你这个面的是大数据平台开发吗?我看怎么没问数仓相关的东西

点赞回复分享

发布于 2020-09-15 21:52

03-12 20:26

中山大学 Java

蚂蚁春招

蚂蚁的笔试还没做，收到了电话约面试？（想等着准备好了再做做笔试的）各位大佬有什么经验教训吗考研失败了才来春招，完全没经验

蚂蚁求职进展汇总

点赞评论收藏

03-10 15:27

门头沟学院后端

26双非c++暑期实习简历求拷打

刚开始投简历好慌

点赞评论收藏

02-25 17:03

西南大学 Java

26暑期实习简历，求拷打

211本，目标中厂，不玻璃心

点赞评论收藏

03-07 13:49

门头沟学院 Java

小白，hr是想问啥呀

逆流河上万仙退：可能是发的钱太少了怕你过来实习还要自己贴钱意向就不高省的浪费大家时间可能你通过了也不会去

点赞评论收藏

03-12 01:53

湖南科技大学 Web前端

26双非前端后悔了当初的offer

大三下开学初（2月20号），面了一个北京的智谱收购的子公司（搞ai的）面的很简单就问了一点八股答的挺流畅，直接就给过了，一天200包三餐，当时心高气傲，给拒了，现在面试过程中被问到之前做的项目，根本不会答，后悔了，是不是应该直接去实习，积攒实习经验在实习中成长的更快啊，更好做跳板啊，友友们怎么说

我的实习求职记录没有实习经历，还有机会进大厂吗

点赞评论收藏

招聘动态

携程集团

25届校招+26届实习

26届【实习】投递合集

26届实习生双选会报名开启

交银金科

2025届春季招聘

满帮集团

2025春季校园招聘

滴滴

2025届春季校园招聘

腾讯音乐娱乐集团

2025实习生招聘

石化盈科

2025届校园招聘

26届简历拷打辅导交流

快手

25校招&26实习进行中

全站热榜

创作者周榜

正在热议

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

百度大数据外包岗 面试题附录答案

全站热榜

创作者周榜

百度大数据外包岗面试题附录答案