三石大数据

2023-08-24 22:39 门头沟学院大数据开发工程师

关注

微众大数据开发高频面试题及答案【附JD分析】

推荐阅读文章列表：大数据开发面试笔记V4.0 || 面试聊数仓第一季 || 小白大数据学习路线

一、JD分析

根据业务方提供的需求，完成数仓建模开发【考察业务理解和SQL能力】

深入理解需求，建立核心指标，完成数据质量监控【考察业务理解和数据质量保障能力】

二、高频面试题总结

1. 如何进行数据质量监控

从四个原则来回答：【每个原则再结合实际来举例，吊打面试官，不懂的评论区讨论一下】

准确性
完整性
一致性
及时性

2. 讲一下项目中是如何分层的

先简单介绍五层架构：ods、dwd、dwm、dws、ads

然后介绍为什么这样分层，每一层干了什么

3. MapReduce的过程

map阶段：首先通过InputFormat把输入目录下的文件进行逻辑切片，默认大小等于block大小，并且每一个切片由一个maptask来处理，同时将切片中的数据解析成<key,value>的键值对，k表示偏移量，v表示一行内容；紧接着调用Mapper类中的map方法。将每一行内容进行处理，解析为<k,v>的键值对，在wordCount案例中，k表示单词，v表示数字1 ；

shuffle阶段：map端shuffle和reduce端shuffle，详细内容见最新大数据开发面试笔记V4.0

reduce阶段：key相同的数据会调用一次reduce方法，每次调用产生一个键值对，最后将这些键值对写入到HDFS文件中。

4. 写过UDF函数没

写过，在进行count distinct优化的时候，实现了bitmap的创建以及计算功能
UDF主要分为三类，包括udf、udaf、udtf
在创建UDF函数的时候，只需要按照重写固定的重写方法就行了

5. Spark和MapReduce的区别

MapReduce需要将计算的中间结果写入磁盘，然后还要读取磁盘，从而导致了频繁的磁盘IO；而Spark不需要将计算的中间结果写入磁盘，这得益于Spark的RDD弹性分布式数据集和DAG有向无环图，中间结果能够以RDD的形式存放在内存中，这样大大减少了磁盘IO。

MapReduce在shuffle时需要花费大量时间排序，而spark在shuffle时如果选择基于hash的计算引擎，是不需要排序的，这样就会节省大量时间。

MapReduce是多进程模型，每个task会运行在一个独立的JVM进程中，每次启动都需要重新申请资源，消耗了大量的时间；而Spark是多线程模型，每个executor会单独运行在一个JVM进程中，每个task则是运行在executor中的一个线程。

#数据人的面试交流地##秋招的第一个offer，大家都拿到了吗##秋招##大数据开发#

全部评论

推荐最新楼层

西安电子科技大学大数据开发工程师

bitmap那部份有详细的解释嘛，求

点赞回复分享

发布于 2023-08-25 11:50 陕西

牛客823482698号

门头沟学院大数据开发工程师

微众的数据开发和数据仓库有什么区别啊

点赞回复分享

发布于 2023-09-23 13:11 湖北

02-14 14:14

OPPO_运营管理_HR

oppo 2025校招补录

已经在准备面试了!大家注意时间2月6日起笔试，还有意向的同学尽快投递，不要错过笔试机会，没有offer的抓紧再试一试！最早 2月中旬可拿 offer面向对象：2025届全球应届本科生与硕士研究生招聘岗位：AI/算法类、标准研究类、软件类、硬件类、产品类、设计类、工程技术类、销售服务类、品牌策划类、采购类、综合职能类（每人最多可投递2个岗位）工作城市：东莞、深圳、成都、上海、北京、西安、南京、重庆专属内推码：X7206892网申网址：https://careers.oppo.com/university/oppo/campus/post?shareId=7324投递时，填我的推荐码：X72068...

投递OPPO等公司9个岗位 >

点赞评论收藏

分享

02-10 15:01

西安交通工程学院营销

欧莱雅管理培训生一面面经

参加过欧莱雅管理培训生的一面，整个面试大概持续了 2 小时，以下是面试经验，希望可以帮到大家~📍面试公司：欧莱雅（中国）💻岗位：管理培训生🕐面试时长：约 2 小时❓面试问题：1、请进行 1 分钟的自我介绍。2、在快消行业中，你认为成功的产品具备哪些关键要素？3、小组讨论一个给定的案例，谈谈你对案例中问题的看法及解决方案。4、在小组讨论中，如何确保讨论既高效又能保证完整性？5、如果由你来做 Presentation，你会重点突出哪些内容？6、在团队合作里，怎样发挥自己的优势来促进团队协作？7、对于欧莱雅品牌，你有哪些了解？8、假设你负责一个新的产品推广项目，你会如何开展工作？

查看8道真题和解析

点赞评论收藏

分享

01-21 21:05

郑州轻工业大学 Java

#26届日常实习#  #简历被挂麻了，求建议# 投简历一直挂 没有面试 实习经历还是小厂无面试 工作基本混日子 求拷打

采集想要offer：感觉很厉害了，这都找不到吗

简历被挂麻了，求建议

点赞评论收藏

分享

02-14 23:51

已编辑

广东工业大学 Java

26实习简历求拷打

boss沟通30+只发了2份简历，大厂实习也不敢投。感觉寒假摆没了引流：#没有实习经历，还有机会进大厂吗# #那些拿到大厂offer的简历长啥样# #简历中的项目经历要怎么写# #你的简历改到第几版了# #你已经投递多少份简历了# #听劝，我这个简历该怎么改？#

没有实习经历，还有机会进大厂吗那些拿到大厂offer的简历长啥样

点赞评论收藏

分享

02-14 10:59

门头沟学院网络安全

春招 oppo信息安全工程师一面凉经

面试官一进会议室就先来了个自我介绍再开始面试，感觉非常nice，而且面试过程中语气也是比较轻松愉快，面试体验不错。面试内容主要是跟着简历问，深挖在简历项目中干了什么，中间穿插问校内学习。漏洞方面主要问了sql和csrf，问的比较简单，没有拷问。另外还问了个cookie和session的区别。最后反问岗位职责，说是属于信息安全部，主要负责集团内部的信息安全。整体下来自我感觉良好，问的问题基本都答上来了，没感觉有什么答得特别不好的地方，跟面试官聊的也算可以。不过第二天就给挂了。timeline:2.7 性格测评2.8 笔试2.13 一面2.14 一面挂进度过的很快，不知道是不是kpi面了...不过...

查看6道真题和解析

点赞评论收藏

分享

评论

5

46

招聘动态

26届实习生双选会报名开启

26届实习软件笔试必刷题单

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 大疆今年的机械笔试难吗？ #

34460次浏览 405人参与

# 影石Insta360求职进展汇总 #

105904次浏览 936人参与

# 文科生还参加今年的春招吗 #

1704次浏览 20人参与

# 大疆的机械笔试比去年难吗 #

63327次浏览 575人参与

# 选择和努力，哪个更重要？ #

36456次浏览 394人参与

# 24届市场营销薪资爆料 #

9009次浏览 62人参与

# 一人推荐一个值得去的通信/硬件公司 #

160246次浏览 1729人参与

# 如果公司降薪，你会跳槽吗？ #

42578次浏览 321人参与

# 提前批的机械人，你们都有面试了吗 #

86149次浏览 929人参与

# 产品实习，你更倾向大公司or小公司 #

128707次浏览 1710人参与

# 产品薪资爆料 #

96696次浏览 814人参与

# 春招启动，你开始投递了吗？ #

45141次浏览 434人参与

# 秋招前后对offer的期望对比 #

221619次浏览 1648人参与

# 大学四年该怎么过，才不算浪费时间？ #

3314次浏览 32人参与

# 华为工作体验 #

149646次浏览 1052人参与

# 职场上哪些事情令人讨厌 #

12711次浏览 57人参与

# 机械人，你的第一份感谢信是谁给的 #

19863次浏览 257人参与

# 和牛牛一起刷真题 #

104922次浏览 2067人参与

# 你觉得机械有必要实习吗 #

33535次浏览 318人参与

# 2022毕业的你对23届的寄语 #

35060次浏览 533人参与

牛客网
牛客企业服务