2022-11-16 10:54 门头沟学院大数据开发工程师发布于广东

关注

2023秋招—数据开发面经—美的

线下群面：

五分钟读题，然后每人简单自我介绍+说出对题目的答案，然后讨论20分钟，最后5分钟派一个人总结。

题目：（2选1）

1、如何构建数据中台？

2、设计一个智能家居，应该有哪些功能？用什么技术实现这些功能？

测评：

性格测试+图形推理+资料分析

二面：

1、自我介绍

2、详细介绍一下项目

3、实习的数据框架和项目的数据框架有什么区别吗？

4、数据采集还了解其他工具或架构吗？

5、数据加工处理还了解其他工具或架构吗？

6、数据对外提供服务还了解哪些工具？

7、介绍一下实习中大数据开发的流程和规范

8、编译原理、数据库原理有了解过吗

9、做题，说思路就好：（不用借助其他平台，想思路就好）

上百T数据，里面有手机号，有5台机器，找出手机号出现频率最高的10个。

自己的思路：将数据分为5份，让每一台数据处理一份，分别对数据进行排序，取出出现频率前10的手机号，最后把5台机器的结果汇总起来再进行排序，取出前10频率的手机号。

面试官：那每台机器怎么取出频率最高的10个手机号？

我：HashMap存储处理过的数据，key存放手机号，value存放出现次数，然后用小顶堆存放HashMap的数据，取10次堆顶的数据。

面试官：每台机器取前10，加起来再取前10，但每天机器的前10不一定是准确的，即可能出现同一个手机号出现在不同的机器，怎么处理？（一开始理解错了问题）

我：扩大前几的范围，前20、前50

面试官：这个方法不解决问题，参考MR的计算原理，借鉴一下有没办法解决？

我：（根据MR处理数据的流程说了一遍）

面试官：了解Shuffle吗？

我：了解，数据分区......

面试官：对，就是Hash分区，先让相同的手机号放到同一个机器上，后面那套就通了，这个手机号就是这台机器的前10。

大数据——海量数据处理的基本方法总结：

https://blog.csdn.net/hong2511/article/details/80842704

（数据进行Hash分区，分为5个文件，分别发给5台机器处理。每台机器用HashMap统计词频，然后用第一个文件建立一个小顶堆，只存频率最高的10个，然后第二个文件继续存入小顶堆。最后小顶堆里存在的10个号码就是最高频的）

10、反问

部门规模：数据业务中心，200多人，负责所有的数据建设和管理

技术栈：需要用到什么就用什么，没有特定的技术栈，不限于某种技术

候选人特质：没有特别倾向，对基础能力的掌握情况，对做过东西的了解程度，不仅仅是完成，做完后对背后的东西有比较好的理解。

二面挂，个人分析是场景题没有做出来

#数据人的面试交流地##面经分享##大数据开发工程师面经##数据开发工程师面经##大数据开发面经#

个人面经 | 大数据开发文章被收录于专栏

主要记录个人在2023校招中的面试问题，欢迎订阅、收藏、评论、转发

全部评论

推荐最新楼层

04-12 19:30

电子科技大学 C++

KPI面十大特征

1.不开摄像头，或者不管你开不开（面完就白白，你也配看到我的帅脸？）2.提前面试（推迟面试倒无可厚非，面试官很忙。最逆天的就是提前，闲出屁来了又不想浪费时间，先把你的KPI刷了吧）3.态度轻蔑，语气不好，明显感觉不被尊重（你又不入职，我管你这那的）4.无自我介绍（简历我都懒得看）5.手撕出难题或者代码量大的题（水时长，如果你简历牛逼的话也不一定）6.讲完项目或八股不深入问或者浅浅问一下有什么难点（其实就是没听，让你说，自己不费力就完成KPI）7.技术面问别的，你看什么书等等（懒得想技术问题了，水时长）8.不让反问（把自己的位置摆的很高，只准我问你，不准你问我）9.时间过短（低于40min，特指...

抱抱碍事梨a：再加一条，面试约到晚上八点以后的这种，尤其是腾讯，最喜欢不打电话不声不响就给你约个晚上八点钟的面试，这种伯分之一伯是kpi

点赞评论收藏

04-15 13:12

University of Birmingham 产品经理

横向对比挂(꒦_꒦) 理想汽车产品经理实习生（面经）

【一面】自我介绍简历浅挖（重点问了一段产品实习）到岗时间和出勤情况时间很短，只有15min左右，快到以为自己当场挂了。【二面】产品总监自我介绍简历深挖（重点问了两段实习）基础机器学习算法假设刚来实习，你会做哪些动作来快速上手业务？之前实习的收获和思考？觉得自己有什么优点和缺点？自己认为在产品方面有什么不足？职业规划是什么？闲聊：兴趣爱好有哪些？公众号做些什么？最近在看什么书？去实习通勤怎么办？聊得还是不错的，体验感尚可，面试官也乐呵呵的。最后跟我说同时有好几个候选人，要横向对比才能通知结果。等待一周后横向对比挂。比较无语的是等了好几天后去问进度，面试官回复后刚想客气感谢一下，结果已经把我删了[...

查看13道真题和解析 Fourier同学的产品... 产品面经

点赞评论收藏

03-27 19:29

厦门大学 Java

发了四五家公司简历过不了，求指导

点赞评论收藏

04-10 23:54

中国人民解放军国防科技大学 C++

tx这个一直这样是啥意思不理解

是面试官没时间提交面评吗

点赞评论收藏

04-15 12:57

已编辑

西安电子科技大学 Java

更新一下二面吧

本来上周五面完二面反问阶段面试官说基础不太扎实，心态已经崩了，今天又收到了3面通知。遂打算写一写二面面经自我介绍2min项目相关你的RPC调用的流程是什么样子的?消费者-> 注册中心 -> 更新本地缓存 -> 与提供者建立连接 -> 序列化请求(参数，方法名等等) -> 服务端解析协议 -> 执行本地方法 -> 序列化结果返回。 你说利用Vertx实现了异步的网络通信来提升性能，怎么提升的？答了是Vertx本身实现了异步网络通信，简要说了说异步和同步的性能区别。你实现的多个序列化方式JDK，JSON，HESSION，Kyro有什么区别？JDK原生性能差...

查看14道真题和解析

点赞评论收藏

招聘动态

招商银行信用卡

2026届暑期极客训练营招募进行中

汇丰科技中国

25届校招+26届实习

滴滴

2026届秋招储备实习生招聘

理想汽车

2025春季校园招聘

招商银行数字金融训练营

火热报名中

携程集团

25届校招+26届实习

字节跳动Tik Tok

26届实习招聘

字节跳动

25届补录&26届实习

快手

25届补录+26届实习

招商银行信用卡

2026届暑期极客训练营招募进行中

全站热榜

拼多多信息确认

热聊中

创作者周榜

正在热议

# 你的头发还好吗？一起爆改美发黑科技！ #