数分菜鸡在这里

2023-03-09 21:44 同济大学供应链管理发布于台湾

关注

凉经 24届 tx 软件开发-数据工程

摘要

数据工程的全流程（数仓建设-数据接入-数据运维-数据分析-数据挖掘）的各个阶段都有涉及...

自我介绍，问了我在百度和蔚来做的工作（数仓），对简历项目中对数据倾斜的发现、解决方法和效果
回答是通过sparkUi中task的输入量和运行时间发现，解决方法是用count估算不同维度下各value的数据条目，然后数量最多的top key进行再赋值后与其他表join
感觉这个地方可以从spark运行机制上讲数据倾斜造成的后果，以及面试官特别在意选取选取多少纬度值进行打乱的逻辑...难道是28原则？
继续追问数据分层的原因，ods dws dwd的区别（概念还是不清晰）

2. 解释xgboost、SVM、LR的模型原理以及区别

我就支支吾吾答出来SVM和LR的大致思想，面试官追问我看在简历上写用过机器学习包，让我解释随机森林作为分类模型优点和缺点（没答出来缺点）

3. 写出二叉树的数据结构，递归调用这类（我当然是不会....)

4. 用任意语言写出寻找数组最大自增队列的长度（指出我重复扫描的问题）

5. SQL题，a表和b表都有key和value，用b表中相同key的value替换a表，我以为是查询，就写了coalesce函数，谁知道要求的是update.....（这是个什么部门）

6. 继续深挖项目，看我做过国网的项目，问我用到的PCA是怎么降为的（说出计算过程）

7. 做没做过竞赛（我没敢说我参加过数模）

8. 是否了解推荐模型、NLP等（我把nlp了解的一些模型说了一下）

9. 什么时候和百度这边的实习结束，顺便问我是哪里人....我就说3月底就结束了，很快就可以投入到下一份实习，而且可以因为发完小论文了，可以全心投入实习

10. 问答环节，我问这个部门主要做什么，答案基本也是全栈，最终产出是产出label和特征，顺便问了下部门的hc，也是很坦诚说在收缩。最后问面试官如何看待chatgpt对于数分行业潜在的冲击，面试官说chatgpt目前更多的是nlp技术的发展，且数分最重要的是业务经验，反倒是可以辅助工作

面经也结束了，其实还是自己太菜了，只满足当sqlboy，结果人家完全不问，就尴尬了hh，但是奇怪的是全程没问任何业务问题....?

希望这份面经可以帮助到下一个面试的人。

#数据人的面试交流地#

全部评论

推荐最新楼层

少说话多清兵

北京信息科技大学前端工程师

反手就是一键三连

点赞回复分享

发布于 2023-03-11 13:30 山东

补兵注意细节

东华大学前端工程师

多谢大佬的分享！！狠狠有用！

点赞回复分享

发布于 2023-03-11 13:33 上海

24届想毕业选手

门头沟学院投融资

真难呀

点赞回复分享

发布于 2023-03-13 23:44 上海

门头沟学院数据分析师

我天，什么数据全栈岗

点赞回复分享

发布于 2023-03-16 12:17 美国

爱吃烤肠的杰尼龟加麻加辣

门头沟学院数据分析师

可以请问下是哪个部门吗

点赞回复分享

发布于 2023-03-18 05:57 荷兰

11-19 17:23

南京大学 Java

我面了很多次阿里系，加起来差不多四五十次了，只是暑期面的都过了，秋招面的都没过在我很小的时候，听到最多的词不是阿里巴巴，而是淘宝，是电商我们这一代人时间节点很独特，不懂事的时候由父母带着我们天南地北的乱逛线下实体店，稍微能记得事了，拿着充话费送的手机，开着3g网四处冲浪，你偶然发现中二的壁纸上面有一个叫做淘宝的图标，你不知道淘宝是什么，更不知道什么是app，你只知道手机上的图标是可以点开的，发现淘宝里面有很多商品，你想起来这种模式叫做电子商务，信息技术的老师刚刚讲过，你觉得网上数字都是虚假的，不安全的，没有握在手中的纸币有把握，但这个叫做淘宝的图标里面价格太便宜了，种类太多了，你没忍住诱惑第一...

007打工人：时错！佬！我觉得你应该要出书，我必买之

实习/秋招面经如果可以选，你最想去哪家公司实习与准备秋招该如何平衡

点赞评论收藏

分享

11-20 04:45

门头沟学院 C++

迟来的面经。。。因为直到今日我居然还没有面完。鹅厂的面试跨度有点大，以至于我甚至忘掉了相当多的部分，于是只能简单描述一下。一面：项目拷打，几乎没有八股，最后是一道算法题，写出来了，但是没写出最优的来。二面：项目拷打，无八股，无算法题。三面：项目拷打，然后是发散性题目，比如：“你对于XX领域（面试的岗位相关）怎么看的啊？”，“你以前是做A的，为什么想做B？这个gap你是怎么看的？”四面：自我介绍，然后是，“你刚刚提到你的一个观点XXX，你能具体描述一下吗？” 于是拿了自己经历过的两个项目来佐证；“现在有最新的研究尝试把机器学习替换掉某些关键的组件，比如XX，你了解过吗？” 正好之前了解过相关的内...

查看5道真题和解析

点赞评论收藏

分享

11-14 16:13

已编辑

重庆科技大学测试工程师

Amazarashi66：不进帖子我都知道🐮❤️网什么含金量

点赞评论收藏

分享

09-29 11:19

门头沟学院 Java

you can kill me，but you can't *******#拼多多##java##实习##算法#

逆流河上万仙退：只是给你个内推码

点赞评论收藏

分享

11-16 22:03

长春理工大学网页产品经理

秋招至今，我竟然连一个offer都没有！

我投了27份简历，经历了12次测评和笔试，11次一面和群面，6次二面，2次三面，结果大概率都是“养鱼”。唯一的offer我还拒了，真是自作自受。每次被挂都让我心情暴怒，我真的不知道现在该怎么办了。

怎么起名字：给你面试了说明你的简历学历没问题

牛客创作赏金赛

点赞评论收藏

分享

13 38 评论

招聘动态

字节跳动

2025校园招聘

杉川机器人

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 25届秋招总结 #

246913次浏览 2010人参与

# 学历or实习经历，哪个更重要 #

41007次浏览 298人参与

# 北方华创开奖 #

22745次浏览 257人参与

# 地方国企笔面经互助 #

2529次浏览 6人参与

# 你最想要的公司福利是？ #

39866次浏览 124人参与

# 选完offer后，你后悔学本专业吗 #

10309次浏览 75人参与

# 面试题刺客退退退 #

137051次浏览 2091人参与

# 国企/银行/研究所公司爆料 #

89683次浏览 412人参与

# 应届生被毁约被毁意向了怎么办 #

27045次浏览 238人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2876次浏览 35人参与

# 机械应届生薪资要多少才合适？ #

12376次浏览 60人参与

# 查收我的offer竞争力报告 #

16706次浏览 228人参与

# 校招入职后的感受 #

156882次浏览 1961人参与

# 你觉得第一学历对求职有影响吗？ #

14875次浏览 121人参与

# 没有实习经历，还有机会进大厂吗 #

804939次浏览 13813人参与

# 我的工作日记 #

21148次浏览 270人参与

# 不给转正的实习，你还去吗 #

1516739次浏览 16964人参与

# 寒假躺平还是提前实习 #

58392次浏览 438人参与

# 总结:哪家公司面试体验感最差 #

25703次浏览 129人参与

# 秋招OC许愿 #

226453次浏览 1869人参与

# 如何写一份好简历 #

601971次浏览 8439人参与

牛客网
牛客企业服务