2023-03-09 21:44 同济大学供应链管理发布于台湾

关注

凉经 24届 tx 软件开发-数据工程

摘要

数据工程的全流程（数仓建设-数据接入-数据运维-数据分析-数据挖掘）的各个阶段都有涉及...

自我介绍，问了我在百度和蔚来做的工作（数仓），对简历项目中对数据倾斜的发现、解决方法和效果
回答是通过sparkUi中task的输入量和运行时间发现，解决方法是用count估算不同维度下各value的数据条目，然后数量最多的top key进行再赋值后与其他表join
感觉这个地方可以从spark运行机制上讲数据倾斜造成的后果，以及面试官特别在意选取选取多少纬度值进行打乱的逻辑...难道是28原则？
继续追问数据分层的原因，ods dws dwd的区别（概念还是不清晰）

2. 解释xgboost、SVM、LR的模型原理以及区别

我就支支吾吾答出来SVM和LR的大致思想，面试官追问我看在简历上写用过机器学习包，让我解释随机森林作为分类模型优点和缺点（没答出来缺点）

3. 写出二叉树的数据结构，递归调用这类（我当然是不会....)

4. 用任意语言写出寻找数组最大自增队列的长度（指出我重复扫描的问题）

5. SQL题，a表和b表都有key和value，用b表中相同key的value替换a表，我以为是查询，就写了coalesce函数，谁知道要求的是update.....（这是个什么部门）

6. 继续深挖项目，看我做过国网的项目，问我用到的PCA是怎么降为的（说出计算过程）

7. 做没做过竞赛（我没敢说我参加过数模）

8. 是否了解推荐模型、NLP等（我把nlp了解的一些模型说了一下）

9. 什么时候和百度这边的实习结束，顺便问我是哪里人....我就说3月底就结束了，很快就可以投入到下一份实习，而且可以因为发完小论文了，可以全心投入实习

10. 问答环节，我问这个部门主要做什么，答案基本也是全栈，最终产出是产出label和特征，顺便问了下部门的hc，也是很坦诚说在收缩。最后问面试官如何看待chatgpt对于数分行业潜在的冲击，面试官说chatgpt目前更多的是nlp技术的发展，且数分最重要的是业务经验，反倒是可以辅助工作

面经也结束了，其实还是自己太菜了，只满足当sqlboy，结果人家完全不问，就尴尬了hh，但是奇怪的是全程没问任何业务问题....?

希望这份面经可以帮助到下一个面试的人。

#数据人的面试交流地#

全部评论

推荐最新楼层

少说话多清兵

北京信息科技大学前端工程师

反手就是一键三连

点赞回复分享

发布于 2023-03-11 13:30 山东

补兵注意细节

东华大学前端工程师

多谢大佬的分享！！狠狠有用！

点赞回复分享

发布于 2023-03-11 13:33 上海

24届想毕业选手

门头沟学院投融资

真难呀

点赞回复分享

发布于 2023-03-13 23:44 上海

Chi1111l

门头沟学院数据分析师

我天，什么数据全栈岗

点赞回复分享

发布于 2023-03-16 12:17 美国

爱吃烤肠的杰尼龟加麻加辣

门头沟学院数据分析师

可以请问下是哪个部门吗

点赞回复分享

发布于 2023-03-18 05:57 荷兰

11-21 04:39

南昌大学 Java

26届求助：老生常谈了，考研还是就业

26届211本，目前在准备就业，大一大二啥都没学，这学期大三开学才开始学，学的很差，但是通过学校找到了一家中厂下学期开学的实习（难度比普通自己找低很多）。刚开始没想过考研，不想读研卷学历，后来开始考虑，担心吃学历的亏。核心问题就是：我这种情况，工作三年和读研比哪个以后发展更好，或者差不多。看牛客上还是大部分是研究生能拿到很好的offer，但社招应该也不看牛客，不知道到底是什么情况，求求过来人帮帮我吧

scoxty：我大三上才开始系统学习的

开发本科够了，早准备早投递

投递牛客等公司10个岗位 > 如果能重来，就业or读研你选哪个？你会选择考研还是直接就业

点赞评论收藏

11-19 10:10

南京大学银行管培生

交通银行总行入职初体验

在大家都在卷，尤其是银行这块。说实话，刚开始的工作真的很琐碎。很多新同事的日常就是收发邮件，和忙但其实也不知道自己在忙啥。我运气不错，被安排做一些项目，成果还被采纳了。不过，流程真的是个大坑。为了合规，很多事情都得经过层层审批。领导、部门之间的来回真的浪费了好多时间。

交通银行工作强度 39人发布

点赞评论收藏

11-23 10:38

蚌埠坦克学院服装/纺织设计

华为待录用是啥意思

心急如焚问 hr 情况，hr 淡定回复说我待录用。咱也不知道华为这又臭又长的流程到底是个啥意思。万能的牛友可以出来科普一下流程吗😂。  #华为#   #华子oc时间线#   #华为开奖那些事#

沉淀一会：**圣经 1.同学你面试评价不错，概率很大，请耐心等待；2.你的排名比较靠前，不要担心，耐心等待；3.问题不大，正在审批，不要着急签其他公司，等等我们！4.预计9月中下旬，安心过节；5.下周会有结果，请耐心等待下；6.可能国庆节前后，一有结果我马上通知你；7.预计10月中旬，再坚持一下；8.正在走流程，就这两天了；9.同学，结果我也不知道，你如果查到了也告诉我一声；10.同学你出线不明朗，建议签其他公司保底！11.同学你找了哪些公司，我也在找工作。

华子oc时间线华为开奖那些事

点赞评论收藏