数分菜鸡在这里

2023-03-09 21:44 同济大学供应链管理发布于台湾

关注

凉经 24届 tx 软件开发-数据工程

摘要

数据工程的全流程（数仓建设-数据接入-数据运维-数据分析-数据挖掘）的各个阶段都有涉及...

自我介绍，问了我在百度和蔚来做的工作（数仓），对简历项目中对数据倾斜的发现、解决方法和效果
回答是通过sparkUi中task的输入量和运行时间发现，解决方法是用count估算不同维度下各value的数据条目，然后数量最多的top key进行再赋值后与其他表join
感觉这个地方可以从spark运行机制上讲数据倾斜造成的后果，以及面试官特别在意选取选取多少纬度值进行打乱的逻辑...难道是28原则？
继续追问数据分层的原因，ods dws dwd的区别（概念还是不清晰）

2. 解释xgboost、SVM、LR的模型原理以及区别

我就支支吾吾答出来SVM和LR的大致思想，面试官追问我看在简历上写用过机器学习包，让我解释随机森林作为分类模型优点和缺点（没答出来缺点）

3. 写出二叉树的数据结构，递归调用这类（我当然是不会....)

4. 用任意语言写出寻找数组最大自增队列的长度（指出我重复扫描的问题）

5. SQL题，a表和b表都有key和value，用b表中相同key的value替换a表，我以为是查询，就写了coalesce函数，谁知道要求的是update.....（这是个什么部门）

6. 继续深挖项目，看我做过国网的项目，问我用到的PCA是怎么降为的（说出计算过程）

7. 做没做过竞赛（我没敢说我参加过数模）

8. 是否了解推荐模型、NLP等（我把nlp了解的一些模型说了一下）

9. 什么时候和百度这边的实习结束，顺便问我是哪里人....我就说3月底就结束了，很快就可以投入到下一份实习，而且可以因为发完小论文了，可以全心投入实习

10. 问答环节，我问这个部门主要做什么，答案基本也是全栈，最终产出是产出label和特征，顺便问了下部门的hc，也是很坦诚说在收缩。最后问面试官如何看待chatgpt对于数分行业潜在的冲击，面试官说chatgpt目前更多的是nlp技术的发展，且数分最重要的是业务经验，反倒是可以辅助工作

面经也结束了，其实还是自己太菜了，只满足当sqlboy，结果人家完全不问，就尴尬了hh，但是奇怪的是全程没问任何业务问题....?

希望这份面经可以帮助到下一个面试的人。

#数据人的面试交流地#

全部评论

推荐最新楼层

少说话多清兵

北京信息科技大学前端工程师

反手就是一键三连

点赞回复分享

发布于 2023-03-11 13:30 山东

补兵注意细节

东华大学前端工程师

多谢大佬的分享！！狠狠有用！

点赞回复分享

发布于 2023-03-11 13:33 上海

24届想毕业选手

门头沟学院投融资

真难呀

点赞回复分享

发布于 2023-03-13 23:44 上海

门头沟学院数据分析师

我天，什么数据全栈岗

点赞回复分享

发布于 2023-03-16 12:17 美国

爱吃烤肠的杰尼龟加麻加辣

门头沟学院数据分析师

可以请问下是哪个部门吗

点赞回复分享

发布于 2023-03-18 05:57 荷兰

11-16 14:29

已编辑

中南大学 Java

互联网厂战力排行榜讨论

随着越来越多的互联网厂开奖了，我感觉秋招各家开奖和玩二次元游戏一样，前列的那一批玩家有种数值膨胀的美。本贴旨在讨论当前互联网各厂的实力强度，参考因素有：企业规模；盈利能力；未来发展；福利待遇；工作强度；下面是我在网上搜集的一些关于互联网厂排行榜，特此声明：本人不生产史，我只是史的搬运工。如果你质疑下面的排行榜，欢迎评论区发表你的个人见解。

Astraia：我的网易明明是第一梯队

牛客创作赏金赛互联网没坑了，还能去哪里？

点赞评论收藏

分享

11-12 13:54

全志科技_产品经理(准入职员工)

全志科技内推全志科技面经

全志一面（技术面）面试时间：30分钟左右面试形式：视频面试1、让我自我介绍2、问我成绩，为啥研究成绩一般了？3、讲项目4、讲项目难点5、问了我一个跨时钟域的问题，100M时钟跨越到5M时钟，数据流，使用fifo，这样在5M时钟域会不会是duobit同时变化？格雷码的作用？6、问我静态时序分析？如果setup违例了应该怎么做？除了优化关键路径外?还可以怎么做？7、低功耗设计？设计人员可以做的低功耗设计本质上是尽量降低时钟频率的翻转。2、问了一个题，关于定点数加法的问题。全志二面（HR面）面试时间：18分钟左右面试形式：视频面试1、自我介绍2、怎么选一个公司3、你手头有什么公司的offer，4、你...

点赞评论收藏

分享

10-25 11:03

上海理工大学 Python

孩子主打一个听劝简历怎么改呀

0offer 帮帮孩子吧 我这种屌丝双非也想找个班上 

拉丁是我干掉的：把上海理工大学改成北京理工大学。成功率增加200%

点赞评论收藏

分享

09-23 06:40

携程_移动安全研发

活这么大第一次见到9k这么多吧

周述安：这都能聊这么多。别人要是骂我，我就会说你怎么骂人？他要是继续骂我，我就把评论删了。

点赞评论收藏

分享

11-15 00:59

兰州大学 Python

在这个秋招季，我的进展真是让人感到无奈

经历了那么多HR面试，却只有两个意向，心里难免有些失落。感觉各个部门的反馈也都慢得令人着急。比如，联想的二面后至今没收到感谢信，我还在心存幻想地等待。快手的录用评估也拖了一个月，听说是主站部门。拼多多的HR面试后也得等到11月才能出结果。虽然贝壳已经有了意向，但我还是希望能有更多的好消息。

牛客创作赏金赛

点赞评论收藏

分享

13 38 评论

招聘动态

杉川机器人

2025校园招聘

字节跳动

2025校园招聘

字节跳动Data

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 25届秋招总结 #

241885次浏览 1975人参与

# 学历or实习经历，哪个更重要 #

40443次浏览 294人参与

# 北方华创开奖 #

22428次浏览 256人参与

# 地方国企笔面经互助 #

2460次浏览 6人参与

# 你最想要的公司福利是？ #

39090次浏览 108人参与

# 选完offer后，你后悔学本专业吗 #

9523次浏览 71人参与

# 面试题刺客退退退 #

136619次浏览 2087人参与

# 应届生被毁约被毁意向了怎么办 #

26436次浏览 236人参与

# 查收我的offer竞争力报告 #

16182次浏览 220人参与

# 机械应届生薪资要多少才合适？ #

12315次浏览 59人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2741次浏览 32人参与

# 没有实习经历，还有机会进大厂吗 #

804516次浏览 13805人参与

# 你觉得第一学历对求职有影响吗？ #

14797次浏览 121人参与

# 我的工作日记 #

21001次浏览 270人参与

# 不给转正的实习，你还去吗 #

1515931次浏览 16962人参与

# 寒假躺平还是提前实习 #

57951次浏览 429人参与

# 总结:哪家公司面试体验感最差 #

25384次浏览 128人参与

# 秋招OC许愿 #

225942次浏览 1863人参与

# 秋招被确诊为…… #

53848次浏览 302人参与

# 如何写一份好简历 #

600663次浏览 8410人参与

# 今年形式下双非本找得到工作吗 #

43767次浏览 414人参与

牛客网
牛客企业服务