Yohallo level
获赞
20
粉丝
16
关注
2
看过 TA
430
华东理工大学
2025
数据仓库
IP属地:上海
暂未填写个人简介
私信
关注
10-21 19:24
已编辑
华东理工大学 数据仓库
10月14号来短信通知约面10月16号业务初面面试官介绍部门和业务(跳过了我的自我介绍,让我直接讲业务)聊实习经历,业务背景,做了什么面试官简单问了几个问题问我知不知道有哪些其他搜索引擎,答不太了解然后让我自己讲讲实习过程有什么困难的东西他说不知道要问我什么 简单聊了几个八股截止此时大概30min手撕两道sql1.简单的转置,group by之后case when一下就好了2.连续日期计算连续时间跟开始结束时间,稍微复习一点,用row_numble进行一个分组,然后group by。两道sql耗时大概30min。第二道写了的比较久,然后还写错了,我自己进行了一个改正。反问,问了下技术栈,做实时还是做离线balabala------------------------------------------面完两天还没接到二面通知,应该是挂了他说不知道问我什么,我真有点无语项目,408,大数据八股那么多东西能问,为啥能问别人,不能拿来问我?两道sql也写出来了,还是寄了。------------------------------------------10月21号更新一:已经有人约二面了,还是在我之后一面的。复活赛失败。10月21号更新二:主动联系了hr,得知流程已结束,忘记发感谢信了。已举报面试官 #美团#  #阿里#  #腾讯#  #字节#  #你都收到了哪些公司的感谢信?#  #数据人的面试交流地#  #滴滴#  #京东#
0 点赞 评论 收藏
分享
09-29 16:20
已编辑
华东理工大学 数据仓库
一面经典的自我介绍我看你实习经历挺多的,你挑一个项目讲讲看吧?我希望听到的是背景,目的以及你做了什么balabala嗯嗯,这么看我了解你的业务背景了,那你觉得你项目的目的是什么呢?我:balabala,为了看a,b,这几个指标拆解之后是看这些内容,但是主要是为了什么呢?是不是为了提升用户的体验(面试官真的一步步引导)再说说你做了哪些表吧,涉及到哪些层?有哪些比较重要的指标。balabala所以你怎么理解这些内容之间的关系呢?你觉得为什么要存在ads这一层?不能直接从dws取数据吗?看你有说到这个cdm覆盖率跟ods穿透率,这两个指标是什么意思?那你讲讲你认为各层的作用?什么情况下中间层是可以不要的?有做过数据治理的内容吗?都写过什么DQC?UDF写过吗?举个例子sql写的怎么样?开窗熟悉吗?举几个例子反问:问了下负责的业务,有哪些数据二面经典自我介绍 被打断我比较关心你在饿了么的实习,你讲下这个吧我balabala讲了下我负责的业务系统,然后接触了哪两块的数据所以可以理解的是,你在这三个环节里,负责第一个跟第三个是吗?那你讲讲第一个都有些什么内容好的,我了解了,感觉第三个环节更为复杂,你聊聊这个?balabala所以你一共是建了三张表是吧?那这些涉及到哪些层呢?你们的需求都是直接来自产运团队吗?项目看中些什么呢?工作会考虑北方吗?有做过数据治理的内容吗?你怎么保证时效性跟准确性这些的?手撕:连续一小时在线男用户人数,急了没撕出来。想到最后准备写60个lag(),面试官就让我写成在线人数就好。你有了解hive跟spark吗?一个sql任务会有多少次shuffle?我:取决于map跟reduce的数量?有做过数据倾斜的处理吗?打散大键大小表这种呢?mapjoin广播小表小文件呢?我:预聚合。追问除了预聚合呢?我:不太记得。面试官:可以调整块大小,我:哦block,对不起有点忘了。反问三面经典自我介绍看你不是大数据这个方向的,怎么想了做这个?balabala挑一个你实习期间比较难的问题讲讲吧?你是怎么思考的?怎么沉淀的?怎么学习新东西的?大部分都是些场景题和一些发散的问题,没有专业知识的拷打。反问:没什么问题,一面二面都问过了。--------timeline---------------------9.23 5点10开始一面 38分钟左右结束了,10分钟约了二面9.23 6点30开始二面 7点10的样子结束的,就问了20分钟吧9.24下午约三面 9.25晚7点三面 6点58开始的,面了45分钟9.29检查官网 三面已挂#秋招# #面经##数据开发##滴滴#
0 点赞 评论 收藏
分享
09-13 19:42
已编辑
华东理工大学 数据仓库
查看10道真题和解析
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务