字节-懂车帝-数仓一二三面
最近boss上内推太多了,lz也投了几个,其中字节有反馈,问了问我想做哪方面工作,我说数据方面的吧,然后就给我推到了数据仓库岗位,具体过程如下
3.19一面:
1.自我介绍
这个东西准备一下可以让面试官觉得你对找实习很重视,我的自我介绍模板是,基本信息-学校项目总结(项目大体内容,目的,最终成果)-具体工作内容-用了哪些技术栈学到了什么东西-实习经历-实习内容
2.具体实习内容介绍
这个地方问了好多东西,真的是深挖,可能是学校项目和他们业务没啥关系,一点都没问
3.对hive的理解,hive与mysql的不同之处
4.数据库和数据仓库的区别
5.mysql数据如何同步到hive里面
6.增量提取和全量提取
7.业务库同步到hive是怎么实现的,redis是怎么实现的(没用过redis很惭愧)
8.三道sql题
- 行转列考察case when语句
- 每个uid发布的前三篇文章,考察窗口函数,用row_number()解决
- 两个表求次日留存率
9.left join,right join和full join的区别
10.udf了解吗(不了解-_-)
11.数仓建模分层有了解吗,是否了解维度建模
12.数据库三范式
13.冒泡排序(就这我都能写成选择排序,算法题真的需要啊!!)
大体就问了这些内容吧,字节面试是在牛客上面试的,用的浏览器最好是谷歌浏览器,否则可能打不开,面试界面左半部是牛客的答题环境,右上角是面试官的视频界面,面试官出题你这里会有显示,然后当场作答,你写的每一个字母他都能看到,包括一些编程习惯什么的都是可以看出来的。
面了40分钟左右,过了两个小时hr小姐姐给我打电话说我通过一面了问什么时候可以约二面,然而当时我已经在回老家的火车上了。。后来就是约在了3.22下午两点也就是刚刚进行了二面。
3.22二面
1.自我介绍
2.实习内容介绍
3.hive底层调度
4.left join在mapreduce框架里有什么执行过程
5.shuffer是什么过程,什么情况下会造成shuffer,我们希望有这个过程吗
6.依然是自定义函数,我依然没有用过。。
7.常用的排序窗口函数有哪几个(这个我知道啊啊啊啊!!但是没答出来暴风哭泣)
- Dense_rank() 重复连续,可能排名情况11234
- Rank()重复不连续,排名情况11345
- Row_number()按顺序排12345
8.用没用过spark
9.spark和hive的区别
10.hive跑spark和mapreduce的区别是什么(这里面试官已经在叹气了!!!)
11.数据建模方式
12.建设表的方法论
13.依然是对数据仓库的理解,为什么要对数据仓库进行分层
14.给了我一个业务场景,比如头条的数据为例,一天10t数据,给了我半年的数据,我该怎么去维护这个数据,最后如果上级要一些指标,比如某一天的爆款文章,如何快速高效的提取这个指标
这个我开始不太理解维护的意思,后来面试官会不断换问法来诱导你,这个最后答得就是我先对这些数据进行不同维度不同粒度的聚合,比如每一个点击数据看天计算数量,从文章维度聚合,从用户维度聚合之类的,最后的数据量肯定是越聚合越少的,感觉这个题应该答的是面试官想要的那种,面试官给了正面的反馈
15.一道sql题,给了两个表,有用户id和日期以及level属性,如何在不用join的前提下计算第二天相对第一天level上升的用户数
最后反问环节我有问这个该怎么弄,面试官说用自定义函数,,我前面明明说了我不会自定义函数(-_-)
16.学校工作怎么样,实习时长,
17.反问环节
时长半小时,感觉答得一塌糊涂吧,吭哧吭哧的就是菜,听说一共三次技术面,面完赶紧复盘写个面经攒一波运气,一定要过啊啊啊啊
-------------------3.23---------------------
感谢牛客!欧气十足!!刚刚hr通知我可以三面了哈哈哈,面完更新三面面经
-------------------3.24---------------------
三面结束我又来祈福了,三面谈了30分钟,其中面试官迟到了10分钟,中间是hr小姐姐和我连线(小姐姐真漂亮),所以4:40结束面试。接下来开始吐槽
哇这个面试官根本不按套路出牌啊,我背了半天的自我介绍根本没用上,上来直接问我实习内容,一二面里面各种各样的问题一个都没问,虽然我也不一定会但你不应该考考么!!都不给我展露真诚的机会!项目差不多问了五分钟,然后就开始做题!!
先问我会不会其他业务,会不会写留存,我说我一面写过了,然后就开始出其他题,这个题很明显是面试官现编的呀!!我就看左边那个出题框一直往外蹦字!!啥也不说,上题!
- 源表detail(device_id,event,time)
每个设备按照时间正序的前三个事件
device_id,event1,event2,event3
原题啊兄弟们!!么得别的信息了,开始没认真审题,觉得和一面的第二道题差不多,就继续用了row_number结合了case when,然后面试官问我你这个每个device_id返回了几行数据,最后他要的其实是一个设备保留一行数据,我也没想到什么好办法,就分了三个子表做了个表连接,应该是满足需求的,但是也不知道面试官满不满意。。对了,我做题过程中面试官把麦关了和隔壁聊天去了(-_-) 第二题是问了我一个场景,就是有两个文件,文件里面是手机号,放不进内存里面,问如何判断两个文件里哪些手机号是相同的。这个问题最大的问题是任何一个文件都放不进内存中,所以我答了把文件拆分他就问我怎么拆分,按什么逻辑拆分,因为放不进内存嘛,那我手动拆行不行!!!哎,我这个算法基础太薄弱了也没接触过这些工作,反正这个到最后也没答出来,最后再问问我每周实习几天就没了!!没有反问环节,就说后续等hr联系吧,行看我吐了这么多大家也能看出来基本是凉了,如果没凉!!那就说明他们真的缺人大家赶紧投啊!!!
虽然表现不好,但是祈求三面通过呀
-------------------3.25---------------------
我三面过了呀!!!晚上七点hr面,感谢牛客!!冲冲冲 再更新一下hr面吧,这次忘记了录音,很多问题想不起来了,想到哪写到哪吧,对了,这次面试的hr就是三面那个连线的漂亮小姐姐
- 自我介绍
- 职业规划(读博or工作)
- 经过前面的面试对自己即将工作的内容有没有了解
- 如何看待数仓的分层建模,有什么好处
- 如果因为工作需要你换一种编程语言会换吗
- 工作学习中遇到的问题,自己是怎么解决的
- 实习时间
- 问我什么时候能到岗,我说我现在这边还需要离职审批,暂时给我mark的是4.7,然后说了大小周和薪酬待遇,说后面会有hr加我微信,到现在还没人加我,哇好担心hr面给我挂了
- 再许愿一波,牛客可太灵了,从一面许愿到hr面哈哈
-------------------4.5---------------------
这篇帖子的最后一次更新,之前商量好入职后,我的内推人随口问了我一句是全日制么,这句话问出来我就明白字节应该是对非全有要求的,果不其然,他说要和hr反馈一下,两天后也就是三月底给了我消息说因为我是非全没办法招聘了,这几天也在忙着投其他公司没来得及更新,虽然很遗憾没有去到字节实习,但是这次面试经历确实还是能够让我学到很多的,hr也说会给我的面试记录写的好一些,写明为什么最后没有要我,并告诉我虽然实习不可以,但是秋招春招是可以按照应届生去招聘的,也算是不幸中的万幸吧,之后各公司开始投递实习简历,通过同学内推在4.2晚上七点面了滴滴自动驾驶部门的数据分析岗,相比字节的面试确实简单了很多,也只有一面,面试官当场表示可以给我实习offer,面试结束后十分钟hr打电话和我约定13号入职,说起来 因为lz是自动驾驶专业,去年11月份面搜狗之前面的就是这个部门,而且是同一个面试官,而且当时也要我了,但是滴滴当时拖了一周才给我答复,导致我第一天刚答应搜狗第二天滴滴就有消息了,没办法只好拒绝了他,没想到啊,时隔五个月,同样的配方,同样的味道,我又回来了,当初狠心拒绝了滴滴,现在哭着喊着要滴滴留下我,哎我说那个命运呐,对了,面试官说部门hc还是挺充足的,但不保证一定得到,无论如何答应了滴滴就意味着放弃了已经到手的搜狗hc,无论好坏都是自己的选择,出来后确实发现非全的就业比想象中还要严峻,不仅是字节,之前加了京东面试官的微信商量面试时也因为非全而取消了面试,目前我所知道的信息中, 对非全实习没要求的公司:
- 百度
- 滴滴
- 华为
- momenta
- 旷视
- 搜狗
- 美团
对非全实习有要去的公司
- 腾讯
- 京东
- 字节
如有更多的欢迎大家补充