字节跳动 技术中台 NLP三面
【字节跳动 技术中台 NLP三面】
部门:抖音BU 技术中台
事件:技术面3面
时间:1h10min
内容:
-
面试题:
-
自我介绍,然后先写个题吧...;
-
写完题大概就用了50min了,简单问几个问题:word2vec(我说了两种训练方式及其loss,负采样加速的loss,估计在二面面评上看到我答得不够好所以我提前又看了一遍);
-
用没用过决策树,对剪枝有什么了解(答了后剪枝的几个名字和思想,回答了预剪枝和后剪枝的优缺点);
-
做没做过nlp分类,样本不均衡如何处理?(回答数据方面上下采样,其他方面可以借鉴focal loss);有没有真正做过超采样这种?(没有)
-
分类任务用没用过fasttext这种?(我没复习这个模型于是曲线回答:我说工作当中一般都会用fasttext和textcnn来做baseline,我自己只是学习过一些,实践中比如我这个比赛数据是xxx样的所以没有采用这几个短依赖的方法,因为我baseline是word2vec又做分类效果不好等等等等,后续用了什么方案解决了这个问题,就是没有正面回答)
-
过拟合遇到过吗?怎么解决的?(还是从数据和模型两方面回答,感觉还是看了二面面评来问的);提到了dropout,问dropout为什么可以解决过拟合(胡扯了一下)
-
目前应聘情况,为什么不留在实习的公司,你这留学生是算社招吧?(NO)为什么不投递BAT这些公司?(夸字节)
-
-
编程题:
-
第一题——31. 下一个排列,这个隐约记得是从后向前遍历找最大值,其他的忘记了,想了十分钟说要不换个题?
-
第二题:三数之和,这个练过N遍,但是写出来遇到了死循环,飞书不能debug死循环所以请求本地IDE写,同意了debug出来了;
-
第三题:久仰大名的字节思维题:10个耗子喝1000个瓶子中仅含一瓶的毒药水瓶,问如何找出来是哪个毒药?心中暗喜——然后开始表演,先把题目读一遍,然后拿出纸笔说我想想,比划一会儿想起来是怎么做的了,就说思路,面试官让写一写,我就写了二进制右移的操作当做死亡小鼠阵列翻译十进制编号的动作,面试官说理解了就过了。
-
-
反问:业务是不是给自己的所有产品提供中台技术?是。部门是属于哪个BU呢(抖音BU)
总结和体会:应该是最后一面吧,感觉题写得还可以,应该会过;看来字节三面,面面都有编程题呀,许愿offer吧;
提醒大家一定要查缺补漏,字节面试官挖掘简历和面评真的蛮深,感觉最后两面问问题都是泛泛的,估计是一面面评不够好,不过不管了,面字节就是个心中的执念,不然感觉作为算法码农经历不够完整,虽然还缺一个面小红书和面阿里哈哈,春招就此终结吧~
祝愿大家都能拿到offer都能拿到ssp是不现实的,所以我祝愿中国的人才市场和各行各业的行情经过低迷之后尽快恢复蓬勃,希望大家都有机会展示自己。
我也算是面试过互联网、通信、银行、新能源等各种行业的人了,如果大家求职过程中有对于简历面试、知识体系、行情发展等方面的问题,可以私聊问我,视问题难度为大家提供解答