商汤 AI先锋计划 一面面经

拷打项目30min,拷打力度较大,对预训练数据挖掘,增强部分比较感兴趣。

八股问了LN和BN,BPE,GQA,前两个都回答的不好,第一个回答1. NLP任务中不同batch的同一特征不具有统计分布,2. batch数量不够大,3. LN让词向量分布约束在一维高斯球内让参数更加稳定。面试官觉得不触及本质,第二个太久没看答错了,第三个倒是没什么问题。

编程:给了一堆邮件地址,需要把账户名带*.的去掉标点,带+的分割成两个账户,最后统计一共有几个不同的账户。

比如x.**********, x**********, x+**********就是三个不同的账户x********** ********** **********

非常简单。

总共就面了60min,感觉可能不是kpi面,面试官对数据这块挺关注的。之前看了网上各种佬的面经被吓到了,疯狂去看各种外推,分布式,并行,量化,vllm,megatron这些技术。

但可能是我简历上体现的能力一般,或者一面一般都比较轻松,就目前面过的场次来看,问的问题意外的很基础。但看了太多乱七八糟的简单的倒反而忘了,基础还是不能松呀。

------------------------------------------------------------
一面已过!

#秋招##商汤##大模型#
全部评论
恭喜
1 回复 分享
发布于 08-16 22:43 黑龙江
感谢分享
1 回复 分享
发布于 08-16 23:47 黑龙江
佬一面多久约的二面啊
点赞 回复 分享
发布于 09-04 15:09 上海

相关推荐

7 14 评论
分享
牛客网
牛客企业服务