商汤 AI先锋计划 一面面经
拷打项目30min,拷打力度较大,对预训练数据挖掘,增强部分比较感兴趣。
八股问了LN和BN,BPE,GQA,前两个都回答的不好,第一个回答1. NLP任务中不同batch的同一特征不具有统计分布,2. batch数量不够大,3. LN让词向量分布约束在一维高斯球内让参数更加稳定。面试官觉得不触及本质,第二个太久没看答错了,第三个倒是没什么问题。
编程:给了一堆邮件地址,需要把账户名带*.的去掉标点,带+的分割成两个账户,最后统计一共有几个不同的账户。
比如x.**********, x**********, x+**********就是三个不同的账户x********** ********** **********
非常简单。
总共就面了60min,感觉可能不是kpi面,面试官对数据这块挺关注的。之前看了网上各种佬的面经被吓到了,疯狂去看各种外推,分布式,并行,量化,vllm,megatron这些技术。
但可能是我简历上体现的能力一般,或者一面一般都比较轻松,就目前面过的场次来看,问的问题意外的很基础。但看了太多乱七八糟的简单的倒反而忘了,基础还是不能松呀。
------------------------------------------------------------
一面已过!
#秋招##商汤##大模型#
八股问了LN和BN,BPE,GQA,前两个都回答的不好,第一个回答1. NLP任务中不同batch的同一特征不具有统计分布,2. batch数量不够大,3. LN让词向量分布约束在一维高斯球内让参数更加稳定。面试官觉得不触及本质,第二个太久没看答错了,第三个倒是没什么问题。
编程:给了一堆邮件地址,需要把账户名带*.的去掉标点,带+的分割成两个账户,最后统计一共有几个不同的账户。
比如x.**********, x**********, x+**********就是三个不同的账户x********** ********** **********
非常简单。
总共就面了60min,感觉可能不是kpi面,面试官对数据这块挺关注的。之前看了网上各种佬的面经被吓到了,疯狂去看各种外推,分布式,并行,量化,vllm,megatron这些技术。
但可能是我简历上体现的能力一般,或者一面一般都比较轻松,就目前面过的场次来看,问的问题意外的很基础。但看了太多乱七八糟的简单的倒反而忘了,基础还是不能松呀。
------------------------------------------------------------
一面已过!
#秋招##商汤##大模型#
全部评论
恭喜
感谢分享
佬一面多久约的二面啊
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享