字节筋斗云机器学习工程师二面
很奇怪, 这种完全不匹配,还能过我到二面。。。
这个组做推荐业务的,也不设计大模型推荐,。。。所以感觉面试官也不知道问我啥
1.自我介绍
2.针对一个项目介绍
3.你觉得怎么写 prompt 是比较好的 prompt?
4.如果你需要生成一个广告或者摘要, 你怎么做让模型的字数尽可能少?
5.为什么你们的业务要用这个基座不用那个?
6.你用过那么多大模型,他们有啥区别?(就从激活函数 NORM prefixLM casualLM transformer 位置编码讲)
7. 你觉得先 NORM 和后 NORM 有啥优劣?
8. MHA 的计算时间复杂度是多少?和 FFN 哪个复杂度更高(感觉好像不太好直接比较啊)
手撕 MHA(其实我都没写好,面前看过代码,但是接口记不住,就随便写了个样子)
没写完呢就说可以了,面试官也没看
然后问:大模型训练常见的 loss 有哪些,写一下公司(写了交叉熵 KL 散度 PPO DPO 的 loss)
反问:你们推荐用到大模型吗?(目前还没有,业界主要还不用这个)
手撕 transformer mha
这个组做推荐业务的,也不设计大模型推荐,。。。所以感觉面试官也不知道问我啥
1.自我介绍
2.针对一个项目介绍
3.你觉得怎么写 prompt 是比较好的 prompt?
4.如果你需要生成一个广告或者摘要, 你怎么做让模型的字数尽可能少?
5.为什么你们的业务要用这个基座不用那个?
6.你用过那么多大模型,他们有啥区别?(就从激活函数 NORM prefixLM casualLM transformer 位置编码讲)
7. 你觉得先 NORM 和后 NORM 有啥优劣?
8. MHA 的计算时间复杂度是多少?和 FFN 哪个复杂度更高(感觉好像不太好直接比较啊)
手撕 MHA(其实我都没写好,面前看过代码,但是接口记不住,就随便写了个样子)
没写完呢就说可以了,面试官也没看
然后问:大模型训练常见的 loss 有哪些,写一下公司(写了交叉熵 KL 散度 PPO DPO 的 loss)
反问:你们推荐用到大模型吗?(目前还没有,业界主要还不用这个)
手撕 transformer mha
全部评论
北大佬啥方向都匹配
字节搜推技术太强了 换成llm不一定正向
纳尼,现在业界不用大模型做推荐吗?我看到很多公司都用大模型做embedding啊
兄弟二面没有手撕力扣吗
相关推荐
点赞 评论 收藏
分享
不期而遇的夏天:1.同学你面试评价不错,概率很大,请耐心等待;2.你的排名比较靠前,不要担心,耐心等待;3.问题不大,正在审批,不要着急签其他公司,等等我们!4.预计9月中下旬,安心过节;5.下周会有结果,请耐心等待下;6.可能国庆节前后,一有结果我马上通知你;7.预计10月中旬,再坚持一下;8.正在走流程,就这两天了;9.同学,结果我也不知道,你如果查到了也告诉我一声;10.同学你出线不明朗,建议签其他公司保底!11.同学你找了哪些公司,我也在找工作。
点赞 评论 收藏
分享