字节筋斗云机器学习工程师二面

很奇怪, 这种完全不匹配,还能过我到二面。。。
这个组做推荐业务的,也不设计大模型推荐,。。。所以感觉面试官也不知道问我啥
1.自我介绍
2.针对一个项目介绍
3.你觉得怎么写 prompt 是比较好的 prompt?
4.如果你需要生成一个广告或者摘要, 你怎么做让模型的字数尽可能少?
5.为什么你们的业务要用这个基座不用那个?
6.你用过那么多大模型,他们有啥区别?(就从激活函数 NORM prefixLM casualLM transformer 位置编码讲)
7. 你觉得先 NORM 和后 NORM 有啥优劣?
8. MHA 的计算时间复杂度是多少?和 FFN 哪个复杂度更高(感觉好像不太好直接比较啊)

手撕 MHA(其实我都没写好,面前看过代码,但是接口记不住,就随便写了个样子)
没写完呢就说可以了,面试官也没看
然后问:大模型训练常见的 loss 有哪些,写一下公司(写了交叉熵 KL 散度 PPO DPO 的 loss)

反问:你们推荐用到大模型吗?(目前还没有,业界主要还不用这个)

手撕 transformer mha
全部评论
北大佬啥方向都匹配
4 回复 分享
发布于 08-26 16:38 上海
字节搜推技术太强了 换成llm不一定正向
3 回复 分享
发布于 08-26 18:49 北京
纳尼,现在业界不用大模型做推荐吗?我看到很多公司都用大模型做embedding啊
点赞 回复 分享
发布于 08-26 17:44 山西
兄弟二面没有手撕力扣吗
点赞 回复 分享
发布于 08-29 11:39 四川

相关推荐

不愿透露姓名的神秘牛友
11-05 23:10
上海寻梦信息技术有限公司 Java工程师 30.0k*18.0
我要offerOOO:双休很重要啊
点赞 评论 收藏
分享
9 27 评论
分享
牛客网
牛客企业服务