美团春招-机器学习算法-面经

一面 3.21
问项目:问了一个项目,问的非常详细,大概问了30min
然后问基础:
transformer的架构
为什么使用multi-head、残差链接和前馈神经网络层
梯度消失的原因是什么
gpt和t5的区别
bert和t5的区别
了解现有的大模型,比如LLaMa这些吗
代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
全部评论
佬,请问是什么业务方向呀
点赞 回复 分享
发布于 03-21 20:36 安徽
手写测试用例吗
点赞 回复 分享
发布于 03-22 11:36 上海
佬的项目是什么呀
点赞 回复 分享
发布于 05-02 11:08 浙江

相关推荐

评论
12
54
分享
牛客网
牛客企业服务