合合信息 NLP大模型 凉经

问项目
问一个OCR项目有什么提升的空间
问自注意力
问Transformer 的 多头注意力机制
问BN层的作用,在推理中是怎么作用的
如何计算LLM占用的内存大小
举了一个详细业务场景,有关PPL优化#面经#
全部评论
佬,有考算法题嘛?八股感觉还比较常规
点赞 回复 分享
发布于 06-13 18:16 浙江

相关推荐

不愿透露姓名的神秘牛友
10-26 20:24
点赞 评论 收藏
分享
2 17 评论
分享
牛客网
牛客企业服务