合合信息 NLP大模型 凉经

问项目
问一个OCR项目有什么提升的空间
问自注意力
问Transformer 的 多头注意力机制
问BN层的作用,在推理中是怎么作用的
如何计算LLM占用的内存大小
举了一个详细业务场景,有关PPL优化#面经#
全部评论
佬,有考算法题嘛?八股感觉还比较常规
点赞 回复 分享
发布于 2024-06-13 18:16 浙江

相关推荐

评论
2
20
分享

创作者周榜

更多
牛客网
牛客企业服务