1.项目拷打
2.介绍transformer的具体结构
3.绝对位置编码与相对位置编码的区别
4.Group Query Attention (GQA) 机制
5.介绍一下MOE
6.多模态大模型怎样融合不同模态的信息
7.反问
相关推荐