如题 鼠鼠目前正在进行一段大模型agent的实习 实习了四个月了捏 但每天就只是看看agent的论文设计设计项目流程然后无法接触大模型微调或预训练 鼠鼠拿到了项目微调的代码鼠鼠想问问各位大哥 对于这个微调项目侧重需要弄懂哪里呢 鼠鼠现在学习了Megatron 和deep speed 还有模型结构 分词方法 还有别的咩 #牛客帮帮团来啦!有问必答# #不给转正的实习,你还去吗#