1.自我介绍 2.大模型的一个项目介绍 2.1微调的方法有哪些,原理(fine tuning ,ptuning ,Lora) 2.2为什么不用finetuning(回答灾难性遗忘问题和gpu资源问题) 2.3有了解过分布式训练吗?介绍一下deepspeed的原理 2.4llm的评估方式 2.5llm在某个数据集上评估指标很高就说明模型性能很好吗?解释理由 2.6 open问题:你现在有一个大模型你要怎么去做它的评估工作 3.做题:括号生成问题(递归+回溯)脑子短路没做出来换了道简单题股票买卖问题 a了 4.又追加问了现有的llm的结构 举例子lamma为什么用decoder- only结构而不...