奇富科技面经
1.自我介绍
2.大模型的一个项目介绍
2.1微调的方法有哪些,原理(fine tuning ,ptuning ,Lora)
2.2为什么不用finetuning(回答灾难性遗忘问题和gpu资源问题)
2.3有了解过分布式训练吗?介绍一下deepspeed的原理
2.4llm的评估方式
2.5llm在某个数据集上评估指标很高就说明模型性能很好吗?解释理由
2.6 open问题:你现在有一个大模型你要怎么去做它的评估工作
3.做题:括号生成问题(递归+回溯)脑子短路没做出来换了道简单题股票买卖问题 a了
4.又追加问了现有的llm的结构
举例子lamma为什么用decoder- only结构而不用encoder- decoder结构
现有的llm为什么没有encoder- only结构
5.概率题