青颖飞帆(青书)大模型算法工程师凉经
一面
项目
自己的项目和经历主要是大模型推理方面的,所以问的不多。
八股
Decoder-Only和Encoder-Decoder模型相比有什么优势?在训练和推理效率上有什么区别?
介绍一下LLama模型,追问了损失函数、位置编码、分组注意力等问题。
还有哪些常见的位置编码方式,其特点是什么?
说一下LoRA微调,如果出现了微调数据集效果好但是原始数据集上效果变差的问题怎么办?
手撕
leetcode 215 top-k
反问
培养体系:实习+试用+正式,以项目为主,没太有成熟的培养体系。
二面
项目
还是上面提到的,只是简单问了一下具体做了哪些事,没有深挖。
八股
说一下LLaMA LLaMA2 LLaMA3的区别?
有哪些位置编码,其特点是什么?
介绍一下MoE模型?
说一下beam search算法,为什么用的少了?
假如需要上线一个公文写作的大模型,具体流程应当是怎样的?
手撕
迪杰斯特拉算法
反问
应届生的标准:小公司,希望能直接上手干活。
总结
两轮面试的回答还是不错的,基本上都答得出来,但是从两次反问可以看出,青书的培养体系并不是特别完善,希望找对口的求职者,能够直接上手工作。我毕竟没有大模型算法研究/微调等相关工作,所以并不是特别匹配。