字节很喜欢深挖简历,通常不会直接问八卦,而是结合项目问,所以项目一定要吃透,用到的技术要理解的很深入,此外会有面试官结合他们的业务问一些场景问题,问如果是你你会怎么做等等。一,二,三面都是这个模式,我把一些他们根据简历问的通用问题记录一下,供大家参考。1.使用SFT进行微调时的训练数据是如何构造的,如果缺少训练数据有没有什么方法?2.看你使用的是千问大模型,请问千问的模型结构,创新点是什么?3.看到你在SFT的基础上使用了dpo来训练,为什么要使用dpo,sft不行吗?4.sft解决不好的badcase,为啥dpo就能解决了?你认为sft适合解决那类问题?dpo又适合解决哪类问题?5.dpo的...