京东技术一面大模型

一面 HR,这是二面,技术一面。
面试官人很好,聊了很久,总结一下问题吧。
1.自我介绍
2.项目介绍
3.你这个 prompt 是怎么调整的?
4.你如何评估你们这个效果呢?(我从数据评估和模型评估两方面讲)
5.你们的训练数据怎么构造的?用的什么格式?
6.全参微调训练一次多久?
7.主要是 SFT 吗?没考虑强化学习?
8.你觉得为什么现在大模型都是 only decoder?有什么好处?
9.lora 做过吗?讲一下原理
10.lora 你对哪些层次加 adapter?怎么定的?print model 看吗?(面试官后面说对不同层加 lora 效果影响还蛮大的,不仅仅是参数大小)
11. 对训练精度了解吗?(fp16 bf16 我讲的不太对,这部分不是很记得了,要复习一下)
 12.attention 里面的注意力分数是什么?为什么要 Q 乘以 Kt?什么含义?
13. 位置编码了解吗?讲一下

代码题:类似于 topk 但是不要求复杂度,更像是数据处理场景题。
反问:聊了很多,面试官人确实很好,泪目。只能说面试确实看缘分。
全部评论
请问一面结果大概多久出的呀
点赞 回复 分享
发布于 08-28 15:35 内蒙古
东子一面是HR面么,为什么邮件通知一面都安排到了10号了
点赞 回复 分享
发布于 08-30 12:27 北京
我勒个豆,咱俩好像一样,我二面也是这个岗
点赞 回复 分享
发布于 08-30 13:53 山西

相关推荐

11-06 08:09
已编辑
门头沟学院 自然语言处理
投递淘天集团等公司10个岗位
点赞 评论 收藏
分享
理想汽车 - 大模型算法实习生(长期有效,HC丰富,校招也开放ing)职位1-描述【大模型推理(Reasoning)与通用Agent AI】:- 研究通用大模型逻辑推理算法;- 研究o1的训练方案,搜索空间的探索与self-play的训练;- 研究Agent AI算法,助力实现L3智能;职位2-描述【大模型推理(Inference)优化】 :- 研究大模型推理阶段的KV cache 优化算法;- 研究分布式GPU训练优化算法,包括但不限于负载均衡、显存优化等;总结:大模型推理方向,GPU资源丰富,实习+论文,我全都要!我们能提供:1.技术沉淀:参与大模型技术研究,培养解决技术难题的能力。2.实战经验:参与真实业务场景的落地和上线。3.论文产出:发表高水平论文,培养顶会写作能力。4.成长支持:Mentor指导,重视成长,和优秀的人做有挑战的事。我们期待的你:必备项:- 专业背景:计算机、数学、人工智能等相关专业的在校生,统计和强化学习相关方向优先;- 基础能力:理论功底扎实,熟悉LLM、NLP相关算法,精通transformer和RL等相关算法优先。- 工作态度:主动积极,自驱能力强,具有创新意识。加分项:(没有也没关系,我们更看重潜力)5.实习时长:能够长期实习,长期合作。6.竞赛大佬:ACM/OI大神,代码能力出众。7.学术研究:在ML顶会发表论文,研究能力出众。8.相关经验:有大模型推理、模型优化、大模型框架优化和强化学习等相关工作经验。工作地点:- 北京朝阳望京心动了?赶紧砸简历过来吧!📧 简历投递:xuhao12@lixiang.com 简历要求:邮件名及简历标题命名为“姓名-学校-专业-实习时长”和我们一起,驰骋未来吧!🚗
投递理想汽车等公司10个岗位
点赞 评论 收藏
分享
9 39 评论
分享
牛客网
牛客企业服务