这两天的痛苦面试
蔚来自驾
介绍softmax,介绍transformer,详细介绍QKV过程
LLM为什么是only-Decoder架构,为什么不采用T5架构
什么是prefill
如何解决长下文问题
有哪些降低transformer训练时间复杂度的工作?
讲实习,讲论文
无code
二面不想面了,一面被追着问太痛苦,拒了
虾皮知识图谱/NLP一面
介绍项目,无八股
给了道场景题,怎么使用LLM解决他们的业务问题
两道code忘了是啥了挺简单的
虾皮二面
介绍项目,无八股
给了道场景题,怎么使用LLM解决他们的业务问题(梅开二度)
无code
斑马智行算法实习生一面
讲论文(被说没啥创新点,其实确实也是)
什么是Lora
手撕全排列和文件分块读取
字节广告一面
讲实习
知道GRPO吗?(还没看
介绍PPO和DPO
code:统计数组中仅出现一次的元素的个数
面完是真不想学一点