一些凉经

Shoppe

一面

  1. 简历项目
  2. 如何估算显存开销
  3. 优化器中会保存哪些数据
  4. 为什么会保存一份模型参数
  5. Llama Factory中的padding,当多条数据拼接时如何处理,对attention有什么影响
  6. 优化器状态里面包括什么
  7. pytorch中的calculator如何进行梯度累积
  8. Code:一个骰子投n次,求概率分布

字节 抖音搜索

一面

  1. 简历实习项目1,数据构建?评估?如果再做一边如何来进行优化?
  2. 简历实习项目2,难点?挑战?如果再做一边如何来进行优化?
  3. 算法 手写LayerNorm最多k个不同字符的最长字串
  4. 模型参数如何计算?
  5. MHA中有哪些额外计算?
  6. GQA,MLA?

二面

  1. 拷打
  2. Code 编辑距离

蚂蚁 数字支付 自然语言处理

一面

  1. 简历项目
  2. QKV的含义
  3. 机器翻译任务中kv可以是同一个吗?
  4. RL中Model based和Model free的区别?
  5. MCTS属于哪一种?介绍一些MCTS的过程?
  6. Policy Based和Value Based的区别?
  7. GRPO和DPO的区别?
  8. Code:打家劫舍
  9. 平时如何学习新知识?
  10. 对大模型的未来的看法?
  11. 选择岗位看中什么?
  12. 反问

阿里 淘天

一面

  1. 自我介绍
  2. 介绍一下口语化的流程,数据集大小,如何构造,为什么用Qwen不用混元?
  3. 如何评估?如何迭代?上线之后如何面对保证响应速度?
  4. 有哪些微调方式,Lora了解吗?Adaptor放在哪里?
  5. 为什么要用RLOO?和PPO比有什么优势,Reward怎么构造?
  6. 介绍一下PPO,DPO,GRPO等等?有什么异同?
  7. 介绍一下Cpt的数据大小,为什么要混入通用数据?怎么配比?
  8. Cpt和Pretrain的区别?用了多少张卡,训练了多久
  9. 介绍一下RAG的项目,检索的数据准确性?具体场景?
  10. 介绍一下Encoder-Decoder的异同
  11. 位置编码,相对、绝对,RoPE,有什么好处?
  12. 常见Tokenizer有哪些,subword分词有什么好处?
  13. Transformer中包含哪些块?MLP,Attention,Embedding,LayerNorm?
  14. Attention计算流程,QKV如何得到?
  15. Code:手写MLP以及训练过程
  16. 到岗时间?
全部评论

相关推荐

昨天 10:18
已编辑
蚌埠坦克学院 前端工程师
面试官脸特别黑,像我欠了他三百万…而且中间人直接消失了接近10min,而且问问题有的问题奇奇怪怪搞不懂想问啥 最后手写题LRU众所周知代码比较长,一到一小时整点就让我别写了,第一题写的代码也没看,直接就是反问了,反问介绍业务也是有种敷衍+心不在焉的感觉…体验不咋地,评价为已经不太想去了…自我介绍拷打项目(他一直问方案设计和业界其他的方案调研,说实话我觉得我答的不好,但我又不知道该怎么答)方案设计 技术选型 技术方案扩展性 稳定性登录态的设计 jwtjwt和session cookie的区别为什么要用jwt做登录怎么理解session呢js事件循环机制宏任务和微任务有哪些输入一个url到页面显示的过程js加载会阻塞页面渲染吗async和defer的区别css解析会解析页面渲染吗link慢的话 网络加载比较慢 页面也会比较慢(omg 我没懂他想问啥)如何获取页面的性能数据除了工具之外 还有其他方法衡量页面的方法吗如何在全局捕获一些js异常如何解决跨域问题用了cors请求跨域 但比正常请求慢 可能是什么原因vue2和vue3的区别vue2的响应式设计有什么问题?为什么需要在vue3的时候做调整?vue2怎么实现对数组更新的响应式劫持?数组原生方案怎么做到对数组的更新操作带响应式的?(问的莫名其妙 不知道想让我回答什么 我说了数组的遍历方式他又说不是这个)要自动打印的数组的当前所有元素要怎么做怎么做到push的时候自动打印(不知道他想问啥)vue2数组的响应式原理 怎么改变原始的push方法让他做到自动化响应式输出结果(问的奇奇怪怪算法手写题promise.allLRU反问
查看26道真题和解析
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客企业服务