字节应用一面

应该是某部门里的算法团队,有大模型相关的
1.自我介绍
2.项目详细拷打
3.长记忆这块除了 rag,你们有试过长文本模型吗?为什么不好?你们使用的扩充到 32K 的模型还是预训练本身就 32K 的模型?
4.你们记忆检索怎么检索的?有做什么优化吗?
5. 有没有了解过 loss in middle?(应该是这个?应该是说中间的注意下降吧?不是很懂这个原理)
6.DPO PPO 能讲一下它们的区别吗?有没有了解过更前沿的 RLHF?
7.DPO 里你刚刚说的 reject chosen 的 loss 里的概率是怎么计算的知道吗?
8. 简单讲讲 transformer bert 一类的模型的结构吧。
9.attention 公式是什么?为什么要除以根号 dk?
10. 你们模型效果怎么评估?上线有具体准确率之类的要求吗?
11. 安全对齐这块,你们有做样本分布统计吗? 就是具体涉及到哪些类?

代码题最大乘积连续子数组
全部评论
是被捞的还是主动投的呀 等了几天被捞呢
点赞 回复 分享
发布于 2024-09-12 00:26 北京
今天刚通知我这个部门的三面过了 uu反问有仔细问相关业务吗
点赞 回复 分享
发布于 2024-09-11 17:10 美国
蹲一下是不是kpi 我也被捞起来了
点赞 回复 分享
发布于 2024-09-11 16:23 浙江

相关推荐

你包有offer的:我面了10面才进去
点赞 评论 收藏
分享
小厂面经,也是我的处女面(30min)1.自我介绍2.spring boot的自动装配原理(好多类和接口的单词都忘了全称是啥了,就说了记得的单词,流程应该说对了吧)3.有用过redis吗?主要是用在实现什么功能(说了技术派用redis的zset来实现排行榜)5.有了解过Redisson吗?讲一下对于分布式锁的了解以及在什么场景下应用(说了秒杀场景)6.对mysql有了解吗?包括它的索引优化和创建(把想起来的全说了)7.了解设计模式吗?比如单例模式,为什么要使用单例模式,它的优点是什么(昨天刚看的设计模式)8.工厂模式有了解吗?主要的使用场景是?(也是昨天刚看的)9.场景题:有7个服务器,需要在早上十点定时的向数据库中的用户表中的用户发短信,如果做到发送的消息不重复,且如果发送失败了需要知道是到哪个用户失败了,这样下次就直接从这个用户开始(我答了用spring task来实现定时,用分布式锁来保证只有一份服务器可以发送消息,用消息队列来存储消息,然后用消息确认机制来保证错误信息的记录,以及在数据库或者业务层面完成消息消费的幂等性)10.场景题:如果在系统启动的时间就将数据库的所有用户相关的信息都读到一个hashmap中(这个没啥思路,没答好)27届的投了一个星期终于有一个面试了,大部分公司都只招26的
inari233:已oc,拒了
查看9道真题和解析
点赞 评论 收藏
分享
评论
9
23
分享

创作者周榜

更多
牛客网
牛客企业服务