百度 Appbuilder后端开发 暑期一面
0421
实习项目:
1. 线程池的参数设定、队列容量等,是根据什么原则确定的参数
2. 知道哪些延迟队列的实现,最终为什么选择Redission作为延迟队列?
3. 如何理解支付耦合度高?如何设计策略模式接口中的方法,以及方法的参数
RAG项目:
1. 项目的实现框架是什么?
2. 对于PDF的parser和spiltter,设定的baseline是什么,最终讨论出的方案是怎么样的,对比baseline,使用了什么指标评价分块的好坏,提高了多少量化指标?
3. spiltter的具体策略是什么,如何对文本进行切分的?
4. 选用了什么embedding模型进行嵌入的,有对比过其他模型吗?
5. 对于问题的重写,prompt是如何进行设计的,如果用户只是简单的提问,如何进行重写?
6. 分层检索是怎么做的,baseline设定是多少,提升了多久的耗时?
7. 讲讲对于召回后的重排策略。
算法题:
1. 螺旋矩阵
2. 最长递增子序列
实习项目:
1. 线程池的参数设定、队列容量等,是根据什么原则确定的参数
2. 知道哪些延迟队列的实现,最终为什么选择Redission作为延迟队列?
3. 如何理解支付耦合度高?如何设计策略模式接口中的方法,以及方法的参数
RAG项目:
1. 项目的实现框架是什么?
2. 对于PDF的parser和spiltter,设定的baseline是什么,最终讨论出的方案是怎么样的,对比baseline,使用了什么指标评价分块的好坏,提高了多少量化指标?
3. spiltter的具体策略是什么,如何对文本进行切分的?
4. 选用了什么embedding模型进行嵌入的,有对比过其他模型吗?
5. 对于问题的重写,prompt是如何进行设计的,如果用户只是简单的提问,如何进行重写?
6. 分层检索是怎么做的,baseline设定是多少,提升了多久的耗时?
7. 讲讲对于召回后的重排策略。
算法题:
1. 螺旋矩阵
2. 最长递增子序列
全部评论
相关推荐
点赞 评论 收藏
分享

点赞 评论 收藏
分享