问题1. 自我介绍2. 为什么不去算法呀?参加过哪些计算机竞赛?3. 描述你最具成就感的项目经历4. 如何处理直播场景的QPS陡增问题?5. 讲一下直播项目里面, 怎么最终解决QPS不平等用户体验的问题?6. 直播安全怎么做?鉴黄、涉政内容识别?7. 消息队列可靠性怎么做到的?主从怎么同步?8. 消息有序性怎么保证?9. 如何保证分布式系统数据一致性?10. 设计高并发论坛系统发布怎么实现?11. 如果某一个贴子突然热度很高, 怎么提高吞吐量、性能,不至于开销太多12. 怎么保证刷库的有序性?13. 发消息的话,如果某一个贴吧很多, 怎么做到该贴吧慢慢发布, 但是不影响其他贴吧。14. 一个论坛系统, deepseek能用在哪些地方?15. 自身的优势16. 自身的缺点回答:1. 教育背景\在校经历, 专业技能, 实习, 项目2. 本科有过算法经历,但是喜欢工程。 参加过, 一些一些但是没获奖3. 实现上是电商项目、 设计上是直播项目4. 消息队列缓冲:使用Kafka实现削峰填谷;动态延迟策略:根据负载自动调整处理延迟(2-4秒)5. a. 主播有延迟, 变相增加了qps, b. 下游提需求, 走原片不转码,提高速率6. 视频文件流数据上传在云端是以不连续的文件存储, 安全就需要有两个方向: 图片和音频,每个文件存储的时候可以抽帧的, 而且很快, 抽帧识别可以交给审核图片的平台。 但是音频需要完全获取, 转文字识别敏感词。7. 消息队列分区多分辅助、部署在不同broker上, 同时主从, 主从同步, 挂了从顶上,同时具备以segment的形式持久化。同步用zookeeper协同, 后续改成raft算法8. offset本来就是有序的? 可以a. 都发在一个分区 b. topic地下只有一个分区9. 答错了很多次, 应该回答分布式事务, 回答了很多分布式锁了, 跟面试官好好交流了,:通过RocketMQ半消息机制实现分布式事务, 后续努力学这块 a. 补偿机制:失败操作进入重试队列 b. 版本控制:基于日志的版本回滚10. 回答了AQS, 先写库->改成缓存告诉前端实现了—>后台异步调用实际的发布情况。11. 面试官说主要是网络、带宽和其他开销, 业务内部开销不会很大,主要是图片、资源的后台开销,要怎么优化? 我说的后端给redis 热点帖子存资源12. 那就只能用消息队列发消息了, 以前端点击或者后端时间为主?13. 当时回答了很多想法, 比如Topic、分区,但是都被面试官指出不符合不会影响其他贴吧的发布速度。 最后回答是快慢队列, 首先尝试慢队列发消息, 同时维护一个拥挤贴吧的列表。 如果慢队列消息超过阈值, 不在拥挤贴吧队列的消息开始往快队列发送, 拥挤贴吧的消息继续发送在慢队列解决这个问题14. a、 帖子总结 b、个性化搜索 c、最关键, 对于帖子的问题或者引导 deepseek能给出一个回答。 优势在于 参与人去责任化, 也定下了贴子互动引导的标杆, 保证帖子热度高的同时, 不至于引导跑偏, 而且开发人员、用户都不会担心需要为此负责(因为是ai说的, 作为参考就很好, 不代表任何人的态度), 因为deepseek可以说是机器的回答, 更可以说代表所有人的大众意志, 因为数据都是有用户填入的