两年半怕啥
点赞 5

相关推荐

个人背景:- 985硕士,计算机专业,研究方向为机器学习/数据挖掘- 有推荐系统相关项目,Kaggle竞赛经历- 面试岗位:滴滴出行-算法工程师(机器学习/运筹优化方向)📝 面试全流程回顾1. 笔试(线上编程+数学)-算法题(2道,LeetCode中等偏上难度)- 动态规划:最长递增子序列变种(需优化到O(nlogn))- 图论:Dijkstra算法实现+路径还原- 数学题(概率统计+线性代数)- 贝叶斯定理应用题(拼车场景下的概率计算)- 矩阵分解(SVD)的原理与优化意义2. 技术一面(1小时)- 代码能力- 手撕:实现带权随机抽样(Reservoir Sampling变种)- 代码优化:如何减少时间复杂度?- 机器学习基础- XGBoost vs LightGBM的差异?如何选择分裂点?- 如何解决推荐系统中的冷启动问题?- 业务场景题- 滴滴拼车订单匹配如何建模?(聚类+贪心算法的取舍)3. 技术二面(1.5小时)- 项目深挖- 详细介绍Kaggle竞赛方案(特征工程、模型融合技巧)- 追问:如果数据分布偏移(如疫情前后出行规律变化),如何调整模型?- 系统设计- 设计一个实时ETA(预估到达时间)系统:- 数据源(GPS/交通路况/历史数据)- 模型选型(时序模型+在线学习)- 异常情况处理(突发拥堵如何动态调整?)- 算法发散题- 如何用算法减少司机空驶率?(转化为图的最短路径问题)4. HR面(30分钟)- 团队协作经历、抗压能力举例- 期望薪资与工作地点偏好🌟 滴滴算法团队特点业务驱动:算法直接影响亿级用户体验,成就感强技术栈前沿:时空预测、强化学习、因果推断等均有落地成长快:技术大牛密集,新人可接触核心项目🚘投递方式【内推链接】https://app.mokahr.com/campus-recruitment/didiglobal/96064?recommendCode=DScKP9qC#/jobs【内推码】DScKP9qC立刻投递,快人一步,抢跑未来全流程跟进,投递的同学评论区留言,方便后续跟进,秋招加油! #春招#                           #实习#                           #校招#                           #内推#        
点赞 评论 收藏
分享
上来先手撕lru , si完 问优化 ● 1. 如何实现一个lockfree 的 并发控制的缓存  ○ 问ringbuffer的优点?  无锁并发 ● 2. lru结合lfu 实现兼顾折中, 结合优点的算法实现● 也可以使用结构体记录, 在数据存储 基本单元上● 面试官给的思路: 设计多个lruclass, 或者多个队列, hot, warm, cold 队列  ○ 访问频率高的就放入hot里边( 比如多少次以上评价为高  ○ 那么可以使用结构体, 记录每一个访问的次数  ○ 那如何解决这个过期呢? 还能设计一个过期时间, 每次要检索这个数据的时候, 获取这个过期时间,看是否过期, 过期就直接丢掉,  不能访问了 ● 另一个思路 :  整体还是按照lru来,替换之前检查一下,前三个即将被替换的里面选择频率最低的删除,但是每个最多连续比较三次(我瞎说的)  ○ 避免某些短时间频繁访问的节点被删除    ■ 防止抖动现象产生 布隆过滤器+ redis bitmap 的原理● 自己的思路, 使用一个散列函数, 根据你当前的访问频率(设计一个struct node ), 去决定你随机的在list里边的插入位置  ○ 如果频率比较高, 就将其在get 的时候放到靠近队头的位置  ○ 频率比较低, 将其get 的时候放在队尾的位置(反正你短期大量访问, 后续频率上来了也会 逐渐的放到队头的  ○ 并且反正插入和查询都是O1     ■ 如果是伪高频,  插入位置比较低, 后续也会直接被淘汰, 说明你根本不是真正的短期热数据● 如果再问频率优化?  ○ CMS, caffeine 的本地淘汰策略算法● lru和lfu 的区别, lfu适合短期高频, 而lfu适合长期高频 数据paxos和raft 的区别● paxos 对比raft 的优点?● raft 为啥容易实现? 和paxos对比? 不允许空洞->强leader->容易实现● 选主的时候有没有 可能设计一个方案, 无锁选主?   ○ 1. 回答哨兵机制, 交给另一个集群哨兵去做选举这件事( 从而让数据节点专心做数据  ○ 2. 问其他思路, 我说不锁不行, 不锁的话可能导致选票许诺给多个人->整个集群的逻辑总票数增加 -> 脑裂问题均摊分析, 插入1e数据 ,扩容因子为4的 hash插入 的复杂度( 不会● 两阶段提交的缺点   ○ 全局阻塞, io次数多( 根据mysql 的两阶段提交谈了谈, 三级队列优化思路  ○ 没有事先通知 参与者, 不知道他可不可达, 宕机没 就直接提交了( 浪费网络带宽  ○ 协调者比重太大,  一旦故障, 其他参与者也会跟着阻塞  ○ 可能导致的数据库不一致, 比如commit阶段 ,参与者并没有收到提交请求, 导致落后 ( 可以引入mq解决消息消费问题    ■ 回答 数据同步机制, 结合项目增量和全量, 以及mysql 的集群组提交策略(半数以上● 解决,引入tcc,  不过侵入性较大, 并且实际效率也不一定高 (
腾讯一面1743人在聊 查看12道真题和解析
点赞 评论 收藏
分享
牛客网
牛客企业服务