首页 / 面试题刺客退退退
#

面试题刺客退退退

#
237793次浏览 3267人互动
来说说那些你看过的很难、让你不好回答的面试题刺客吧!让我们一起说:面试题刺客退!退!退!
此刻你想和大家分享什么
热门 最新
美团移动端一面凉经
美团一面1842人在聊 查看13道真题和解析
点赞 评论 收藏
分享
面试高频:查找第k大的数(欢迎补充)
1.查找第k大的数:快速选择法,On(这里讲的都是时间复杂度)。快速选择法:由于快速排序每次排序都可以用On时间求出基准是第几大的数且左边都比基准小,右边都比基准大。若第一次求出基准是第i大,若ik,以i为右边界递归左边,每次减小一半查找范围,直到i==k,总共时间为On。2.查找最大k个数(k远小于n):建一个大小为k的优先队列(小根堆),klogk,对于剩下的元素,若大于堆顶则拿掉堆顶最小的再插入,总共用nlogk的时间找到最大k个(堆顶为第k大的)。共计(n+k)logk<2nlogk=nlogk,k很小时视为On,k大时用方法4。3.频繁查找第k大的数(数组变化):先用方法2找出原始数组最大k个数,klogk,若要新增元素,先对比堆顶,若大于堆顶则先移除堆顶再插入堆,这时堆顶为第k大的数。每次查找复杂度为logn。4.频繁查找第k大的数(k变化):排序,nlogn,每次查找时间为O1。5.查找a~b之间的所有元素:先用快速排序法找到第a大和第b大的数,用On,再遍历一次,选出位于这两个数之间的数。总共On。6.频繁查找,数组和k同时变化:先建一个二叉搜索树nlogn,维护每个结点的子树大小,查k时从根节点开始,若小于左子树大小,直接进入左子树,否则k-=左子树大小后进入右子树,每次查找logn,每次插入时将经过的结点子树大小++,也是logn。7. 查找数据流的中位数:维护一个最大堆和一个最小堆,满足最大堆所有的数都小于最小堆的数,当两个堆数量相等时,中位数就是堆顶平均,若最大堆比最小堆大1,中位数就是最大堆顶,插入新元素时,奇数次考虑插入最大堆,若大于堆顶则插入最小堆,再把最小堆堆顶插入最大堆。偶数次类似。#面试题刺客退退退#
点赞 评论 收藏
分享
2024-11-20 11:50
门头沟学院 项目经理
狠狠地出了一口恶气
牛津8455567号:牛逼啊 佬 上次刷到你的帖子还是说要投字节 现在已经创业融资了
点赞 评论 收藏
分享
头像
2024-08-16 19:36
已编辑
东北大学 算法工程师
百度 商业AIGC 二面 逆天面试官
全程74分钟,岗位是商业AIGC,部门是一个做广告生成的部门这次面试非常逆天,面试官会无数次打断并嘲讽,出题模式也很逆天,面试官嘲讽天赋被点满了属于是1.自我介绍2.拷打实习项目,先让我讲一下总体的流程,然后开始问我数据怎么构建的,模型怎么测评的,然后对我们网易雷火这边的游戏业务提出了很多质疑和批判,此时面试官的逆天初见雏形😂3.拷打第一个项目,我的是一个rag的,我先讲一下,刚开始讲就被他打断了,他说别讲rag相关的,讲模型相关的,说我们这rag部分做的太粗糙没什么商业上的价值我就开始讲lora微调和对比解码相关的4.拷打论文项目,先让我讲了一下总体的,然后他说我们这个方向是在水论文,让我不用再讲了5.让我打开ide写一下transformer的代码,用pytorch框架,他出这个题我直接愣住了,我只见过让写多头注意力的,这个我刚练过,我说我先讲一下transformer原理再写,讲完之后我先写多头注意力,再写别的,但是结构记得代码有的部分确实写不出来,他就开始嘲讽,说是不是平时没写过代码,然后我连连道歉,他说行吧行吧6.算法题,他说这次有三道手撕题,第一道求数组第k大元素,第二个是快排,第三个是个前缀树的,我前两个写了一下,准备写第三个的时候我电脑都快没电了,剩不到百分之十了,这如流软件贼耗电,我之前面试用飞书或着腾讯会议根本不会这么快没电,面两三个小时无压力;我说电脑快没电了,他又开始嘲讽嘲讽完说再问我一会八股吧,他看我用vllm,让我讲一下,我讲paged attention,讲到一半他说别总讲原理,写一下这个的代码,我说这个我确实没看过底层的,他又开始嘲讽,问我其他大厂问不问代码,我说其他大厂主要问原理,他开始说其他厂就只问这些知识点?不问代码没意义啥的,我只能尬住7.反问,我说没什么要问的,结束吧总的来说从我之前找暑期到现在面了百度五次,每次都很逆天,我真服了:前两次是暑期实习,面的百度文库策略部,两个面试官都难崩,我专门写帖子吐槽第三次是提前批,被一个搜广推的部门捞了,不匹配直接kpi了第四五次就是商业AIGC的两次,一面面试官还好,二面就碰到这个逆天的怎么说我一共也面过四五十次了,其他面试官基本都是挺好的,素质也都很高,我碰到过的逆天面试都是面百度碰到的,这公司我是再也不面了,反正肯定也不会去我个人的理解是,候选人面试有不会的挺正常的,毕竟不是所有人都啥都会,有厉害的也有菜的,但是总出言讽刺候选人就是面试官的个人素质问题了,一场面试至少被他讽刺了几十次,话说百度有啥途径投诉面试官吗😂路过的佬如果面同一个部门的话,可以提前做一些心理建设,面的时候基本不让出错😂只要一有讲的不太清楚的他就开始嘲讽,我还没见过这种人,搞心态属于是 #百度求职进展汇总#  #百度秋招提前批进度#  #百度#  #面试题刺客退退退#  #24届软开秋招面试经验大赏#
RZ_Q:真逆天啊!除非做加速推理优化什么的,谁去看vllm底层怎么写的啊
查看7道真题和解析
点赞 评论 收藏
分享
面试官:大模型微调需要多少数据量?
1. 核心影响因素- 任务类型:- 简单任务(如文本分类):可能需数百到数千条标注数据。- 复杂任务(如对话生成、阅读理解):通常需数万条甚至更多数据,尤其需多样性和高质量样本。- 模型规模:- 大参数量模型(如GPT-3、PaLM)可能需更多数据防止过拟合,但通过策略(如参数冻结)可降低需求。- 较小模型(如BERT-base)可能在较少数据下表现良好。核心是数据质量:- 高质量、标注精准、多样化的数据可显著减少需求量。- 低质量数据可能导致模型性能瓶颈,需额外清洗或增补。领域差异:- 若预训练数据与目标领域差异大(如通用→医疗),需更多领域数据调整模型分布。- 训练策略:- 正则化技术(早停、Dropout、数据增强)可缓解小数据过拟合。- 迁移学习技巧(如Adapter、LoRA)可减少可训练参数量,降低数据需求。经验可参考范围- 常规任务(分类/标注):- 小模型(如BERT):1k-10k样本。- 大模型(如GPT-3.5):可能需10k-50k样本(结合领域适配策略)。- 生成任务(对话/摘要):- 通常需5k-100k+样本,依赖生成质量要求。- 领域适配:- 若领域差异大,需额外增加20%-50%数据量。产品经理的权衡维度- 业务目标:- 若需快速验证MVP,可接受小数据+低精度(如数百样本),后续迭代优化。- 若追求高精度(如医疗、金融场景),需预留足够标注预算。- 资源限制:- 标注成本:若数据获取昂贵,需优先优化数据质量或采用主动学习。- 算力与时间:大数据量需更高训练成本,需权衡ROI。- 替代方案:- Prompt Engineering:用少量样本设计提示词,可能无需微调。- Few-shot Learning:结合模型原生能力减少数据依赖。 #牛客激励计划#  #聊聊我眼中的AI#   #数据人的面试交流地#  #AI了,我在打一种很新的工#  #面试被问期望薪资时该如何回答#  #面试题刺客退退退#  #大家都开始春招面试了吗#  #24届软开秋招面试经验大赏# #牛客AI配图神器#
点赞 评论 收藏
分享
头像
2024-08-24 21:42
已编辑
东北大学 算法工程师
影石 NLP算法工程师 一面面经
整体四十多分钟1.自我介绍2.拷打第一个项目,我的是一个实习项目,先让我总体讲了一遍,然后问我数据怎么构建的,我讲了一下数据生成、扩充、探索啥的;问我是全参微调吗,我说是的,问我为什么不用lora微调,我说了一下大概的原因;问我跟别的模型对比了吗,我讲了一下其他几个基座模型对比的实验;问我模型怎么测评的,我讲了一下自动测评和人工测评相关的3.拷打第二个项目,我的是一个rag的,先让我讲了一遍,然后问我文件解析分块预处理是怎么做的,我讲了一下;然后问我lora微调相关的,我讲了一下;让我讲对比解码,我讲了一会;最后问我假如说让我改进rag,从哪几个方面改进,我说了几点4.拷打八股相关的,问我transformer比rnn主要好在哪里、decoderonly结构比encoderdecoder结构好在哪里,还问我要用没用过python后端框架,我说稍用过flask;问我python的高级特性,装饰器什么的;问我之前用bert做过任务吗,我说做过文本分类,他说构建一个文本分类框架需要写哪写代码,大概说一下代码和调用的pytorch方法;然后问我有没有写过focal loss,我说知道原理,讲了一下样本不均衡相关的4.写代码,让我写自注意力5.反问,问部门什么业务,说是做智能客服意图识别的,主要用的bert那种感觉应该是无了,他们这里看起来不太缺人,技术也不是很对口,他这明显想找个现在bert用的比较多的,他们部门不做大模型相关的,这波当练习了突然想起来,影石竟然周六加班面试😂看来没有宣传的那么好 #牛客创作赏金赛#  #实习中的菜狗时刻#  #投递实习岗位前的准备#  #我的失利项目复盘#  #面试题刺客退退退#  #如何判断面试是否凉了#  #找实习多的是你不知道的事#
查看15道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务