首页 / 数据人的面试交流地
#

数据人的面试交流地

#
432525次浏览 7784人互动
虽然说每年秋招都很难,但今年真的是难破天际了!即时记录你的面试,跟其他小伙伴抱团交流吧~
此刻你想和大家分享什么
热门 最新
讲讲面试经验
ps:上一篇受到挺多人质疑,主要是学历和offer的戏剧性差别太大不过大概清楚我bg的都信了。还有不信的你们当个乐子看也行我主要面试方向是大模型落地算法,做业务的。我的面试秉承两个要点:1.自信:做业务的面试官一般和ailab等研发部门不一样,你要相信面试官不一定有你水平高,所以要在面试中感染他,让他相信你很牛。(这背后一定是扎实的八股基础和实践经验)2.指标主义:做业务多了其实大家都知道,大部分时间策略比技术更重要,唯一能量化的只有产出指标。我在简历上大量标出了项目的小环节指标、阶段性指标、里程碑指标、中间指标、最终输出指标、转化率,每个指标对应能带来项目什么方面的提升。同时在面试过程中会和面试官讨论每个指标的定义和变化带来的影响,比如chatbot类项目就应该更关心dau和留存率。同时阐述自己对指标的看法,每个技术or策略为什么能带来这种指标的提升。经过这样,面试官一定会感受到你对业务的理解度,以及对项目整体的把控。下面讲讲面试的每个环节我都是怎么理解的,以及我的做法。自我介绍环节:这个部分其实挺重要的,你可以在这里秀出你的腕力,同时展示自己擅长的方向,提出自己的highlight point,如果有面试官对你这部分某个点感兴趣,那就算有了一个好的开始。至于我自己,我会将自我介绍分成两部分:1)工作经历:重点介绍自己的实习、项目、实习产出情况,以及工作期间的高光,旨在展示自己对业务的理解,这部分不应该是用来展示技术深度的;2)算法基本功:重点介绍自己的比赛、论文、实践经验等,这部分主要用来介绍自己的技术深度,最好能给出一些数字,比如顶会几篇、xx比赛冠军几个、大模型sft卡时共计xx小时。项目讲述环节:这部分主要用来展示业务理解,就像我上面说到的,需要对整个项目的周期、指标有比较深的理解。在这方面,我认为在公司参与一个大项目(有技术深度)不如独立负责一个项目的开发,这样能够有效了解一个项目的立项到上线及之后的周期、指标设立、埋点构建、里程碑、各阶段迭代方向、标注体系构建、日常审核体系建设、数据飞轮的构造方法。但大部分实习生都是承接mentor的一定工作,实际上只能负责一个小part,所以我建议还是在周会上多听、下来多问,为什么这些指标会产生这样的变化,同时也要了解项目其他环节的指标和技术方案,以及方案选型的特点。最重要的是,要了解项目的核心输出指标,以及这个指标能够怎样带来实际收益转化、具体的转化率。同时也要知道你的部分每个策略对核心输出指标的贡献度。(总而言之,这部分还是展示你在实习期间的见识多广,很多东西实际上都非常简单,但是经历过这些比项目本身的难度更重要)比赛、论文展示环节:这部分主要展示你的技术深度,把你的高光点详细阐述,具体到每个人身上都不一样,所以就不细讲了。八股环节:这里最好的方法是在讲述项目、论文、比赛的过程中就叙述一些这个方向的八股,比如讲llm的时候可以讲讲发展史、技术方案的借鉴算法来源,实现的细节,或者和技术方案相似的算法。尽量不要给面试官额外的时间专门提问八股,这样八股方向就不可控且体验不好手撕环节:多刷题吧,记几个让我印象比较深的手撕题:1.np实现FFN的forward和backward;2.GQA的torch实现;3.BPE tokenizer的大致实现反问环节:我一般会问面试官组里的项目情况,同时讨论指标和流量的分配关系(这里也大致能看出组里的项目重视度和发展前景),以及大概技术方案的设计,值得注意的是,最好在这环节问一下能够引发讨论的问题,而不是面试官简单回答即可的问题。 #大模型#  #秋招#  #算法岗#  #数据人的面试交流地#  #简历中的项目经历要怎么写#  #我发现了面试通关密码#  #面试#  #面试经验#
华师牛马哥:我室友也是大模型,双非本211硕,一开始学后端找不到实习,后面就学了大模型一两个月,看出来行情应该还可以,后端都没约面,大模型都还是给面,最后7月份了,拿了同花顺和同城还有一些小厂的,同花顺一个月一万多实习工资,大模型我觉得有机会,反倒后端真没机会,吹出花来,都不可能给二本SSP
点赞 评论 收藏
分享
11-05 17:16
门头沟学院 C++
WPS金山C++一面凉经
1.C++有哪些特性,请使用一段代码演示这些性质。我写了一些经典的继承,子类中重写的父类的虚函数,然后用父类指针指向子类对象,去实现多态。但是写的时候有点脑子发昏,把所有成员全public了,被面试官点评为这违背了封装。2.写两个类,两个类分别有一个虚函数,然后有一些char和int类型,写一个子类去继承这两个类。3.问上述子类的大小?我考虑两个虚函数指针以及内存对齐之后,给出了正确的大小。然后被面试官套路了,问我有子类有两个虚函数指针吗?我说没有只有一个,然后把答案改错,我是个傻子。4.如何指针类外访问私有成员?一开始是问如何访问私有成员,我说可以使用友元函数。忘了面试官怎么说的,但是引导我用指针去思考。我没写出来。后面查了一下,可以把类的指针转用reinterpret_cast成对应的数据类型,然后考虑此前类内的内存分布后,给指针位移去找到对应的变量。5.一些常规C++八股,智能指针和移动语义。6.问智能指针对象本身是不是线程安全的。7.问我自己写的一行代码,代码内容是用new申请一块堆内存,问这是不是线程安全的。8.c++的STL八股。9.问map和vector在已知key和下标的查询复杂度。我回答都是O(1)。10.c++sort是怎么实现的?我回答:我说根据数据量大小选择快排,堆排。不知道有没有归并,我没查过。11.用快排实现查询第K大的数。这个我写出来了,但是差以为,因为小标是0开始的,所以我实现的版本是第0大的数字是大的,而不是第一大的数字。#哪些公司面试官让你印象深刻?###金山###wps##牛客创作赏金赛##数据人的面试交流地##远程面试的尴尬瞬间##面试中的破防瞬间#
国棉17厂丶小王:sort是长度小于32选择插入排序。大于32选择快排,快排采用递归进行,如果递归栈的层数超过了1.5log n,那么就改用堆排,快排随机数的划分,40个以上采用九数取中,40个以下3数取中。(随机选择和递归深度msvc是这样的,其他stl不清楚),但是排序算法是这三个都一样的
查看11道真题和解析
点赞 评论 收藏
分享
头像
10-30 14:44
已编辑
门头沟学院 Java
数字马力一面-后端开发-长沙
1. 自我介绍2. java底层数据结构(数组、栈、链表、队列)的特性和使用场景3. 大量数据的存储用哪种方式合适4. jdk8的hashmap底层实现5. hashmap链表转红黑树的触发条件,以及什么时候转回去6. hashmap和concurrenthashmap的区别,以及后者如何保证效率的同时,保证线程安全7. 线程池的核心参数,以及执行顺序8. java里面用过哪些锁9. ReentrantLock的底层实现原理,AQS怎么实现10. CAS里面使用volatile 保证了什么属性实现这种安全性11. 内存中基于什么操作来保证的12. volatile修饰的变量有什么特别的吗13. 双亲委派模型14. jvm运行数据区的构成以及作用15. 垃圾回收算法16. 老年代和年轻代用的什么算法17. Rabbitmq的消息可靠性怎么保证,重复消费问题18. mq怎么保证消息的顺序性19. 怎么实现消息的幂等性20. MySQL中innodb底层索引实现和MVCC,以及MySQL默认的隔离级别21.  redis底层数据结构,为啥使用跳表不用别的数据结构22. redis持久化机制的方式,以及内存淘汰策略23. redis的缓存一致性怎么实现24. 分布式锁用吗?Redisson如何加锁解锁操作?25. spring的循环依赖怎么解决,哪种注入方式可以解决,哪种方式不可以解决26. Mybatis里面的xml如何解析成Spring的bean注入到容器里面的27. 统计每个接口总的调用次数,放在SpringCloud组件哪个位置28. gateway通常用来干什么的29. 做完这些项目最后挑战或者成就感的是什么反问环节。。。。。。ps: 面试官很好,不会的会解释,然后会跟着简历来问问题。10.30  进二面#数据人的面试交流地##数字马力面经##面经#
查看58道真题和解析
点赞 评论 收藏
分享
09-02 22:46
已编辑
武汉大学 Java
快手后端面经
💼公司岗位 :快手电商   Java后端开发工程师⏳投递进度条 8.21投递   8.29一面一面面经:1:自我介绍2:介绍项目3:项目中Kafka集群的作用是什么4:服务集群里 除了消费Kafka的消息 还有什么处理吗5:Kafka消费者组 是怎么确认分配对应的分区的,如果消费者组再多一个消费者会怎样6:为什么集群部署三台,Kafka的分区为何这样设计7:Geomesa数据库相比于Mysal数据库有什么优点 为什么要用Geomesa8:RediCluster集群 ,key是如何映射到节点上的,原理是什么9:如果RedisCluster的节点变化了,key的映射会变吗10:一开始Redis中没有数据,key是怎么存进去的11:项目里是如何保证数据库和Redis数据一致性的12:你RedisCluster架构下 如何某个key变成热点数据,redis压力大了怎么办13:如果让你创建一个索引,你会如何创建,从哪些维度来考虑14:给了两个sql 判断是否命中索引,联合索引15:实习中用到了SpringAOP用的是spring的吗16:说一下Spring AOP的原理17:SpringAop中的动态代理,都是同一种吗,实现了接口的和没实现接口的有什么不同18:项目中有redis的缓存穿透,击穿,雪崩,讲一下如何解决19:讲一下Java的synchronized和ReentrantLock的原理20:讲一下线程池的几个参数21:ReentrantLock底层的数据结构22:Redis的内存满了怎么办 有哪些淘汰策略23:算法题:关于链表的反问:1:对于新人的培养体系2:部门的业务:快手电商3:根据今天的表现,对我的建议问题全部答出来了 算法也写出来了。 期望有下次面试 #面经#  #校招#  #后端#  #秋招#  #数据人的面试交流地#  #java#  #后端#  #快手#
查看26道真题和解析
点赞 评论 收藏
分享
01-16 13:18
吉林大学 Java
《腾讯》24校招Java后端一二面面经
一面👥面试题目1.问项目。2.https能否抵御重放攻击?3.List remove第一个元素之后后面的元素会移动吗?4.Hash map =new HashMap(50)这个过程中map进行了几次扩容?5.使cache命中率最高的算法是?6.无法保证每趟排序至少能将一个元素放到最终位置上的算法是?7.阻塞和非阻塞网络io有什么区别,分别有哪些应用场景?8.用浏览器打开一个网址的时候会用到哪些协议?9.应用程序的日志都要记录哪些内容?10.Springbean如何保持线程安全? 使用局部变量可以保证安全,为什么不用实例变量?11.父子类静态代码块和构造函数的先后执行顺序?12.请列举ip地址和mac地址的区别?13.如何让三个线程按照指定顺序执行?14.手撕:对字符串Hello world! 进行反转,要求用递归的方法。🤔面试感受难度上来了,题目问的比较灵活,会按照实际的使用情况来提问,手撕算法属于网开一面。二面👥面试题目1.拷打项目2.两个后端程序通过tcp进行数据传输,是否有可能有数据丢失?3.怎么创建一个线程池?4.设置缓存区大小为8,根据最近五分钟访问次数排序,替换次数最少的缓存属于哪种缓存算法?5.介绍一下spring的事务隔离级别?6.解释一下ioc和aop?7.Mysql联合索引(a,b,c)相当于创建了a b c三个索引对吗?8.什么是半双工通信?9.实现接口的方法对访问修饰符有什么要求?10.Spring cloud是如何实现高可用性的?11.Mysql中innodb的主键索引跟其他索引的区别?12.聚簇索引中两个字段,一个类型是int,一个类型是varchar,在聚簇索引的叶子节点存储的数据类型是什么?13.  Jvm判断如何判断对象是否存活?常见的gcroot有哪些?堆里面的对象可以作为gcroot吗?🤔面试感受因为项目部分问的比较多,所以时间不够用没出手撕。八股的问的部分难度不大,结合项目出的场景题不好答,需要对自己的项目足够的熟悉和了解。  #牛客解忧铺#  #牛客在线求职答疑中心#  #我的失利项目复盘#  #数据人的面试交流地#  #24届软开秋招面试经验大赏#   #24届软开秋招面试经验大赏#
追忆似流水年华:老哥,这个该怎么回答啊,“聚簇索引中两个字段,一个类型是int,一个类型是varchar,在聚簇索引的叶子节点存储的数据类型是什么?”
投递腾讯等公司10个岗位
点赞 评论 收藏
分享
滴滴 数据开发 一二面 40+40min
查看10道真题和解析
点赞 评论 收藏
分享
大数据方向随缘解答
拉风的豆沙:大佬,请问大三现在转数开还来得及嘛?以前一直是做算法和数据分析比较多,而且数分还不是sqlboy的那种(主要是用py做的,sql也用但不多),科班学过java,但都仅限于课程项目的水平,应该不太够;大数据组件有一门课教过一些(hdfs,mapreduce,spark,flink),但是重点也是学习这些框架的底层原理以及基本的配置和部署,并没有实战经验。😰现在开始系统学大数据组件和数据仓库原理,明年2月底或者3月那会找到实习的可能性大嘛,希望大佬指条路
点赞 评论 收藏
分享
快手 数据开发 一面 70min
感觉自己和快手的相性不是很好,每次都和面试官不和,感觉应该是无缘快手1.自我介绍,大数据组件是自学的吗2.工作内容,定位,成果介绍3.前期调研也是你做的吗,怎么调研出的指标体系,耗时多久4.复购率是几日复购率,为什么选择这个天数不选择15天,你这个调研不够深刻,调研他的打法和业务目标不才是第一步要做的事吗5.有多少个维度和指标,为什么用grouping sets不用cube,介绍count distinct又被打断,无语6.数据怎么保障质量,你不要说详细的方法,我要听整个的方法论7.基线机制怎么保证的,数据延迟了怎么办,又说我说的是在搞笑,难绷8.介绍hive和spark,为什么不用spark sql而用hive sql9.spark的rdd包含哪些元素10.spark基于内存你是怎么理解的,如果我mapreduce把环形缓冲区开到很大,不也是基于内存了吗,你认为这两个的区别11.惰性加载的好处12.数仓方法论介绍13.数据跨域的问题(这个之前也被快手问过)14.数据倾斜介绍,说一半又被打断说这个数据倾斜在spark2.6已经被解决了,说我了解太少15.sql题:①多个个用户对在发消息,如果a发给b,b回复a则算一次完整对话,判断每个用户对共有多少个完整对话,并将完整对话连接到一起②直播间的最大在线人数和时长快手面试题感觉多面几次就都是重复的了。ps:面试官太喜欢反驳了,而且频繁打断我讲话,我还在说我们一开始选择的做法是巴拉巴拉,他就说你们这种做法完全不行啊,😅😅😅大概率和快手说再见了,悲伤 #数据人的面试交流地#
快手一面561人在聊 查看15道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务