陌陌数据仓库一面面经

10月15号视频面试,首先是自我介绍,楼主说自己平常python用的比较多,所以面试官先问了一些python的问题:
说一下python的装饰器
说一下python的反射机制
说一下怎么用shell脚本取两个文件内容的交集(每一个文件有一列数据,Awk)
说一下数据库索引的几种类型
说一下索引的底层实现原理
说一下JAVA的内存管理机制(如果老年态发生了溢出,应该是什么问题【导入jar包过多】)
说一下ZOOKEEPER的分布式锁实现方式
如何解决数据倾斜问题(假设某一天的数据量比其他日期数据量大很多的情况)
如何实现并行导出大量分区数据
出了两道编程题:
  1. 多叉树  a[3, 3, 3, -1, 2]
数组中每个数代表此下标元素的父节点的下标,eg:第一个元素的下标值为3,所以第一个元素的父节点是a[3], -1 代表根节点
求该树的深度?
2. 文件(输入):
user1 user2  is_friend
user2 user1  is_friend
user1 user3  is_friend
user3 user1  is_friend
user4 user5  is_friend
user5 user4  is_friend
user2 user5  is_friend
user5 user2  is_friend
题目:使用sql或者MR求出共同好友列表
输出eg:
user1 user2  common_friend_list()
user1 user5  common_friend_list()

总时长约一个半小时(楼主在上面两道编程题花了很久),面试官很nice,最后被告知没有通过。。。

面试官给的一些建议
  1. 应届生在没有多少项目经验的时候只能考察基础知识,尤其是数据结构与算法,所以平时应该多想多敲算法题,提高自己的算法思维敏捷度和代码速度。
  2. 对于本科生而言,能进大公司,那么有充足的发展空间和时间,如果不能进大公司,那很大一方面靠机遇和自身的定位。
  3. 对于要不要读研来说,读研会提高你的视野,让你的理论和思想上升一个层次,但这并不是绝对的,得看你的能力和学校的水平,如果觉得自己的发展有瓶颈的时候可以选择读研
全部评论
我去,啥时候通知,才面完视觉岗位
点赞 回复 分享
发布于 2017-10-18 20:25
感觉好难啊!!!!!
点赞 回复 分享
发布于 2017-10-16 22:00
不太懂,Python动态语言,各种元编程,哪里来的反射=_=
点赞 回复 分享
发布于 2017-10-16 21:20

相关推荐

希音这家公司也是第一次面试,感觉整体还是偏难的1 先做个自我介绍2 讲一下你目前做的项目,主要是用了哪些技术栈,解决了哪些问题,做了哪些优化3 对于数据湖你能说一下各个湖仓的优缺点吗,你目前用的哪个,主要是用了哪一块技术和实现4 对于flink来说,对于一条主流一天有千亿级别数据,目前对于数据实时写入Doris存在这性能瓶颈,第一个问题是解析比较慢,第二个精确一致写入比较慢,你如果来优化需要怎么入手,对于优化的话怎么实现不延迟不oom5 目前有个场景,需要每10秒看到某个APP的主页的实时uv并且需要取top100个页面,你来实现如何做到实时秒级计算和展示,数据量级有亿级起步6 对于离线模型,如果存在一个画像需求,对于某些人群或者漏斗需要做到每天周期2点前产出,你如何保证这个时效性7 目前你建设模型是怎么建设的,如何确保你这个模型是合理的,有啥量化的8 对于数据倾斜如何快速定位,如何实现快速解决数据倾斜,除了加资源和join改变还有啥方法9 对于数据治理有啥好的办法快速治理,你来主导治理的话主要是从哪一块入手,解决哪些问题10 来个SQL题目,取一支股票的最大利润11 有啥需要找我了解的我这还是第一次面试这家公司,给我的感觉似乎还比较难啊,技术深度算是比较深了,对于面试的人来说必须要有这方面的经验才能解决上面的问题,要不然感觉估计答不出来
查看10道真题和解析
点赞 评论 收藏
分享
头像
04-23 15:28
南京大学 Java
攒人品ing~基本信息一、 项目深挖与常规问答自我介绍:面试官提问:挑一个花费时间最多、最重点的项目介绍,并罗列一两个难点。后续追问:目前项目的访问量多大?(如实回答目前仅作个人和朋友测试使用)。二、 计算机基础与后端八股操作系统与网络问题 1:Python多进程解决OOM问题,为什么不用多线程?问题 2:进程和线程在操作系统层面的核心区别是什么?问题 3:FastAPI 服务端延迟极低,客户端发起请求时,TCP 建立连接的过程是怎样的?问题 4:项目中实现在线推送为什么使用 WebSocket 而不用 HTTP 轮询?JVM 基础问题 1:Java 程序运行时,JVM 内存分为哪几块?问题 2:堆里的对象是一定会被回收的吗?问题 3:引用类型会被回收吗?Redis问题 1:项目中的布隆过滤器、互斥锁、逻辑过期分别是解决什么问题的?问题 2:逻辑过期和物理过期的区别是什么?问题 3:HyperLogLog、ZSet、Bitmap 的底层原理和适用场景是什么?问题 4:场景题:如何统计最近七天内每天都活跃的日活用户交集?消息队列 (RabbitMQ)问题 1:如何保证消息百分之百入库?描述消息从生产到消费的完整可靠链路。问题 2:死信队列里面是怎么处理的?问题 3:怎么保证消息的幂等性?数据库 (MySQL)问题 1:索引场景题:有用户表、签到表(自增ID,user_id,签到时间,状态),要查某个用户某个月的签到记录,怎么加索引?问题 2:如果不用 Redis,直接在 MySQL 层面避免高并发下的重复点赞,怎么设计?问题 3:如果并发量很大,使用乐观锁和悲观锁的区别?使用悲观锁有什么问题?三、 算法与代码手撕题目 1:实现 `O(1)` 时间复杂度的 LRU 缓存题目 2:合并 K 个升序链表四、 AI 与大模型工程问题 1:RAG(检索增强生成)的工作流分哪几步?问题 2:RAG 知识库生成的步骤是什么?问题 3:向量检索时,怎么判断相似度?问题 4:你项目里的 Agent 架构是怎么设计的?五、 反问环节提问:如果有幸入职,主要会做哪些工作?难点在哪里?提问:腾讯内部对使用 AI 辅助编程的态度是什么?提问:对我今天的面试表现有什么评价或建议?
雾已散声宜慢:后续:已约二面
查看28道真题和解析
点赞 评论 收藏
分享
05-02 22:50
门头沟学院 Java
继续来分享下最近的面经~欢迎友好讨论,信息共享1.实习拷打2.你刚刚说用AI写的那套东西,能介绍一下你具体做了什么?从AI写代码到交付,整个流程是怎么弄的?3.你的项目有前后端吗?大概结构是怎样的?怎么让AI帮你搞出一套能线上正式运行交付的东西?4.你实现这个项目涉及到哪些应用、中间件组件?我需要你说明系统设计的技术选型、底层逻辑,比如爬取后做什么,完整的业务流程讲清楚。5.如果是公司里的实际场景,比如有几十个应用,涉及前端、后端系统,要改一个需求可能需要改多个系统,你让AI怎么处理?6.你用的是什么模型?7.做这个项目消耗了多少token?8.开发中token很昂贵,节省token有哪些方式?9.SDD/TDD这块了解吗?10.那你知道创建一个skill有哪些方式吗?除了自然语言描述,还有什么方式?11.说一说你对function calling的理解。12.function calling和MCP相比,是不是可以没有MCP?13.MCP和客户端通信有几种方式?你怎么配置MCP?14.function calling是通过什么告诉大模型有哪些工具可用?15.大模型使用MCP调用查询天气工具,整个交互流程大概是怎样的?不用太细。16.笔试的时候,你是怎么和系统交互的?没改代码吗?17.你怎么确保AI写的代码没问题?用的是单agent吗?18.单agent和多agent相比,多agent的优势在哪里?19.能用英文口语说1分钟左右吗?20.你平时用的数据库是MySQL吧?如果线上数据量特别大,分页查询变慢,拿到这个优化任务,你的操作步骤是怎样的?21.如果单纯是数据量大导致深度分页查询慢,优化思路是什么?22.MySQL的索引结构你了解吗?为什么是B+树,而不是红黑树、平衡二叉树或者哈希结构?23.HashMap的1.8和1.7相比,做了哪些优化?24.除了结构和插入方式,还有其他优化吗?为什么插入方式会不一样?25.线程池用过吧?它的核心参数有哪些?原理是怎样的?26.Redis你使用了哪些场景?怎么实现的?27.Redis实现分布式锁的原理是什么?28.如果锁的过期时间是1分钟,任务还没执行完,其他人会不会抢锁?29.(看门狗机制下)如果任务一直卡住,其他人是不是都拿不到锁?
查看28道真题和解析
点赞 评论 收藏
分享
评论
点赞
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务