快手一面二面三面 数开面经

数据研发工程师,base杭州
8月14日投递


8月18日一面
1. 问了一点项目,项目中的亮点,我用了Redis,根据Redis展开提问(太紧张直接宕机)
2. 手撕力扣1
3. 手撕力扣2
4. Zookeeper在 HBase/kafka 的作用是什么
5. Flink checkpoint
6. 状态后端知道啥,说优缺点
7. CK的流程
8. CK失败怎么办(不会)
9. FLink数据倾斜(忘了)
10. Java Treemap/HashMap(没背)
11. 手撕单例(投降,直接说我对java准备的不是特别多)
12. 写了一个HashMap问我size是多少(答错了)
13. 说一下对于JUC的了解
14. ReenTrantLock/Synchronized,区别,谁是可重入,谁是公平,ReenTrantLock一定是公平的吗,最后问了一个方法是属于那个类?(听都没听过)
时长1h10min,太快了,还没准备就来了。面试官人很好,最后我答不上来他说已经够了(哭死),反问环节没准备,啥都没问。当晚约二面

8月21日二面
确定部门音视频开发部
1. ClickHouse为什么快
2. HBase 元数据存在哪
3. 维表数据为啥存HBase(没答好)
4. 为什么使用HBase
5. 手撕,花了很长时间写了快半个小时急死我了
6. 反问 主要用Flink做什么业务
7. 问 看我选的base杭州,可以接受北京吗(直接我都可以)
时长1h,项目都没问啥,感觉都是项目延伸出的八股。当晚约三面

8月24日三面
1. 说一下科研项目(说了一半被打断,他说我不是想听你具体做了什么,而是想看你处理问题的能力,我还是经验太少了)
2. 说一下实时数仓的亮点(我说了旁路缓存和异步IO,)
3. 手撕,他自己出了个开放题,求两个字符串的相似度(DP写了,Longest Common Subsequence)
4. 说一下FLink的CK和Watermark
5. 有阅读英文文献能力吗?
6. 反问 主要用Flink做什么业务(同样的问题,主管回答的很全)
时长40min,本来是22号,面试官有事推迟了,是个主管

8月30日HR面
28号通知HR面
#快手# #快手24秋招# #大数据# #数据人的面试交流地#
全部评论
老哥这是数仓岗位吗
点赞 回复 分享
发布于 2023-08-28 18:08 湖北
大佬太牛了
点赞 回复 分享
发布于 2023-08-28 19:55 四川
电子的巨佬
点赞 回复 分享
发布于 2023-08-31 01:48 浙江
oc了嘛
点赞 回复 分享
发布于 2023-09-23 10:35 辽宁
请教大佬之前是做过数开实习嘛?想往这方面转 但感觉很难找第一份相关工作
点赞 回复 分享
发布于 2023-11-15 16:19 美国

相关推荐

#牛客创作赏金赛# 在当今的数据管理领域,诸多问题亟待解决:1. 数据不流通:数据地方保护主义盛行:各地区或部门出于自身利益考量,对数据进行封锁与割据,形成数据孤岛,严重阻碍数据在更大范围内的共享与流通,如同设置了重重贸易壁垒,使数据难以自由流动,无法发挥其整合后的巨大价值。2. 口径不统一:指标同名不同义、同义不同名现象频发:相同名称的指标在不同业务场景或部门中含义存在差异,反之,同一概念又可能被赋予不同的指标名称,这使得数据的理解与整合变得异常艰难,犹如不同语言体系下的混乱表达,极易造成沟通障碍与分析偏差。3. 工具不统一:各种 BI 工具百花齐放却缺乏整合:市场上 BI 工具种类繁多,每个工具都有其独特的功能与特点,但由于缺乏统一规划与整合,企业在使用过程中往往面临工具兼容性、数据迁移等诸多问题,如同各种风格迥异的乐器杂乱演奏,难以形成和谐的乐章。4. 边界不清晰:业务系统报表与 BI 报表职责界定模糊:业务系统报表和 BI 报表在功能、应用范围等方面没有明确区分,导致在数据呈现与分析过程中出现重复劳动、数据不一致等情况,仿佛两块相邻土地的权属不明,引发诸多争议与混乱。5. 权限难管控:复杂权限体系令人困扰:随着数据的增多与业务的复杂,权限管理变得极为复杂,不同层级、部门、岗位对数据的访问权限难以精准设定与有效控制,好似一座迷宫,管理者在其中迷失方向,容易出现权限漏洞或过度授权等风险。6. 响应不及时:贯穿所有部门的数据需求难以快速满足:各部门对数据的需求日益增长且多样化,但由于数据处理流程繁琐、资源有限等原因,数据提供方往往无法及时响应,导致业务决策因缺乏数据支持而延迟或失误,就像快递在漫长的运输途中耽搁,错过最佳使用时机。7. 指标不体系:指标关系树尚未构建完善:指标之间缺乏系统性的梳理与构建,未能形成完整的逻辑关系树,使得数据分析师难以从宏观层面把握数据全貌,在分析过程中犹如盲人摸象,只能获取片面信息,无法深入挖掘数据背后的内在联系。8. 指标难管理:基于指标平台的全生命周期管理亟待加强:指标从定义、采集、存储到应用、更新等整个生命周期缺乏统一有效的管理平台与规范流程,导致指标的准确性、一致性与时效性难以保障,如同没有管家的豪宅,物品杂乱无章,难以有效利用。9. 指标不准确:指标质量审计环节薄弱:对于指标数据的质量缺乏严格的审核与监督机制,无法及时发现与纠正数据偏差、错误或异常值,使得基于不准确指标得出的分析结果与决策建议可能产生误导,仿佛在错误的地图上导航,必然偏离正确方向。10. 指标不会用:缺少指标故事线辅助理解与应用:虽然有众多指标数据,但缺乏将指标串联起来形成有逻辑、有情节的故事线,导致业务人员难以理解指标含义与应用场景,无法将数据有效转化为实际行动方案,如同拥有众多珍珠却缺少串线,难以制成精美的项链。
点赞 评论 收藏
分享
评论
6
61
分享
牛客网
牛客企业服务