小耗子呀 level
获赞
97
粉丝
76
关注
15
看过 TA
1683
National University of Singapore
2025
大数据开发工程师
IP属地:新加坡
暂未填写个人简介
私信
关注
0 点赞 评论 收藏
分享
9.12 一面结束后半小时飞速约了二面,9.14 二面- 自我介绍- 为什么读研- 为什么转专业- 你对大数据的理解- 介绍一下实习组内的分工、数仓架构- 以商品域为例,数据的模型/表有哪些,从哪些角度评价数据模型- 你们组具体的宏观的业务流程- 具体是怎么和其他部门协作的,流程是怎么样- 你是怎么理解数开的工作的,你个人的偏好是哪方向- 数据库的范式、事务- 范式建模、维度建模对比,适用具体场景- 你了解哪些排序算法,详细讲讲冒泡排序和快速排序- 对于小规模的数据比如学校成绩表、课程表等等建设数仓是否一定要使用维度建模- 看你写了 kimball 的维度建模,你对维度建模的理解- MR 流程- MR 的并行度是由什么决定的- 一个场景:两表Join,然后 group by 计算指标,写入一张表,这种场景可能会出现哪些潜在的问题- 你有很多任务优化的经验,你的具体思路是怎样的- 你之前谈到的数据质量,具体包括哪些,如何去实现的,以及如何量化- 你了解 Doris,ClickHouse 之类的 OLAP 引擎吗,和 Hadoop、Hive、Spark 这些有什么区别,具体场景是哪些- 你目前的秋招进度是怎样的,投了哪些公司- 没做题- 反问环节:业务、数仓架构、技术栈等
0 点赞 评论 收藏
分享
9.12 大数据一面,好像是抖音本地生活服务部门,话说字节约面是真的快,投的第二天直接约了 9.12 的一面,都没笔试以下内容都是简历强相关的:- 上来没自我介绍直接开问- 你怎么看待你B站和美团的这两段经历的关系- 本科和硕士专业的跨度挺大的,为什么- Spark 的 count distinct 是怎么做的- SparkSQL 做 Join 的时候有哪些 Join 算法- 对数据库有哪些了解?关系型和非关系型有哪些典型的产品?区别是什么?- 美团实习的介绍- 主题域的建设,工作的时候是偏整体建设视角还是对接一些需求去做一些事情- 为什么要建设商品主题域,你对它的认知是怎么样的- 你提到商品会作为维度和交易、流量主题有关联,那具体建设的时候会包含其他主题吗- 团队有多少人,怎么分工的- 实习过程中协作感受怎么样?是清晰的吗,还是说会涉及到一些边界的问题- 讲讲治理的工作,你实习三个月大概多少精力放在治理上- 总结复盘一下治理思路是什么样子的- 计算、存储、SLA治理这三部分,分别的目标是啥- 计算治理方面你提到OOM,怎么减少OOM- 除了事后调度时报错,有没有办法提前去识别任务可能出现的问题(比如有没有办法提前通过输入表的输入、计算的复杂度去在运行前提前判断任务会不会 OOM,来进行前置的预警)- 存储治理大概有几种方案- 大数据相关知识你的学习路径是怎么样的- 比方今天有很紧急的任务,存储的数据通过正常 SQL 解析太慢了,可能要通过比如写 Java UDF 或学一个新的方式去实现,你会怎么处理这件事情- SQL:找评分连续下降7天的商家
0 点赞 评论 收藏
分享
3.26 美团 数据开发 到店(暑期实习二面)- 面试官是一个温柔的小姐姐- 自我介绍- 之前工作经历介绍- 你觉得什么是好的数仓- 要达到你说的好数仓的标准,应该如何建设?- 小文件具体怎么治理的(预防/滚动式 + 自动脚本)- 小文件有哪些危害- 给你一个数据倾斜的场景,可能有点难,答不出来也没事:大表 Join 大表(10 亿级别的,比如订单 Join 商品表)可能有一些商品销量特别好,数据倾斜,要如何解决?(采样热点 key,一张表 1-N 加盐,一张表扩容 N 倍)- 上面的题是美团的数据倾斜经典问题了,具体可以参考他们自己的技术博客:[Spark性能优化指南——高级篇 - 美团技术团队 (meituan.com)](https://tech.meituan.com/2016/05/12/spark-tuning-pro.html)- 更熟悉 Java 还是 Python?写一个冒泡排序- 写一道 SQL:SQL276 牛客的课程订单分析(六)- 讲一个你之前项目中遇到的一个困难,你是如何解决的- 讲一个你的缺点- 假如这次面试失败,你觉得会是什么问题- 你是如何学习新知识的- 国外工作还是选择回国- 什么时候能够实习- 反问:具体做什么业务的?到店-数据智能(好像是),最近在做的项目是特价团购,面试官说了超级多,离线、实时数仓建设、数据分析、数据应用都有,然后总结说是个好组好业务(“可以去看财报”)。- 反问:只有两面吗?面试官:对。什么时候可以知道结果?面试官:一周之内。🍡团子拜托啦  许愿 OC----------------------------Update:4.1 OC + Offer 邮件我直接一手接受 Offer!感谢团子🍡😎
0 点赞 评论 收藏
分享
- 美团:到店事业群--平台技术部(暑期实习一面)- 上来面试官说看你简历挺匹配的,I'm like whaaaaat- 自我介绍- 为什么去读研了- 你们团队多少人- 你们数仓怎么分层- 你主要负责哪几层- ODS 数据从哪来,怎么接入数仓- ODS 表是什么事实表类型?更新方式?- ODS 到 DWD 做了哪些处理?- DWD 有哪些表,事实表如何设计的?- 你提到了数据字典,解释一下- 通过什么实现的(数据资产管理的平台)- 数据库 vs 数据仓库- 数据库为什么要减少冗余(数据更新导致数据不一致)- 数据仓库有冗余,如何保证一致性(我讲的更多需要人为的干预+平台功能)- 数仓分层的意义- Spark 的 stage 是如何划分的- 哪些算子会出现 Shuffle- 小文件优化,小文件是怎么产生的- Map 端造成的小文件问题怎么处理- 表存储优化:小文件治理、生命周期治理、下线无用表- 生命周期治理是每一层生命周期不同吗,考虑哪些方面- 分桶表的场景- MySQL 的索引一般是用什么数据结构- 介绍 B+ 树- 索引匹配原则- 写一个 SQL:[SQL270 考试分数(五)](https://www.nowcoder.com/practice/b626ff9e2ad04789954c2132c74c0513?tpId=82&tqId=35496&ru=/exam/oj)- 反问:部门业务?美团数仓建设?公司平台建设情况?- 感觉面试官明显对数仓建设、数据治理、数据一致性之类问题更感兴趣,Hive、Spark 之类的框架八股基本没问,算法题更是都没出,只出了一道中位数的 SQL(然后我写的 SparkSQL 牛客网还跑不了,面试官 be like 没事,差不多就行了 -_-||)- 心路历程:第一次面试有点紧张,虽然问题都非常简单,但我很多地方表达的不是很顺畅,有几个问题一开始都没 get 到面试官的点,感觉情况不太乐观。面试官很好,奈何我不够给力,哈哈。许愿二面 😥-------------------------------------------Update:3.25 刚刚收到电话约了二面Update:字数不够了,二面面经在动态
三石大数据:全是数仓理论啊 可以看看这篇文章https://www.nowcoder.com/share/jump/2610386661711076657018
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务