美团 大数据开发 暑期实习 一面

时长:1h
由于问题太多,分四类进行整理

0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式
1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);HDFS的读写流程;Spark shuffle的过程(不太了解,只讲了个大概)

2. java基础的问题:HashMap底层原理(链表+数组 & 红黑树);又问了对红黑树的了解,能讲个大概原理就行,对细节要求不高

3. 数据库问题:数据库的索引的数据结构(这个不太了解);ACID;数据三范式(1NF, 2NF, 3NF)
做题:
1. sql题:从成绩表中得到总成绩排名第三的学生id和成绩;将表中一列转换成一行(e.g. 表属性为[dt, col1, col2], 转换为[dt, key, value], 其中key为col1,value为col1列中所有数据)
2. 快速排序(快排出场率真的好高)
3. 海量数据题:从两个数据量50亿的文件中得到相同url(hash写到多个小文件+hashmap)

#面经# #大数据# #暑期实习#
全部评论
兄弟是哪个部门的呀?
3 回复 分享
发布于 2023-03-18 13:23 广东
笔试五道题做出来几道?
2 回复 分享
发布于 2023-03-18 13:45 重庆
美团大数据和鸡架都不捞我 哭死 投后端搞鸡架被说能力不匹配
1 回复 分享
发布于 2023-04-14 14:54 上海
兄弟,有二面消息了没
点赞 回复 分享
发布于 2023-03-20 15:46 陕西
请问海量数据题是要写代码吗?还是说个思路就可以呀?
点赞 回复 分享
发布于 2023-03-19 11:50 摩尔多瓦
hxd,笔试是什么题型分布啊?明天笔试
点赞 回复 分享
发布于 2023-03-17 23:54 上海

相关推荐

3.21 一面自我介绍有一个新的业务,你会怎么做?(数仓建模方式)数仓分层有什么好处介绍一下Spark的join方式(broadcast join, shuffle hash join,sort-merge join)shuffle hash join 和 sort-merge join Spark常用的join是哪个?介绍一下MapReduce的执行过程Hive SQL优化星型模型、雪花模型的区别及应用场景介绍项目,项目分层是如何实现的项目的ods层数据是如何得到的,dws层是如何设计的sql : 1、求在线店铺的月累积销售金额 2、求相邻在线店铺的月累积销售金额的差额sum() ove...
OceanRivers:感觉现在的企业是真抽象,找实习生要求要有实习经历(我要是有实习经历还要来找实习吗),这和校招招应届生的要求有啥区别,按这逻辑以后是不是毕业找工作直接要求一年以上工作经验,也不知道是现在行业卷到这地步了还是企业单纯不想花更多资源培养新人,就想着招有工作经验的牛马,入职直接酷酷工作,然后给他发实习生水平的薪资当廉价劳动力
查看18道真题和解析
点赞 评论 收藏
分享
评论
24
107
分享

创作者周榜

更多
牛客网
牛客企业服务