美团暑期实习数据开发工程师一面+二面
4.8一面
面试官先简单自我介绍,说是金服业务,业务和支付宝类似,主要做一些数据开发工作。
自我介绍
你的项目其实是偏算法,我们这个是数据开发,你了解过吗
有过实习经历吗
有收到其他公司的offer吗
项目详细介绍
是不是类似聚类想法
和pearson相关系数什么区别(度量向量相似度)
学过聚类算法吗
讲一下k-means
这里的距离和你项目的距离有什么区别
项目优化的效果,有发论文吗
对实习工作的预期,了解过大数据开发吗
算法题:根据中序遍历和后序遍历还原二叉树,leetcode106。bug没de出来,说了下思路。
学过Java吗
倾向于后台开发还是大数据开发
以前了解过Hadoop和Spark吗
学过数据库和数据结构吗
对自己的职业发展有什么打算,后台还是应用
学习成绩怎么样
班级里担任过班干部吗
日常的兴趣爱好
最后问我学校在哪里,我说北京,面试官说他们在上海,问我能不能去,我:不太能
我记得当时投递的时候只选了北京来着,也不知道为啥被上海的部门捞了,尴尬😭
感觉就是面试官不是很了解我做的项目,我之前也没准备过大数据开发的东西,全程有点无效沟通。
4.12二面
忘记录音了,列一下问到的题吧。
- 有一个苹果,两个人抛硬币来决定谁吃这个苹果,先抛到正面者吃。问先抛这吃到苹果的概率是多少?
- 数据源到应用层,有1000个任务,有依赖关系,比如
A->B-->C A1->B1->C1 A1->B1->D1
有的任务比较重要、有的不那么重要。设计调度系统,目标:
1)重要性高的任务,尽快的执行完
2)所有的任务,尽可能的快速执行完
- 有一个文件,文件有100GB的整数数据(有重复)
有一台服务器,内存1GB、存储是1TB
目标:对文件进行全排序