【面试经历】2021秋招面试经历
4399 经营分析师
8.26 一面 建议转运营岗 35min
1 自我介绍
2 在携程实习做的什么内容?
3 之前有炒过股吗?找一个股票讲一下选择的原因。
4 如果要短时间内(比如一天)了解一个行业,你会通过什么方法/途径去了解?
5 家庭情况,工作地点
面试官表示经营分析师主要是拿公司闲钱去做投资,与自己的岗位预想不符合,建议转数据运营岗。
8.29 一面 数据运营 30min
1 自我介绍
2 讲一下携程做的事情。
3 如何对酒店订单用户进行分类?
4 你认为数据分析和数据挖掘的区别是什么?你想从事哪一方面的工作?
面试官评价说数据运营、产品的岗位的意向不明确,所以挂了。
顺丰科技 大数据分析与挖掘工程师
8.29 笔试
9.7 一面 23min
1 自我介绍
2 细讲一下美的做的银行新闻项目。
3 美的为什么要做银行风险的项目?
4 自动文摘的textrank算法的原理是什么?它是pagerank的改进还是应用在不同领域?
5 提取的句子如何保证顺序性?这个顺序一定是和原文一致的顺序吗?抽出来的摘要顺序不一定要按照原文顺序吧?
6 为什么kaggle比赛要用xgboost算法?
7 特征工程部分做了什么?
9.10 二面 28min
1 自我介绍
2 在携程用的什么大数据平台,有写过hive吗?处理的数据量有多大?
3 出行意图分布是要输出一个什么东西?对后续的分析有什么作用?
4 潜客分析是怎么预测的?
5 处理数据的时候,有没有对数据进行清洗?
6 业务题:现在有一张表,各个字段都有一些脏数据。问一:该怎么对数据进行清洗?(人工字符串处理;关联规则;机器学习方法)问二:该怎么评价清洗的结果是好还是坏?(随机抽取)
反问阶段,提问了面试官如何评价,面试官回答说还是要使用该表的人使用一段时间后进行反馈。
面试官提到我对数据量的处理已经达到要求,但是缺乏对数据的理解,应该多了解数据背景,然后再做分析。
华为 产品数据工程师
9.18 一面 50min
1 在学校获过什么奖?打过什么比赛?
2 介绍一下实习经历?
3 实习的时候用的什么平台?
4 写过数据存储吗?
5 数据备份了解吗?
6 解释一下什么是异常?
7 数据模型了解吗?你觉得京东应该存储的数据表有哪些?表与表之间的关系是什么?
8 数组和链表的区别是什么?单向链表和双向链表了解吗?
9 二叉树是什么?
10 回归模型了解吗?
11 讲一讲聚类方法。
12 什么是欠拟合和过拟合?
13 线性回归模型什么时候会出现过拟合现象?
14 编程题:n个人围成一圈,1-n编号,1-3进行报数,报到3的人退出,下一个人从1开始报数。问剩下的人是什么编号?
15 sql:表有两列a和b,如何找出所有b重复的记录?
屠杀现场,技不如人。
拼多多 数据分析师
9.23 一面 59min
1 自我介绍一下、实习细讲
2 出行意图分布和旅居地划分的规则是自己定的吗?
3 怎么样对你的结果进行数据验证?用什么数据和你得到的结果比?为什么?(面试官提出这里有漏洞)
4 美的实习的工作内容是什么?你觉得最耗费时间和最大的挑战是什么?
5 kaggle比赛对指标提升最大贡献的工作是什么?
6 xgboost调参调出了什么经验没?
7 题:抛一枚硬币100次,出现60次正面,请问这枚硬币均匀吗?
8 如果用z检验方法,应该是双边检验还是单边检验?
9 除了z检验方法还有什么方法?(我提到了模拟,面试官说还有卡方拟合优度检验)
10 中心极限定理怎么理解?和大数定律有什么不同?(答得很差,直接凉)
因为没有sql和业务题,因此反问了面试官的工作内容。面试官说他们组会做很多AB test,因此要对假设检验的原理比较熟悉。
第二个点,面试官提到做AB test之前很重要的一点是随机试验,会用到回归分析的一些方法,可以了解一下。
9.29 二面 57min
1 自我介绍一下
2 想做数据分析还是想做数据挖掘?给自己的定位是怎样的?你觉得数据分析师需要具备什么能力?
3 给一个场景题:怎么样识别一个商品的质量是好还是坏?(答了根据分布情况筛选)
4 如果只有一个变量价格,只根据价格较低划分商品质量,如何确定阈值?
5 假设已经确定了一个阈值,那怎么评估这个阈值的效果?
6 筛选的质量较坏的商品当中,怎么识别那些非质量坏的商品(例如降价销售、做活动的商品)?
7 你觉得漏判一个坏商品重要还是错判一个好商品重要?
8 了解相关性分析吗?
9 了解什么降维的方法?
10 sql:表log有字段mall_id,log_id,log_time,status(0表示异常),表示拼多多给店铺发通知。问1:筛选出所有异常的店铺(异常的店铺最近一次发通知的status为0)。问2:在所有异常的店铺中,找出通知状态列最后连续的log_id。(即最后连续0值对应的log_id)
tip:第2问用rows_number()开窗。
面试官是做风控的,用机器学习比较多。除了金融外,还有店铺欺诈行为预测等。
平安产险 橙星管培生(数统)
10.09 一面 群面 无领导小组讨论 60min
材料:一份科技产险设计文件(包含背景、10张条形图、饼图)+2张草稿纸+笔
按以下流程进行:
1 给8分钟时间浏览材料。
2 个人轮流发言,1分钟,说明10张图当中最重要的2张图,说明并阐述理由。
3 分组进行讨论,给出科技产险的设计方案。10分钟,并选出1位代表进行总结发言。
4 组间答辩,10分钟。每次只能一人发言,一人回答,不允许投票。
5 所有组合并,并选出1个代表进行发言,1分钟。
本次面试的问题在于分组讨论的时候不清楚什么是“保险设计方案”(对方组从定义、对象、主要应用场景等方面进行阐述)。
蘑菇街 数据分析
10.14 一面 简历面 15min
1 自我介绍
2 细讲一下实习内容。
3 你觉得遇到的最难解决的问题是什么?怎么解决的?
4 项目有多少人在负责?
苏宁 管培生(数据挖掘)
10.21 一面 35min
1 自我介绍
2 实习中遇到什么困难?怎么解决的?
3 潜在客户分析是怎么获取到这种划分规则的?
4 怎么判断做出来的结果是合理的?
5 阈值怎么选取?(根据历史数据,类似训练集和验证集思想)
6 数据存在异常值,怎么处理的?怎么知道处理后数据就不“脏”了?
7 python元组、列表、字典的区别?
8 字典的key可以是元组吗?为什么?(list不可以)
9 处理大文件时的python写过多少?
10 用过什么算法?svn的核函数都有啥?核函数的作用是什么?
11 高斯核和多项式核的区别是什么?
12 为什么选到南京工作?
13 了解苏宁吗?
14 职业规划。
太久没准备算法的知识了,基本一笑而过。。。虽然但是聊得很开心,面试官都被我逗笑了。
10.29 二面 语音面 30min
1 自我介绍
2 kaggle比赛的提升怎么做的?
3 实习经历一个个细问。
4 id3、c4.5、cart数的区别是什么?
5 会来南京吗?
面试官是北京base的研发,问题都不难,但是我已经很久没背过了,所以不抱希望。。就当多点谈资。
美团 业务运营管理岗
10.28 hr面 42min
1 自我介绍
2 你知道面试的这个岗位是什么嘛?讲一讲携程的实习经历。
3 这两个项目的输出是什么?项目周期有多长?
4 在携程工作的感觉是什么?
5 想做业务方向还是做技术方向?个人规划是什么?
6 如果拿到offer,倾向于实习还是在学校继续完成课题?
7 通用技能怎么样?写作能力、结构化能力?(个人理解就是公考的东西)
8 携程的工作时长是怎样的?
再一次和面试官聊得很开心。。。。面试官给我讲了很多岗位负责的东西,同时也问了我很多携程的东西(感觉是来套老对手的料。。)。不过美团主要作本地型,携程主要做异地型,面试官说目标客户不同,也不完全是竞争关系。
11.5 一面 27min
1 自我介绍
2 细讲一个实习经历,从背景、动作、结果三个方面讲。
3 导师对你的评价是怎么样的?
4 未来的职业规划是什么?从公司、行业、岗位三个角度讲。
5 工作强度有什么要求?
最后介绍了一下该组的职务。感觉这种面试很虚,和hr面一样,很难说讲的怎么样。
中移互联网 数据分析
11.5 hr面 15分钟
1 自我介绍
2 实习经历怎么找到的?为什么去了上海实习?
3 家里有兄弟姐妹吗?
4 个人规划怎样?
反问环节介绍了中移互联网是2015年成立的,坑比较多。
11.6 一面 15分钟
1 自我介绍
2 实习经历有没有完整的项目经历?挑一个讲一下?
3 了不了解产品的东西?比如说生命价值周期?
没想到突然问了简历外的东西,面试官也不太感冒我实习太短的时间。没有回答好。
唯品会 数据分析工程师(搜索)
11.6 一面 25分钟
1 自我介绍
2 未来的方向?
3 hive了解吗?
4 hive题:如何行转列?例如50条数据,如何把这几个数据拼接起来?
5 hive题:筛选出两个值,如何将它们显示成两个字段?
6 如果你来到唯品会,你怎么学习提升自己?
7 业务场景:如果老板说今年双十一目标是10亿,而结果只有8亿,怎么分析?
8 最近半年看了什么书?
最后反问了面试官第5题,他说用union,不管没怎么听懂。。。
11.11 二面 25min
1 自我介绍
2 实习经历那里学到了什么?除了技术方面的能力?
3 细讲一下竞赛经历?
4 未来规划是什么?从事什么行业?
5 你觉得从事金融行业的师兄师姐和从事互联网行业的师兄师姐的思维能力、处事能力有什么区别?
6 我感觉你更偏挖掘?(原地死亡。。强行挽回)
面试官说,我们这里的数据分析是开放的工作,都是为了促增长的。因为只招一个人,而面试官说我更偏挖掘,那就没什么希望了。
招行佛山分行
11.11 二面 群面 无领导小组讨论
形式同平安产险,无辩论。给定资料为保险公司相关资料,背景是要形成银保合作的具体方案。