腾讯数据分析突击电话一面
正当我以为秋招要结束的时候,腾讯这个小妖精就打电话过来了……
1、自我介绍
2、讲一个项目,讲自己的贡献
3、解释一下面向对象
(1)类只有方法吗?还有属性吧
(2)解释一下继承
4、解释一下多态
5、解释一下栈和队列
(1)如何用两个栈实现队列
(2)就说说pop方法怎么实现吧
6、介绍一下链表
(1)指针保存的是什么?
(2)如何判断链表有无环?(双指针)
a、时间复杂度?O(n)
b、空间复杂度?O(1)
7、讲讲排序算法
回答:按照O(n^2)和O(nlogn)去介绍
(1)哪些是稳定的排序?或者说不稳定的也行
(2)那你说说快排,最坏情况是什么?O(n^2)
8、hive用过吗
(1)数据倾斜是什么?
(2)数据倾斜怎么解决?
(3)有sql优化的经验嘛?
9、智力题
(1)64瓶药,有一瓶有毒,小白鼠喝了3天后会死。现在只有3天时间,至少需要多少只小白鼠?(每只可以喝任意瓶药)
(2)(我说可以联想到秤砣的问题,但小白鼠题不会)那你说说8个秤砣,至少称多少次可以找到1个轻的?(2次)
10、你说你熟悉机器学习算法
(1)马尔科夫晓得不
(2)(不懂,但是我了解分类算法)那你说说有什么分类算法
(3)说说逻辑回归和线性回归的区别
11、你说你做过用户画像,怎么做的,选择什么特征
12、word2vec了解吗
(1)常用的相似度计算方法
(2)余弦相似度适用场景
知识点:
- 余弦相似度 vs. 欧式距离
- 余弦相似度更关心方向上的相对差异,欧氏距离关心数值大小上的绝对差异
- 若向量是归一化的,那么余弦相似度和欧氏距离呈正相关
-
- 指针保存是什么?下一个节点的内存地址
- 双栈队列
- 一个栈为push栈,一个栈为pop栈。事实上,将push栈倒入到pop栈,pop栈弹出的顺序即为队列。
- 注意:
- push栈倒数据一定要将所有元素倒进去pop栈。
- 若pop栈非空,不能倒数据。
-
-
- 数据倾斜
- 分配不均。某些key对应数据量特别大,使得某个task耗时长
- 解决方法
- 在map端进行group by聚合
- 小表join大表,“把重复关联键少的表放在join前面做关联可以提高join的效率”
-
-
总结:
面试官是小姐姐,全程感觉她不是特别有耐心的样子,如果一道题我犹豫一会儿了,她会问我有没有想法或者换一道题了。特别是讲项目经历的时候,她更关心结果和我的贡献。总体来说确实如网上所述,腾讯的数分考察很多的计算机基础、机器学习的部分,还没考察业务理解。
反思:
突击电话面试时,可以申请喝口水,尽快冷静下来,进入状态。
#腾讯##面经##数据分析师##校招#