腾讯数据分析提前批春招面经

lz 3-30下午面的,呜呜呜,之前意向部门投的是教育好像,或者是广告,竟然竟然没被捞,被其他部门捞起了,有点小失落。

总结:

1、形式
腾讯会议,一个面试官,未开摄像头
2、内容

简历:

详细讲讲你简历提到的遇到数据质量问题、或者口径不一致的处理
你刚才说的偏经验性发现问题,有没有是制定了完整的体系验证数据质量
讲了你提到的AB TEST
拆解异常指标的体系

统计学:

1、AB TEST 中用到的统计学的相关的方法你会吗,基于独立样本t 检验之类,说了我们之前在流量分层的、很多地方没有做的特别好吗,并且对于结果没有很好的定性的严谨的统计学评价,
···害,lz 这块因为实际工作当时真的不严谨,就解释了一下,瞎掰扯了自己学过什么,样本量确定之类的多余知识,也不知道能不能弥补
2、AA TEST 会吗,lz 直接 有点懵。这是个啥呀,现在想想 也是可以瞎猜出来的,实验变量就那么几个,如果不是AB ,AA的 话,那可以再控制的就是时间,换流量,好吧,好像查资料后我的理解并不对,附上解释和链接:
在大多数其他情况下,A / A测试是一种再次检查A / B测试软件的有效性和准确性的方法。您应该查看该软件是否报告控件和变量之间存在统计上的显着差异(统计上的显着性> 95%)。
如果该软件报告存在统计上的显着差异,则说明存在问题,您需要检查该软件是否已在您的网站或移动应用程序上正确实现。”
3、假设检验的两类错误

HIVE:

用的多吗
常用的函数,问了order by  sort by 的区别
数据倾斜原因大概会是
数据倾斜的解决方案
如果场景出现在是join 的时候数据倾斜怎么解决

反问:

lz 是在是非专业的计算机渣 ,特别怕用算法,问了对实习生期待,比如会要求算法吗

面试官 讲了大概所在的部门在做的事情大概是,然后接下来的话震惊了,给lz 一顿上课,醍醐灌顶,算法也是我们支持数据分析的一个过程,你用什么什么 方法的时候 ,,,怎样怎样,但是可能用算法的时候,我们的feature很容易找到,,,,这块lz 其实大概已经听不太懂,
中心意思就是,不会也行,但是算法对业务帮助很大。

呜呜呜:

感受,渣渣表示之前寒假的时候,滴滴挂了4个,2一面,2二面,当时统计学是真的渣,建立内容也说不清,甚至两类错误都答不出来,更不用说hive ,数据倾斜听都没听过。不管这次被捞起或不捞吧,lz 觉得能答出来真的很感动了。

最后渣渣许愿许愿,祝看到的大家都成功上岸!



#面经##腾讯##数据分析师##校招#
全部评论
卷太严重了,分析要个毛的算法,就算要也是临时提一下就会的
1 回复 分享
发布于 2021-04-07 00:15

相关推荐

字节 飞书绩效团队 (n+2) * 15 + 1k * 12 + 1w
object3:百度吧,都干程序员了别想着一个地方呆一辈子了,选个好业务,百度干一两年跳槽字节
点赞 评论 收藏
分享
#软件开发笔面经# Timeline:2024.1.9 面试Boss直聘沟通面试流程:公司要求驻场开发,接受加班,接受出差你是25届是吧?能在六个月左右是吗?目前在校吗?后续有什么规划?你怎么理解数据开发这个岗位的?讲讲简历上这两个项目?是你在学校做的是吧?项目你是全程参与是吧?聊天这个项目的数据源是哪里来的呀?项目整体是落在HDFS上是吧?单一架构,嗷,然后可视化,是哇?下一个电商项目介绍一下?数据来源讲讲?那意思是已经讲,非结构化数据已经转换成结构化数据了是哇?进入MySQL中数据量有多少?数据拉取的工具是什么?MySQL增删改查了解不?接触过数仓分层没?具体讲讲你认为分层的优势是什么?有没有接触过其他的数据库?或者其他体系?讲一下用户日志分析的特定维度那么产出的一些指标呢?有哪些?项目面向一些案例化的群体是吧?维度考核的指标是什么?那你怎样保证数据一致性和完整性的校验?校园经历也是Hadoop这一套?你实习为什么做了3个月?实习经历的收获介绍一下实习过程中对你帮助比较大的点你认为实习经历和项目经历的区别处理数据过程中有没有什么比较困难的点,简单介绍一个你之前直接对接过客户吗?你对我们公司有过了解吗?出差有什么问题?多久能到岗呀?反问环节:团队和主要工作:为医院做数据治理,院内数据抽取分析,数仓模型开发,数据展示数据量级:亿级前期偏向离线还是实时:都有,根据业务场景会具体细分
查看29道真题和解析 软件开发笔面经
点赞 评论 收藏
分享
评论
8
40
分享
牛客网
牛客企业服务