泰科电子数据分析工程师社招面经


一面

统计教授多门课老师数量并输出每位老师教授课程数统计表

四个人选举出一个骑士,统计投票数,并输出真正的骑士名字

员工表,宿舍表,部门表,统计出宿舍楼各部门人数表

给出一堆数和频数的表格,统计这一堆数中位数

中位数,三个班级合在一起的一张成绩单,统计每个班级成绩中位数

交易表结构为user_id,order_id,pay_time,order_amount

PV表a(表结构为user_id,goods_id),点击表b(user_id,goods_id),数据量各为50万条,在防止数据倾斜的情况下,写一句sql找出两个表共同的user_id和相应的goods_id

表结构为user_id,reg_time,age, 写一句sql按user_id随机抽样2000个用户 写一句sql取出按各年龄段(每10岁一个分段,如(0,10))分别抽样1%的用户

问:Kmeans的原理

问:口答一个SQL题(要用到row number)

问:业务场景题,如何分析次日留存率下降的问题


二面

用户登录日志表为user_id,log_id,session_id,plat,visit_date 用sql查询近30天每天平均登录用户数量 用sql查询出近30天连续访问7天以上的用户数量

表user_id,visit_date,page_name,plat 统计近7天每天到访的新用户数 统计每个访问渠道plat7天前的新用户的3日留存率和7日留存率

你处理过的最大的数据量?你是如何处理他们的?处理的结果。

告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?

什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则?

什么是:协同过滤、n-grams, map reduce、余弦距离?

如何设计一个解决抄袭的方案?

#深圳市西博泰科电子有限公司##社招##数据分析师##面经#
全部评论

相关推荐

10-11 17:45
门头沟学院 Java
走吗:别怕 我以前也是这么认为 虽然一面就挂 但是颇有收获!
点赞 评论 收藏
分享
点赞 评论 收藏
分享
工作基本定了,比较满意。这深度学习真是难搞啊,论文看不懂,代码看不懂,不会改,创新点??? 还有一个月中期,怎么搞,已经抑郁了,没有小论文要求,我真是非常幸运了,不然就我这科研能力………… 感觉自己对自己失去信心,无时无刻不在否定自己取得一些成绩都是运气好罢了,真的能顺利毕业吗?严重内耗、无力感爆棚啊…………
AI牛可乐:哎呀,听起来你最近压力好大呀,毕业论文和工作的双重压力一定让你感觉像是背了两座山呢。深度学习确实挺复杂的,就像是要在一片迷雾中找到出路一样。但是,你已经很棒了,工作都定好了,这是很大的成就呢! 论文的事情,别太担心。每个人都有看不懂代码和论文的时候,这是正常的。至于创新点嘛,有时候灵感就像小猫一样,需要一点一点地哄出来的。你可以先试试把你看过的资料整理一下,说不定就能找到新的思路呢。 中期答辩前,你可以列个计划,一步一步来,把大问题分解成小问题,一点一点克服。记得,你不是一个人在战斗,你的导师、同学都是你的战友哦。 至于信心嘛,别否定自己,每个人都会有低谷的时候。你已经取得的成绩,都是你实力的体现。毕业不是问题,只要你不放弃,就一定能顺利走过去的。加油哦,我相信你可以的! 对了,如果你愿意的话,可以点击我的头像,我们私信聊,也许我能帮你出出主意,或者就是简单地聊聊天,分散一下你的注意力也好呀。🐮💪🌟
点赞 评论 收藏
分享
评论
4
15
分享
牛客网
牛客企业服务