数分面试记录(易车 滴滴 网易)

面试记录
3.18易车-数据分析一面
1、自我介绍
紧张,回答的很磕巴
2、研究方向是什么
机器学习在生物信息领域方面的应用
3、讲一种你熟悉的算法
项目用到的梯度下降法
4、参数怎么设定
项目相关
5、想做算法方向还是业务的分析?为什么
业务方面,原因没有回答好
6、你有什么问题吗?
我问面试官最看重求职者的什么能力?回答说觉得我做数据分析有点浪费,应该做数据挖掘方向。

结果:加了微信,通过了简历筛选,说现在招的需要现在来,暑期有合适职位再联系

7.11 滴滴 数据分析实习一面
1、自我介绍
2、三道SQL
(1)order表(ID,城市,order_id)求下单城市大于等于2个的用户数
Select id ,城市,count(distinct *)as num
From order
Group by 用户ID,城市
Having num<=2
(2)用户次日留存率,order表(日期、ID,order_id),全量表
1.表的自关联,筛选出右表日期大于左表日期的记录;
-- 1.自关联,筛选右表日期大于左表日期的数据
SELECT
* FROM
(SELECT user_id, dates FROM temp_trade GROUP BY user_id, dates) a
LEFT JOIN ( SELECT user_id, dates FROM temp_trade GROUP BY user_id, dates ) b 
ON a.user_id = b.user_id 
WHERE
b.dates >= a.dates

2.求出每日用户活跃数;
-- 2.每日活跃用户数
SELECT
a.dates,
count( DISTINCT a.user_id ) FROM
( SELECT user_id, dates FROM temp_trade GROUP BY user_id, dates ) a
LEFT JOIN ( SELECT user_id, dates FROM temp_trade GROUP BY user_id, dates ) b ON a.user_id = b.user_id 
WHERE
b.dates >= a.dates 
GROUP BY
a.dates;

3. 求出各日留存数;
核心要点:count( DISTINCT ( IF ( DATEDIFF( b.dates, a.dates ) = 1, a.user_id, NULL ) ) );
自关联的两张表a,b,判断两张表的日期差,以次日留存为例:两表的日期差为1,则该用户记为留存户,否则不计入。
-- 3.留存用户数计算
CREATE VIEW user_remain_view AS 
SELECTa.dates,count( DISTINCT a.user_id ) AS user_count,
count( DISTINCT ( IF ( DATEDIFF( b.dates, a.dates ) = 1, a.user_id, NULL ) ) ) AS remain1,-- 1日留存数
FROM
( SELECT user_id, dates FROM temp_trade GROUP BY user_id, dates ) a
LEFT JOIN ( SELECT user_id, dates FROM temp_trade GROUP BY user_id, dates ) b
ON a.user_id = b.user_id 
WHERE
b.dates >= a.dates 
GROUP BY
a.dates;
 
4.计算各日用户留存率。留存率=各日留存用户数/基准日活跃用户数
-- 4.用户留存率计算
SELECT
dates,
user_count,
concat( round( remain1 / user_count * 100, 2 ), '%' ) AS day1,
-- 1日留存率
FROM
user_remain_view;


(3)窗口函数,登陆表(用户名,date) 求连续登陆七天以上的用户
先窗口函数排序,然后算最晚日期和最早日期之差,筛选大于等于7的用户

3、介绍实习的一个数据分析报告

4、建议:多刷牛客SQL,关注业务分析题,如某个指标上升或者下降怎么分析
一面实习0生面,二面正式员工面。

7.11 网易 数据分析实习生 一面 (偏数据科学方向)

1、自我介绍
2、对一段实习的预期时间就是三个月吗
3、科研相关:科研最大收获是什么?最大成就感是什么?课题目的是什么?举几个插补方法,他们有什么区别?Kmeans聚类原理,
4、工作相关:AB实验数据分析师主要负责什么,P值是怎么算的?假设检验原理?
5、机器学习数据清洗剔除异常值的常用方法?
6、建议:不仅要会用,还要深究原理
全部评论

相关推荐

评论
10
109
分享
牛客网
牛客企业服务