搜狗----数据策略分析师
职位要求:
- - 对数据敏感,有较强的逻辑思维和沟通协调能力
- - 具有基本的统计学基础和一定的数据挖掘和建模能力,熟悉Linux环境,熟练使用 SQL、Hive、Python、Excel等数据工具
- - 具备一定的大数据的数据抓取、预处理、分析和汇报能力。基本了解常用的分类算法,如决策树、随机森林、K-means聚类等分类模型
一面面试官:
问题1.如果只有8G的内存,但是文件是50G,这个该怎么办?
问题2.对于5000个特征如何筛选出我们需要的特征?
问题3.考SQL
id | b | c | city | time |
1 | 122 | 'w:25,l:23,.....' | yes |
'2019-10-02 12:10:11' |
2 | 132 |
'f:23,p:89,......' |
no |
'2019-10-02 14:00:11' |
2)c列截取字符串,算各个w,f对应的个数,用的是substring
问题4
给了一个人一年的电话表,问如何推出其他维度特征来判断是否要借贷给他
打入/打出 | 电话时长 | 打电话时间 | 电话号码 |
|
|
|
|
|
|
|
|
|
|
|
是否熟练使用Linux以及vim
#搜狗##面经##数据分析师##实习#