海康威视 算法 一面面经
1、介绍数据挖掘的过程
2、那个过程你最熟悉?数据清洗和模型评估
数据清洗:异常值怎么判断?箱型图:上界怎么定义?极端异常值怎么判断?
LOF的原理?代码会实现吗? 样本服从t分布,怎么填补异常值
怎么填补?用缺失值填补,缺失值怎么处理?
平均值,众数代替,用模型预测,树模型怎么预测?
3、模型评价?分类:P-R图,F1值
样本不均衡,只对大样本有兴趣,怎么评价?
F1值问了一下
4、SQL:日销量,取前一天和后一天的销量差
日期和以0结尾的销量差?
5、Hadoop mapreduce怎么工作?
6、数据结构:n个数取top k
7、那个机器学习比较熟悉?svm
什么样的函数是核函数
如何去选择核函数,线性,高斯核函数。
明明异常值应该是删除的,但他一直说填补,很懵,t分布那个,有谁可以解答吗...
攒人品啦!大家加油
#海康威视##面经##机器学习##算法工程师##春招#