机器学习面试理论题
6. 5谈到了ANN,讲一讲你项目中怎么用的,以及其他做法(Hashing、Sharding、KD-Tree/Ball-Tree)
7. 了解PairWise吗,讲讲
5. word2vec:训练目标是什么,skip-gram ,cbow, 层次softmax, 高频词和低频词训练出的表示有什么特点, 怎么解决 。
Q: one-class svm和传统svm的区别,你看过one-class svm的底层代码嘛
A:区别回答上来了,代码就改了个接口和数据读写,底层原理代码没看过,面试官批评了一下,说底层代码也得看~
机器学习:支持向量机,贝叶斯,树模型之类的等
(要会怎么用准确的语言论述这个算法,程度就取决于自己了,平时方法我手动有试着推导一些原理,有助于全方位理解算法的适用性局限性)
3. 数据获取,爬虫的方面
4. 海量级数据储存问题
5. 海量数据的分析问题
7. 数据质量的问题
8. 数据泛化能力的问题
9. 数据抽取的代表性的问题
10. 数据特征选择,离散化等处理