百度一面 机器学习/数据挖掘
1.自我介绍
2.mapreduce id,a1,a2.... id2,a3,a4…… query,id1,id2....
要求结果:query,a1,a2,a3,a4
mapreduce写得比较少,没写出来
3.推荐系统的主要逻辑
面试官以前是做推荐的,问得比较实际,实习工作比较简单,经验不足,除了基本的系统流程答得还行,解决其他实际问题不行
4.html 三分类,提取哪些特征
分为:首页,频道页,内容页
5.项目的一些东西
6.两个每个单词为一行的文本,求单词的交集
面试结果:已挂