1. 自我介绍 2. 介绍一下项目,难点和收获。 3. 怎么清洗数据,有没有遇到数据不规范的情况 4. 项目还有哪些可以优化的点。 5. 讲一下kmeans、kmeans++,决策树和knn(因为项目中用到了Kmeans) 6. 过拟合怎么解决 7. 说几个Linux常用指令,怎么查看进程状态 8. http无状态怎么理解,属于哪一层 9. 数据库了解吗,有哪几种连表操作,区别是什么 10. 索引加快查询速度原理 11. 大数据平台和一般数据平台区别,或者说大数据的思想是怎样的 12. 非本专业,转岗原因,学校课程有学过编程语言...