本人是26届数开选手 找的日常实习 中科院信工所的数据开发主要业务是做安全相关的 底层是大数据技术。11/26 一面,问题如下1. 自我介绍2. 实习时长,实验室研究方向,如果进来的话会考虑转正吗3. 了解过liunx吗?如果我们要查看各个运行的进程具体情况用哪些指令,查看显卡运行情况用什么指令4. 熟悉哪些语言?java常见集合有哪些5. 如果我们往hashmap中插入一个元素,说说这个过程底层是怎么实现的6. 项目数据来源,说说用什么方式采集的7. 简单说说kafka架构是怎么样的,那它里面数据是有序的吗?怎么解决kafka中数据重复问题8. HDFS小文件过多有什么影响,应该怎么解决?9. 了解过spark吗?spark相关算子有哪些?groupbykey和reducebykey有什么区别 具体说说10. 了解过flink吗反问环节总结:无手撕,面试官反应 基础知识不是很牢固 项目使用的组件不太清楚 被认为数仓搭建没有自己从0-1动手做(实际自己跟着视频一步步敲了 不过确实答的不好)因为项目是离线数仓 所以被问到spark和flink直摇头,面试的老师还是挺好的,继续学习吧#日常实习面试##数据开发##寒假实习#