CVTE NLP算法岗面经(实习)
CVTE数据挖掘部门
工作地点:广州
感受:十分感谢面试官对我这个二本渣渣的肯定😭😭(面试官真的很好)
一面
2021.6.9
电话面,1小时+
自我介绍
- 直接问你讲一下最拿手的项目
- 针对项目问的问题:
- 特征工程中干了什么?(去噪的手段等等)
- 不平衡样本的处理方式有哪些?
- 讲一下roc曲线和AUC值;真阳性和假阳性怎么算的?
- 讲一下改进的tf-idf
- 讲一下k-means与谱聚类
- 显存不够怎么解决?
- 关于bert模型以及蒸馏的问题:
- 蒸馏的思想,为什么要蒸馏?
- 蒸馏中的学生模型是?
- 有哪些蒸馏方式?
- Bert的输入是什么?
- 字向量的embedding怎么训练得到的?
- 关于transformer的问题:
- self-attention理解和作用,为什么要除以根号dk?
- 为什么需要进行Multi-head Attention?
- layer normlization的作用?
- LN和BN的区别?
- 与Python有关的问题:
- 怎么进行维度交换(transpose)、维度转换(reshape)?
- 点积(维度完全一致的两个向量相乘,得到一个标量)和矩阵相乘(X*N N*Y==>X*Y)的区别?
- 怎么对字典的值进行排序?
- SQL:内连接、左连接、右连接的区别(结果集中右表中的字段必须全部存在且显示)?
- python在内存上做了哪些优化?
- 怎么节省内存?(将数值型数据转化为32位或16位,手动回收不需要用的变量)
- pandas库怎么读取超大型文件?(分块读取)
- 爬虫:a.多进程和多线程的区别?b.有哪些解决反爬的手段?
- 算法题:
- 无重复字符的最长子串
- 判断链表是否有环、链表环的入口
- 场景题:
- 怎么把问题分配到多级的目录里去?
二面hr面
2021.6.10
视频面,30分钟+
自我介绍
- 介绍未来职业规划?
- 想在实习中学到什么?
- 为什么不考研?
- 家里人支持吗?
- 目前为止最让你感到挫折的一件事?
- 你的优点缺点?
- 对加班的看法?