面试&面试
面试共性问题的准备
1.基础的机器学习算法
线性模型
有序属性和无序属性的转化
有序属性可以进行连续值的转化,无序属性,假定有k个值则转换为k维向量
线性回归问题转换成分类问题直接引入- 对数几率函数
经典的数值优化方法:梯度下降法,牛顿法.牛顿法求解平方根
决策树
ID3算法,利用信息增益 但是其有一个缺点就是对数量较多的属性具有一定的偏袒性.
C4.5算法, 增益率 对数目较少的属性具有一定的偏袒性
CART算法, 基尼指数
连续属性的离散化 缺失值按照权重进行重新定义
神经网络
神经网络所学到的东西都蕴涵在连接权和阈值中
损失(误差)函数,也是基于梯度下降策略来实现损失函数最小,梯度下降是沿着负梯度方向搜索最优解
- 先将输入事例提供给输入层神经元,逐层将信号进行前传,直到产生输出层的结果
- 计算输出层的误差,再将误差逆向传播至隐层神经元
- 最后根据隐层神经元的误差来对连接权和阈值进行调整.并进行迭代循环进行
支持向量机
利用间隔最大化寻找划分超平面,找到两个异类的支持向量最终的模型只和支持向量有关
凸二次规划问题,利用拉格朗日乘子法可以得到"对偶问题",将极大极小值问题转换成极小极大值问题
核函数:样本从原始空间映射到一个高维的特征空间 超曲面映射到超平面
软间隔:引入一个松弛变量,这样向量可以出现在间隔之间
贝叶斯分类器
基于后验概率的贝叶斯分类器转换为基于类先验概率和类条件概率的贝叶斯判定准则
- 判别准则为类先验和类条件的连乘,容易导致数值下溢,采用对数方法
- 同时也避免出现零值,采用拉普拉斯修正进行平滑处理
面试
1.计算机算法实习生
- 工作职责:
1.将传感器采集的数据实现算法功能,利用机器学习算法模型训练并实现分类;
2.相关前沿技术方案的调研及实现;
3.Java Web系统(后端、前端)的维护和模块开发;
4.团队交办的Java和Python,C /C++, Android相关开发任务;
5.相关前沿技术方案的调研及实现;
6.团队交办的其它任务及相关文档撰写和整理。
岗位要求:
1.在读硕士生或者优秀本科生;
2.计算机应用等相关专业,数学和数据结构基础非常扎实,有运动传感器算法开发经验者优先;3.具备基本的契约精神和情绪控制能力;4.熟悉C /C++, java,python语言开发;5.熟悉MySQL的使用;
6.责任心强,具有较强的思考和解决问题的能力,具有较强的团队沟通和协作能力;7.编程能力强者优先;
8.签订实习协议,需要本人导师同意;外地学生,可协调解决住宿;
9.实习期至少3个月.面试内容及结果:
1.c语言中的指针和指针数组如何表示,指针数组如何引用
2.快速排序,冒泡排序的概念及如何算法实现
3.后缀表达式利用栈进行实现
4.关于机器学习的基本问题,主要的是数据的输入,也就是特征工程问题.
公司主要是做可穿戴设备的智能化,处理传感器的数据.主要想找一个将公司项目作为课题研究毕业的研究生.
2.python 开发实习生
[职位描述]
1.开发、维护、测试、优化金融量化分析系统
2.包括但不限于数据整理、数据分析、数据展示等
3.为量化交易提供支持,包括数据整理、分析工具实现、风控等;
4.整理、分析量化交易系统的日志文件;[职位要求]
1.熟悉Python,熟悉数据结构和算法,了解Matlab优先
2.熟悉常用Python数据分析相关库,如NumPy、 SciPy、 Pandas、 Matplotlib等
3.加分项:有基本的MySQL、Django/Flask、 前端知识
4.动手能力强,优秀的学习能力,独立思考解决问题能力,工作积极主动,责任心强,具有出色的沟通能力和团队合作精神
5.对量化行业有兴趣,有志于在量化投资领域长期发展,无需有金融相关背景和经验
6.211/985本科及以上学历;理工科专业,计算机、自动化、软件工程、电子信息工程、通信工程等专业优先。
7.实习时间:每周至少4天,至少实习4个月。- 笔试内容:
1基础题:python中最简单的数组slice问题,map()函数,range()和xrange()的区别,dict中的zip()函数,public and private变量及函数的实现
2.程序设计:给定一个有字符有数字的输入其长度都不定,用最短的的程序来实现,例如"ru180716"将"ru"提取出来;1-13十三个首尾相连,进行数数,数到"3"的退出,问最后留下的那个数对应的是原来的几号.;利用python中的cummax()函数计算一个数列中其子数列的和最小,并返回
3.结构题:理解一个多层复杂的递归程序,写出其输出结果 面试内容:
主要还是一些算法的基础问题,分类问题的优化方法,特征工程这一块问得比较多,刚好又是我的知识盲点
3.自然语言处理实习生
- 岗位职责:
基于业务数据,使用自然语言处理技术解决实际问题,包括但不限于情感分类、热词提取、主题抽取等。 岗位要求:
1、全研究生以_上学历在读,计算机、数学、计算语言学等相关专业;
2、熟练掌握Java或Python-种语言,了 解Linux系统的使用;
3、熟悉机器学习相关基础算法;
4、有自然语言处理、机器学习、数据挖掘项目经验者优先;
5、必须至少保证一周五天、连续3个月的实习面试问题:
非技术面试,一个项目经理.了解到主要做的是文本标记来实现文章的情感分析,基础工作可能做的比较多,像文章的人工打标签,根据文章的类型来实现算法