面经和想说的话,以及大学这三年
面经:
序:
老大说有空你来写篇面经,然后今晚就来写了,具体哪家公司问的啥我也记得不是很清楚,我只说说问了我啥问题,还有我想到的那些问题。
数据结构中常考的:
线性数据结构:
1.循环队列,设计缓存会用到。
2.ziplist中用到的跳跃表。跳跃表和红黑树的区别
3.如何保证字符串的二进制安全,这里可以参考Redis源码里的sds实现
4.hash表 rehash操作 触发条件和转移策略 可以看董西成老师博客
http://dongxicheng.org/nosql/redis-code-hashtable/
树
1.平衡树 os对进程地址空间的管理使用平衡树
2.红黑树 map和set都是用红黑树实现的,Linux进程调度对内存块管理
3.B+ Tree MySQL数据库 为啥使用B+ Tree 和磁盘向关联 与磁盘寻道关系
4.KD Tree KNN算法 空间划分 一层X 一层Y
5.LSM Tree Hbase源码中设计的 http://www.cnblogs.com/yanghuahui/p/3483754.html
经典算法:
1.快排
2.内省排序和TimSort SGL STL和JDK 还有Python底层实现的sort大家可以看看
3.位运算那些题 Martix???大神有文章(忘记Martix大神全名了,活该我很多面试挂)
4.动态规划 就是简单的动规 没有超出左老师书的
文本挖掘
1.TF-IDF的Mapreduce实现 就是类似wordcount的就可以
2.SimHash算法原理
3.倒排索引原理和应用 我大二做搜索引擎用的
大数据
1.Hadoop 大表Join小表 以及数据倾斜问题
2.Spark 调优 参考http://blog.csdn.net/u012102306/article/details/51637366
3.Mapreduce原理
机器学习模型算法:
1.LR推导以及应用场景
2.GBDT的原理和应用场景
3.随机森林和GBDT的区别
4.FM算法推导
最优化算法:
1.SGD和GD的区别
2.FTRL推导
3.FTRL和SGD区别
这几个问题可以看http://blog.csdn.net/china1000/article/details/51176654 里涉及到的Paper
特征工程
1.OneHot
2.标准化
3.归一化
4.连续特征离散化
5.L1正则
6.GBDT 特征组合
7.特征重要性分析方法 卡方检验
8.FM 实现离散特征embeding
深度学习
1.Relu的优点
2.sigmoid梯度消失
3.Relu梯度消失的缓解方法
4.CNN中的权值共享和池化操作
Python
1.可变元素、不可变元素
2.深拷贝与浅拷贝
3.列表推导式
4.lambda用法
C++
1.虚函数那些经典问题
2.深浅拷贝
3.Vector实现
4.libevent库
5.完美转发问题
C++问我问的比较少
实习项目:
1.JSON和protobuf区别
2.广告CTR预估算法
3.特征设计 怎么涉及特征的
4.UGC数据的使用方法
5.建模目标怎么确定,模型评估方法
大学如何准备校招的:
1.收集招聘信息
V2ex,北邮人、水木清华、牛客网 这四个渠道 效率很好
2.笔试 多看看果姐写的文章,刷牛客网真题 可以看看算法笔记这本书拿来联系
3.实习 实习真的很能学东西,去一个不错的团队,可以锻炼人
5.校招 有针对性的投简历,准备和面试
6.建议有时间多学学业务知识
想说的话
感谢的话:
其实大学期间很感谢老大叶向宇、牛妹、亦行姐、超哥等牛客网的工作人员,今年校招的内推人也是我在牛客网收获的友谊,女友也是牛客网认识的,大学早点明确目标和努力是最为重要的,我的校招也应该算是基本结束了。从早期写写简单业务逻辑和挖漏洞到慢慢转型算法工程师,三年一转而去。经历了三年校招,终于自己要签***契了,很开心,也很激动。
应聘过程:
1.大二海投海面,当时大二拿的百度QAoffer 拒绝掉了,后来有人说我去百度做的QA,那是大二面的(有人误解很正常,因为我大二写了面经)
2.后来有机会加入前乌云合伙人301的创业团队,因为乌云的事情,离开,加入百度,终于拿到百度RD的offer,去接触工业界大数据和神奇的广告算法策略。
3.后来女友接了百度深圳offer,我就跑到深圳,加入范式,有爱的大家庭,大神超级多,学了很多东西。
我的建议:
1.华章和图灵的书多看看
2.infoq 和 china-pub多关注
3.早点去实习,有大大的好处
4.学会分享与承担
5.具体的内容其实可以多看看各位大神老师的面经,更有效果
我的微信公众号(在牛客网应该是封笔了,哈哈)
搜索:和饼哥一起Coding 就能看到我最近做的技术上的事情