实习经验分享|广发证券技术岗
个人介绍:
昵称:ssssssssssssssj
学校:中山大学
年级:20届
专业:应用统计
实习公司:广发证券
实习岗位:金融建模实习
公司部门业务介绍:智能化项目
技术栈介绍:python、spark、hive
能否转正:未知
实习待遇:120一天
公司大致性别比例:部门1:2(女:男)
发展前景:前五的券商,可能绩效要看行情,但公司肯定是稳的,很难转正,弃疗吧
实习前:用r语言图表分析、svm随机森林等等传统机器学习调函数来建模的水平
实习体会
从氛围来说,港真,导师和组里的人都挺友好的,尽可能地给你提供资源去做项目,虽然可能资源没有搞科研的那些大实验室的好,比如服务器。。。秋招期间需要面试、平时上课都直接和他们说一声请假就好了,他们都不介意的,也建议我多去试试,不要因为实习影响了招聘。有总部的工作卡,所以能跟着组里的人一起到总部饭堂吃饭。
从项目来说,
1. 早期是跟着导师参加在他在做的项目里面,但因为证券公司有数据权限的问题(客户资料库,实习生没权限),我只能从hive数据库做简单是数分,尴尬。。。不会sql。。。从头学。。上来就是写几百行的那种一个套着一个表的那种sql查询,写到头痛,但也只能硬着头皮学,不是说sql多难,而是一边上课一边实习学sql且没个方向又拿了个很复杂的需求来开头,走了一堆的冤枉路。。。补充一下,组里都是计算机科班出身的人,他们觉得sql、换个语言写代码都很简单,然鹅我一个统计的这方面真是各种坑(就是样样好像都会一点但深了做就相当于重头学了)。。。后面才是更多的深坑。。。sql学好了后,导师他们的项目都做完大半,我根据分析提出了一点改进,又写了3个星期的python(基于他们原来的版本加上去的那种),对R很熟,但是python不熟,python的一些不同数据类型用得极其混乱,因为写着写着就会用成了R的语法,报错报错报错。。。比如r的dataframe或者matrix都可以[行号,列号]提取,python不能?!要ix、iloc才能,或者用列名(暴风哭泣,搞了好久才记清楚),函数名称都还没记清,各种慢,写出的python要等他们有空才拿去跑(数据权限问题),结果rmse还升高了(暴风哭泣),调过后依然不行,白干了。
2. 一个月给导师做的深度学习的项目做跟进、查资料、写论文、找找提升方向、调参,算是又补充了一波深度学习的内容。
3. 调研数据科学竞赛的平台和热门竞赛、方法,给组里参考参考组里项目可以选择的主题、算法、自我学习更新的来源等等等,我也从中匹配了一个和第一个项目相关的竞赛进行复现,另一个和公司业务也相关的天池的竞赛打算自己做。
4. 竞赛复现,29类模型需要将结果进行集成,40+个代码文件,看得快疯了,有个很难搞的库自己电脑装不上;能装上的那个平台内存不够,安装库要等专门的人安装,还经常出问题(一半时间都在修。。。);内存够的服务器安不上那个库(跟c++之类的底层有关,安装到最新版本也不行),就自己搞linux虚拟机来研究什么版本能安装上(linux我又不会,学!),尝试失败,没安装上。最后只能挑着能跑的代码去实现。
5. 天池竞赛,用到了lstm、季节性arima,纯自己去研究、学习、预测了,有需求可以问他们。
6. 继续做第一个项目的预测,数据终于能在某个平台的pyspark调用(pyspark又不会,学!),不能download下来,pyspark没有深度学习的库,只能用传统机器学习来做,效果只提高了10%左右,我太难了
单纯对统计专业的补充:总结,统计的人想做技术真的很难和计算机的拼,看看上面有多少不会的,可能还有很多这种很计算机技术的东西我忘了。真的学到很多,但真的学到头破血流了,传统统计真的不好用,至少在技术岗来说是,银行、券商都是业务部招经管类的,技术部找计算机专业的,求求别再说统计哪个行业都要,别说学数学的人哪里都要了,我们是数学类的统计没错,但学的技术太水,统计方法预测效果又不好,学得又难,还不容易转化为实际价值。我用一整个秋招的不如意告诉你们,哪里都不会特别想招统计的(除了保险行业会专门招一些),除非你足够厉害,专业里top10%(撑死了20%)的那种,还要各种机器学习、深度学习玩得好。不到实习、秋招都不知道学校学的和招聘要求、需求差那么远。秋招前都学好了sql、hadoop、spark、python,攒够了实习经验再去吧,或者直接别读这种水硕、水专业了,老师都不想给你上课。
#广发证券##实习##信息科技岗#