这是一篇小小的回忆录

前言

        2022年末,我完成了第一个完全由我自己主导的第一个数据预测项目,分工及其明确,我负责开发,另一个负责协调厂家及客户,这段时间摸过鱼,k过歌,加过班,吵过架,情绪算是起起伏伏,当时项目期间晚上下班,回忆起小时候看见父母回家后拖着疲惫的身躯给你做完饭在躺倒床上的场景,死去的回忆突然进攻过我...

出行前的碎碎念

同事:又要出差了?
我:对啊,这次家里有外援,不会随时交流
同事:你这出差还挺频,行啊,赚点钱回来请我们吃饭,哈哈哈...
我:小case,但是说实话还是挺紧张的,让我来负责这一块,要是真出现啥问题咋搞啊
同事:那你这不去都得不到锻炼,以后更大的项目更不能给你了
我:nmm的,说的还真对!

✈✈✈✈✈😐✈✈✈✈✈

难以言说的情绪

       第一天来到这时,给的初始代码还没看完(我是临时调来这个项目,原来有个最初版本的源码),上来就让我改一下,跟需求不符,这个时候我满脑子不爽,我靠,这需求变得也太快了,当时跟我介绍时候也不是这个啊,本着甲方至上的原则,我电脑小风扇嗡嗡的转着,你知道最烦人的是什么?明明kh不是很懂,嘴上却说着“这个简单,这个简单”🤣,稳住心态哈,当时我记得回了一句“你行你来”,咳咳,当时挺刚哈,消停半天,这个也搞好了,紧急赶工个给上面看看,在这我复盘时确实明白自己做的是有问题的,自己不该火气这么大,都是打工人,何必呢?(这个我该改)
       第一天来舟车劳顿,勉强能理解自己,但是这一段和客户的冲突确实是可以避免冲突的,希望下次自己可以改正思想。
       从校园离开之后,你会发现自己的圈子会无限缩小,谁没事天天聊啊,跟几个关系要好的聊聊已经是极限了,或许这不该属于复盘的内容,毕竟现在社会就是如此,但是那种感觉,你不经历就永远无法体会。举个例子,在学校里你可能内向,不爱说话,咩有朋友,你感觉心里很不是滋味,但是回到宿舍哪怕没人聊天,也都是有人默默的陪伴你,宿舍再有个活宝,那更是开心;但当你离开校门,你看着群里是不是偶尔冒两个泡的舍友,你就会发现,一切都变了...

业务是工作后一项必不可少的能力

       随着时间的推移,我将大量精力开始转移到工作中,于是我发现“能编会造”是写文档必不可缺的一样技巧,这一部分不属于技术文档,技术文档只需要将你做的程序完整流程写下来,每个py文件具体作用,每个函数作用讲清楚就行,但是像其他的落地文档,客户需求文档等等,无一不需要你“能编会造”的技巧,这一部分要提升也很简单,只能靠多积累,多尝试,因为很多专业名词你根本没听说过,小举一个例子,我当时很懵什么叫光伏作业,仅仅查资料还不够,因为网上说的版本各不相同,是光伏项目施工作业,还是光伏项目安装作业,还是光伏组件作业?跟业务一问才知道,“这里指的是对应的光伏项目作业,还是初版,没有细写”。

技术的提升

       工作之前,参加个竞赛,搞搞华为、阿里什么的官网里面的数分小比赛,数据清洗清洗,用个k折交叉验证,再搞个回归分析,一套组合拳打下来,结果就差不多出来了,工作中呢?还真他娘的差不多。

       工作后有很充足的时间学习,因为你的工作不得不逼着你学习,如果你想发展更好,就要不断地学习,保证自己知识储备丰厚,当然这都是一方面,只能保证你饿不着...言归正传
问题:使用脱敏后的数据做工程预测
  • 数据预处理:异常值在实际场景中几乎是不可避免的,所以观察数据是首当其冲,这里最常用的异常值处理就是取平均值、中位数,大部分场景屡试不爽
  • 特征工程:按理说这个在多维度数据下需要详细分析,但是这个项目仅仅提供了一个维度,所以这块我自己加了个时间戳(当时时间挺紧,也没搞啥别的),然后再用one-hot编码造了个维度,最后效果不说多好,仅仅提升%1准确率吧,这也跟实际项目数据量过少存在一定关系
  • 模型选择:这块无非就是常用的几个模型xgb,lgb,CatBoost,最后同时根据经验建议我用lgb,效果不行就搞个集成,巴拉巴拉的...当然,测试后lgb确实是适合这个场景
  • 调参:无话可说,调来调去,屁用没有,对某些节点来说预测效果甚至下降,但从所有节点整体预测来看还是提升1%左右的准确率。(我做的这个预测是对多个点多个地市进行批量预测,不是针对一组数据,具体还是得看需要怎么做,重心是放在速度上还是准确率上,这块就需要和客户讨论一下咯,提前给各位小朋友们打个预防针O(∩_∩)O哈哈~)

       整个项目时间还是很紧的,只给了我一个多月的时间,期间等数据等了很久,很久,很久,我都差点想尥蹶子跑了,这些步骤做完之后其实就看数据如何摆放整齐传进来,有时候还要用pandas搞个行列转换,贼费劲...算了,今晚就写这么多吧,还有很多小细节没讲,下次有人想听碎碎念我在慢慢写,(^▽^)嘿嘿

#我的成功项目解析#
全部评论
看完了,给牛友点个赞
2 回复 分享
发布于 2023-03-27 22:49 湖北
大佬就是大佬捏
点赞 回复 分享
发布于 2023-03-28 12:09 江苏

相关推荐

不愿透露姓名的神秘牛友
11-21 17:16
科大讯飞 算法工程师 28.0k*14.0, 百分之三十是绩效,惯例只发0.9
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
10-05 10:13
已编辑
HHHHaos:让这些老登来现在秋招一下,简历都过不去
点赞 评论 收藏
分享
10-28 14:42
门头沟学院 Java
watermelon1124:因为嵌入式炸了
点赞 评论 收藏
分享
4 4 评论
分享
牛客网
牛客企业服务