小白数据挖掘demo项目思路求助
本人9本海硕计算生态学应届毕业生(主要是Linux和R语言跑数据分析),无实习经历,目前想转行互联网大数据挖掘但是缺乏垂直项目经历,现在打算做一个大数据全栈分析的demo项目作为作品集放到简历中,想模拟实际工作场景的整套数据工作流程(源头数据采集 [电商和招聘平台]→建数仓→数据分析→数据挖掘),边学习边实操大数据相关的所有主流技术栈。
我想先分别独立分析电商和招聘软件中的信息,再融合分析研究工作岗位和收入对用户购买行为的影响(跨软件平台数据是否支持?),想请教一下这样的想法的合适性和实操性如何。
我觉得主要的问题是数据采集,因为云数据平台 (kaggle、阿里云等)上开源的数据集脱敏,难以产生实际性结论,且都是干净的数据,缺乏上下文,有点脱离实际工作场景。请问推荐以什么方式进行大数据采集?还是说应该把重心放在数据挖掘模型和算法的学习上,不建议花过多时间学习数据采集,直接拿现成数据集比较好呢?
另外,目前处于择业迷茫期,有点搞不清努力的方向。本人喜欢钻研技术,不大喜欢和业务问题打交道,因此在想会不会相比于数分来说朝着后端路线学习发展更适合我,但又有些止步于学习后端技术栈需要花费的时间成本和非科班求职的高门槛。希望大佬们牛友们指点迷津。
🙏
#数据分析# #数据挖掘# #大数据# #机器学习# #后端#
我想先分别独立分析电商和招聘软件中的信息,再融合分析研究工作岗位和收入对用户购买行为的影响(跨软件平台数据是否支持?),想请教一下这样的想法的合适性和实操性如何。
我觉得主要的问题是数据采集,因为云数据平台 (kaggle、阿里云等)上开源的数据集脱敏,难以产生实际性结论,且都是干净的数据,缺乏上下文,有点脱离实际工作场景。请问推荐以什么方式进行大数据采集?还是说应该把重心放在数据挖掘模型和算法的学习上,不建议花过多时间学习数据采集,直接拿现成数据集比较好呢?
另外,目前处于择业迷茫期,有点搞不清努力的方向。本人喜欢钻研技术,不大喜欢和业务问题打交道,因此在想会不会相比于数分来说朝着后端路线学习发展更适合我,但又有些止步于学习后端技术栈需要花费的时间成本和非科班求职的高门槛。希望大佬们牛友们指点迷津。
#数据分析# #数据挖掘# #大数据# #机器学习# #后端#
全部评论
都啥时候了,直接干算法向的数分吧,你这实力可以的
相关推荐
点赞 评论 收藏
分享

点赞 评论 收藏
分享