首页 / 数据挖掘
#

数据挖掘

#
201386次浏览 1307人互动
此刻你想和大家分享什么
热门 最新
小白数据挖掘demo项目思路求助
本人9本海硕计算生态学应届毕业生(主要是Linux和R语言跑数据分析),无实习经历,目前想转行互联网大数据挖掘但是缺乏垂直项目经历,现在打算做一个大数据全栈分析的demo项目作为作品集放到简历中,想模拟实际工作场景的整套数据工作流程(源头数据采集 [电商和招聘平台]→建数仓→数据分析→数据挖掘),边学习边实操大数据相关的所有主流技术栈。我想先分别独立分析电商和招聘软件中的信息,再融合分析研究工作岗位和收入对用户购买行为的影响(跨软件平台数据是否支持?),想请教一下这样的想法的合适性和实操性如何。我觉得主要的问题是数据采集,因为云数据平台 (kaggle、阿里云等)上开源的数据集脱敏,难以产生实际性结论,且都是干净的数据,缺乏上下文,有点脱离实际工作场景。请问推荐以什么方式进行大数据采集?还是说应该把重心放在数据挖掘模型和算法的学习上,不建议花过多时间学习数据采集,直接拿现成数据集比较好呢?另外,目前处于择业迷茫期,有点搞不清努力的方向。本人喜欢钻研技术,不大喜欢和业务问题打交道,因此在想会不会相比于数分来说朝着后端路线学习发展更适合我,但又有些止步于学习后端技术栈需要花费的时间成本和非科班求职的高门槛。希望大佬们牛友们指点迷津。🙏#数据分析# #数据挖掘# #大数据# #机器学习# #后端#
点赞 评论 收藏
分享
【面经】视源股份-中央研究院实习生
这个岗位偏向数据挖掘,主要涉及供应链方向一面(技术面)自我介绍盘问项目,主要是在学校课题组做的网约车相关项目,盘问了建模的细节、创新点、模型的求解效果等(面试官人超级好,帮我指出了一些可以改进的点,并且还对我整体的内容做了拓展,建议我的毕业论文还可以结合哪方面去扩充,超级牛的老师)为什么用DQN而不是PPO,两者有什么区别简述浅拷贝与深拷贝的区别?讲讲用过的git的操作指令谈一谈多线程与多进程的理解看到我简历中有用到遗传算法,老师还问了对于现在最新的一些群智能/进化算法有没有了解(回答没有,这点需要多补充学习)出了一道建模题,在一块电子板上,有100个有正负极的电子管,其中有50对电子管需要产生连接,电子管之间可以正负相连也可以负正相连,要求连接线路不可交叉,若有交叉可以让部分线路在电子板反面进行连接,目标是反面连接的线路越少越好我把这个问题和上一段实习中涉及的一个项目做了对照,讲了我在项目中是怎么解决的(邻域搜索算法),老师说这种路径搜索的问题,现在一般用A*算法、深度搜索算法等。反问:问了老师更看重实习生的那些品质?-答:钻研的态度+新技术的探索+个人的思考+对问题的敏感度这次面试是体验感最好的一次,感觉并不是我在单方面回答面试官的问题,而是我和面试官老师在共同探讨问题,有种学生请教老师的感觉,非常美妙,也非常感谢这位老师过了三个工作日,收到二面的邮件~二面(有点类似hr面):这一面有点类似与唠嗑(?上来先问我那年毕业,我说26年,面试官说找实习挺早哈,我说对找工作比较焦虑哈。然后问了毕业后准备读博还是就业,答:优先就业在做项目或者研究时,有没有遇到困难和挫折?主要来自于哪里?如何克服?平时怎样缓解压力? #视源股份# #数据挖掘# #算法# #运筹优化#
查看9道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务