求NLP大佬给点建议

本人本科生,算法菜鸡,更别提啥NLP了。我平时做的都是后端开发。有个问题来这里求问一下各位NLP大佬。

女朋友毕设导师让做一个股票分析的东西。大致如下:想从微博上一些股票大V的博文中分析出股票大盘或者某支股票的涨跌。大致就是想从大V的某一条博文中判断出这个大V表达的是涨还是跌。然后整合这些博文的分析结果和股票市场历史数据进行对比。然后想之后基于分析结果和大V的博文来进行炒股。 对于一个本科生(没有NLP基础)来说,这个做下来是个什么难度。忘各NLP大佬给点建议/思路。
#悬赏#
全部评论
本科就让做这么难的题目??360去年KDD也发了一篇,详情请戳:https://dl.acm.org/citation.cfm?doid=3219819.3219964
点赞 回复 分享
发布于 2019-01-05 23:43
给几个未加雕琢的初步思路: 简单粗暴方案1:标大量数据,有监督学习 方案2:标少量数据,半监督学习 方案3:标少量数据,收集网上其他领域的文本带标签数据,迁移学习
点赞 回复 分享
发布于 2019-01-05 18:29
多谢各位大佬的意见
点赞 回复 分享
发布于 2019-01-06 03:26
话说,大v点评的股票一般都是他鼓吹要涨的吧。一般的股票他也不会说
点赞 回复 分享
发布于 2019-01-05 23:38
你好 我的思路是这样的:(简单版) 1 爬取金融大鳄的blog文本,下载历史股票数据 2 对这些文本进行sentiment analysis 3 给文本贴label  positive为1,negative为0 (意思就是1的时候,如果预测准确,股票应该涨) 4把这些1 0 1 0 1 0数据画折线图(横轴是时间) 与历史股票涨跌图放在一起比对,如果有相关性,可以根据每天对新的文本的sentiment analysis进行预测。  5如果plot出来之后没有相关性,告诉导师别****淡了 ,还是直接用timeseries预测更靠谱。 6 如果有还不错的相关性。(肉眼可见的相关)就做一个ensemble model 整合每日的blog sentiment analysis 结果和timeseries预测结果。 
点赞 回复 分享
发布于 2019-01-05 21:51
判断大V对股票的态度是情感分析比较好做, 但是大V真的能影响股票的涨跌吗?  太扯淡了,这第二个问题算是个相关性分析吧。
点赞 回复 分享
发布于 2019-01-05 21:30
可以难也可以简单,关键是你想要模型准确率多少。数据很烦,没有数据集,首先你就要人肉tag少了还不行。最简单的思路就是做bag of word,然后有多少算多少。复杂起来的,就自己查文献做特征工程啊
点赞 回复 分享
发布于 2019-01-05 17:36
nlp+数据分析+金融学,不如换题……
点赞 回复 分享
发布于 2019-01-05 17:26
这个题目也太天马行空了吧
点赞 回复 分享
发布于 2019-01-05 16:59

相关推荐

04-02 10:14
门头沟学院 Java
  楼主经历如题,从三月初开始陆续投递各家大厂,做了一堆测评和笔试,但最终约面的也仅有淘天、字节和腾讯(两个无笔试的,一个一面自我感觉良好结果笔试a了0道题被挂了),忍俊不禁了。  处子面是淘天的电话面试,面试前蛮紧张不过开始面试就还好,自我感觉答得不错但是犯了些低级错误,后续补上笔试后(第一周根本没给我发笔试,然后又先约面再让我补笔试)因为答得很差所以被挂,很能理解。  再是字节面试,这是三家面试里第三个找我的,但是这里放在前面先说了。面试官感觉没什么生气,也没什么和我探讨的想法经常打断,而我自己也有一定问题(HashMap我能想到写时复制进行扩容但是细节没太搞懂,太专注于旧表而没想到可以直接更新新表,问我sentinel组件可能的原理我第一时间脑袋宕机开始自己扯类似于时间窗口的限流实现而没想到漏桶和令牌桶,自己的想法遭到拷打了想别的出路才想到两个最经典的限流想法),面试体验比较差(因为淘和鹅的一面面试官都会引导我深入去想,字节这个就光看着你然后发出质疑)。算法是单链表的快速排序,先让我说了思路我稍加思索说出来了,但写代码我写了二十多分钟剩下合并链表和返回没来得及写,然后被吐槽写代码慢,我确实没给自己做过限时代码训练但也真不至于吧(单链表快排我得考虑找到中间节点分割链表然后合并,交换两个链表中的节点,按照快速排序的思想考虑中间状态和边界条件,自己定义链表节点类,第一次遇到的话真不简单吧,但凡你让我用双向链表呢我请问)。  最后再说腾讯面试吧,我真的是很幸运并且自己也把握住了机会才能用平平无奇的211学历和0实习履历才最终获得腾讯offer。一开始投了腾讯后被晾了两周,心态有点崩,随后约面邀请同淘天和字节一块到来。一面面试官很年轻也很有耐心,在这里我贡献了自己的第一次视频面试,自己答得不错并且面试官也有耐心引导我往细了和宽了想,最后的手撕环节也会引导我纠错,总体是个平等交流的氛围。上午面试完下午便约了我的二面,比较神奇的是约了线下面试,我心情比较忐忑但还是接了下来,面试当日通勤一小时左右到达公司与二面面试官进行面试,这位前辈有很强的个人风格,基础知识问了业务对口的内容但我完全没准备所以相当于完全没答出来,但后续问了我思考题和开放性场景问题并对我的表现感到满意,让人感觉这位前辈的确很有想法很关心后辈也很认真负责,二面结束后我心情比较好便在回去的路上逛了逛,途中看流程已经被推进了。三面总监面比较忐忑,无摄像头且另一边比较嘈杂,能感受到面试官其实也并不太认真但是有在努力听我讲,全程准时聊了四十分钟,问了些项目再加上聊天,后面也一直在链接状态,有怀疑过是所谓的kpi,但我更偏向于这位面试官是忙迷糊了,事实也是如此。次周周一我打电话询问了一下,没过半小时链接状态便消失了,的确是面试官忙得忘了提交我的面评。最后是HR面,面试官比较官方而且应该是在边问边记,其实我最大的优势应该是热情和立即到岗,所以虽然怕遇到横向对比被挂掉功亏一篑心里有些忐忑但是整体上还是比较有信心,随后走了两个工作日的流程我如愿收到了offer,皆大欢喜。  以上是我的面试情况,真的感觉是运气占了大部分因素,尤其是对我这种履历不出彩的角色。遇到认真负责有耐心的面试官,愿意发掘你的闪光点,那么就有可能得到机会。遇到机器人一样对面试候选人兴趣不大,单纯抛问题然后就着哪个知识储备更丰富履历更光鲜就简单高效地去筛选的,不能说这样有问题,只能说会比价难办。  最后其实就是对自己投了非常多家公司但是面试的很少的这件事有点不甘吧,尤其是团子,我去参加了宣讲会参加了两次笔试第二次三道编程题自己a了1.95结果三个志愿全挂还给我发邮件问我愿不愿意接受调剂去其他方向(前端客户端运营啥的),我是什么很差的人吗。我看团的面经基本都比较基础而且流程又短又快,但凡给我个面试问题真不大吧,懒得喷。只能说运气的含金量还在上升。  最后感谢您愿意看到这里,有想要交流的点可以在评论区发出来,我愿意和您沟通交流#暑期实习   ##暑期##腾讯##腾讯求职进展汇总##面试##面试常问题系列##面试体验感最好的是哪家?#
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务