小水滴真的是太可爱了吧

2020-09-22 21:50 门头沟学院产品经理

关注

【数据分析学习笔记day29】自然语言处理NLTK+情感分析+ 自然语言处理(NLP)+ 简单的情感分析+ 案例+使用机器学习实现

文章目录

情感分析

情感分析

自然语言处理(NLP)

将自然语言（文本）转化为计算机程序更容易理解的形式
预处理得到的字符串 -> 向量化
经典应用
1. 情感分析
2. 文本相似度
3. 文本分类

简单的情感分析

情感字典（sentiment dictionary）
- 人工构造一个字典，如： like -> 1, good -> 2, bad -> -1, terrible-> -2
- 根据关键词匹配
如 AFINN-111： http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010，虽简单粗暴，但很实用
问题：

遇到新词，特殊词等，扩展性较差

使用机器学习模型，nltk.classify

案例：使用机器学习实现

# 简单的例子

import nltk
from nltk.stem import WordNetLemmatizer
from nltk.corpus import stopwords
from nltk.classify import NaiveBayesClassifier

text1 = 'I like the movie so much!'
text2 = 'That is a good movie.'
text3 = 'This is a great one.'
text4 = 'That is a really bad movie.'
text5 = 'This is a terrible movie.'

def proc_text(text):
    """ 预处处理文本 """
    # 分词
    raw_words = nltk.word_tokenize(text)

    # 词形归一化
    wordnet_lematizer = WordNetLemmatizer()    
    words = [wordnet_lematizer.lemmatize(raw_word) for raw_word in raw_words]

    # 去除停用词
    filtered_words = [word for word in words if word not in stopwords.words('english')]

    # True 表示该词在文本中，为了使用nltk中的分类器
    return {
   word: True for word in filtered_words}

# 构造训练样本
train_data = [[proc_text(text1), 1],
              [proc_text(text2), 1],
              [proc_text(text3), 1],
              [proc_text(text4), 0],
              [proc_text(text5), 0]]

# 训练模型
nb_model = NaiveBayesClassifier.train(train_data)

# 测试模型
text6 = 'That is a bad one.'
print(nb_model.classify(proc_text(text5)))

全部评论

推荐最新楼层

昨天 12:00

已编辑

门头沟学院算法工程师

秋招算法offer选择

九月初参加秋招，bg 双非本 211 硕 ，大伙帮忙选一下 offer（deeplang 我非常看好，但是得等实习转正，所以目前不知道啥情况）华子那边一直画饼，但是部门应该也算核心，在浦东。已开的两家社保公积金都拉满了------11.21 更新一下，华子已拒。

点赞评论收藏

分享

昨天 11:19

已编辑

门头沟学院前端工程师

简历这样写真的很难挂

没有标题党哈，从我实习到现在，虽然简历也有挂过，但基本都是中小厂（很怪）。最近有好多牛u私信我说很多公司简历关过不去，私信询问简历应该怎么写怎么改，正好现在好多26届甚至27届的学弟学妹们都在准备日常实习，明年3月份开始也要准备暑期实习，简历这块感觉我也许有一些建议是大家都可以用到的。下面的话我会从整体到每个内容，再到一些细节点去给大家一些建议。每个模块都很细致！快快收藏起来！！！1.整体结构大部分的牛u应该都是比较正常的履历，可能没有竞赛，有些项目。所以这块应该是大家都适用的。对于没有实习经历的牛u，从上到下依次是：【个人信息】-【教育经历】-【项目经历】-【专业技能】-【社团和荣誉证书等其...

投递完美世界等公司10个岗位 > 我的上岸简历长这样你的简历改到第几版了

点赞评论收藏

分享

10-16 09:58

已编辑

门头沟学院 Java

这是要干什么? 给我干哪来了?

影子科技，yyds。晚上11点发消息，第二天英语演讲！

Two_Shadow：逆天，面个Java当上主播了

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 25届秋招总结 #

247787次浏览 2012人参与

# 学历or实习经历，哪个更重要 #

41080次浏览 299人参与

# 北方华创开奖 #

22787次浏览 259人参与

# 地方国企笔面经互助 #

2539次浏览 6人参与

# 你最想要的公司福利是？ #

39970次浏览 126人参与

# 选完offer后，你后悔学本专业吗 #

10433次浏览 75人参与

# 面试题刺客退退退 #

137141次浏览 2092人参与

# 国企/银行/研究所公司爆料 #

89720次浏览 412人参与

# 应届生被毁约被毁意向了怎么办 #

27133次浏览 238人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2894次浏览 35人参与

# 机械应届生薪资要多少才合适？ #

12390次浏览 60人参与

# 查收我的offer竞争力报告 #

16773次浏览 228人参与

# 校招入职后的感受 #

156938次浏览 1961人参与

# 你觉得第一学历对求职有影响吗？ #

14882次浏览 121人参与

# 没有实习经历，还有机会进大厂吗 #

805071次浏览 13814人参与

# 我的工作日记 #

21182次浏览 270人参与

# 不给转正的实习，你还去吗 #

1516959次浏览 16965人参与

# 寒假躺平还是提前实习 #

58429次浏览 438人参与

# 总结:哪家公司面试体验感最差 #

25747次浏览 129人参与

# 秋招OC许愿 #

226588次浏览 1871人参与

# 如何写一份好简历 #

602140次浏览 8441人参与

牛客网
牛客企业服务