一只没有感情的鸽子

2020-05-22 20:01 已编辑门头沟学院产品经理

关注

python中文词云分析

准备

python环境
python第三方库

worldcloud
jieba
matplotlib

字体
需要分析的文本

—————————————————————————————————

python环境

在python官网下载适合自己的python版本，我自己用的是Windows操作系统，下载的是3.7版本

集成开发环境使用的是pycharm

链接：https://www.python.org/

https://www.jetbrains.com/pycharm/

python第三方库

worldcloud

Windows安装worldcloud稍微繁琐些，主要分为两个步骤

1.下载库（选择适合自己的版本）

https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

2.将安装包放到一个你能找到的目录下（方便找到的）并在命令行（CMD）执行下面的命令

先执行：

pip install wheel

再执行：

pip install 你下载的包名

直接在命令行（CMD）执行

pip install jieba

matplotlib
同理在命令行（CMD）执行

pip install matplotlib

字体

本次使用simsun.ttf（宋体）下载链接如下：
https://link.zhihu.com/?target=https%3A//s3-us-west-2.amazonaws.com/notion-static/b869cb0c7f4e4c909a069eaebbd2b7ad/simsun.ttf

需要分析的文本

这个自己准备就好，这部分的数据处理也是一个重点

代码

import jieba
filename = "a.txt"
with open(filename,'r') as f:
mytext = f.read()
mytext = " ".join(jieba.cut(mytext))
from wordcloud import WordCloud
wordcloud = WordCloud(font_path="simsun.ttf").generate(mytext)
#%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show(）

最后会直接生成被分析文本的词云图：

总结

总体来说操作还是比较简单的，后续的优化可以从词云图的样式（字体，形状）进行优化，还有就是分析数据的处理工作也是一个重点，不过就不在这部分介绍了。

全部评论

推荐最新楼层

昨天 16:34

University of California San Diego 算法工程师

求批评，为啥日常实习都找不到。。。

想找算法岗位的日常实习，连个面试都拿不到，是我四月开始投太晚了还是说没有论文没啥竞争力？😭😭😭

我的简历长这样

点赞评论收藏

分享

04-22 19:51

门头沟学院 Java

bg末211本，一段杭州小厂实习。从2月的腾讯提前批开投，到4月18日拼多多OC结束。直到4.18之前手上只有一个北京搜狐畅游的offer，一度感觉要G。到最后也只有pdd在流程，最后有惊无险的OC了。 不过在HR面当天，收到字节约面，最后到字节约三面当天pdd发offer了。后续想了想还是去pdd了，把字节拒了（pdd只有5天确认，字节不一定赶得上，不敢赌） 只能说面试运气还是很重要的，感谢pdd给机会，就是对不住字节了，秋招再来🙏

Hanak01_offer多多版：其实可以跟字节hr说一下这个情况，感觉能让hr快速推进一下

我的OC时间线

点赞评论收藏

分享

03-15 18:33

湖北经济学院 Java

今年春招，到现在还0offer😅😅

练习JAVA时长两年半：qps 30000

点赞评论收藏

分享

昨天 07:41

同济大学 ARM工程师

谈谈延毕到底是好还是坏

我最近刷到好多同学谈论错过春秋招能不能再延毕一年，等下一个秋招。不过好多人还是迫不得已延毕比如,迫于学业压力、身体因素、学分不够(这还是少数)、缓解就业压力。我就从我这个过来人来说一下你如果选择延毕你将要面临什么问题以及延毕究竟性价比高吗。延毕面临的问题如果你想延毕先看看这些问题你会不会碰到，能不能接受,能接受我们再说好坏1.如果你是被迫延毕你将会碰到你此前签的所有就业协议都会被迫停滞，即便你勉力入职了，未来也可能被辞退。有考公考研考编想法的也不能再继续了，除非取得双证。未来所有的规划都会被打乱。延毕不会影响考公考研的报考审核，但是面试会减分！！而且大多数人很难有一个完美的理由来解释延毕。列一...

牛客创作赏金赛

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

华为暑期进展

热聊中

创作者周榜

更多

正在热议

更多

# 实习进度记录 #

212495次浏览 2615人参与

# 找不到好工作选择GAP真的丢人吗 #

48217次浏览 496人参与

# 平安产险科技中心求职汇总 #

245635次浏览 2619人参与

# 浅聊一下我实习的辛苦费 #

210307次浏览 1569人参与

# 秋招提前批启动你开冲了吗 #

113057次浏览 1868人参与

# 我的求职精神状态 #

20756次浏览 382人参与

# 五一出游找搭子 #

5563次浏览 68人参与

# 产品人求职现状 #

201175次浏览 1849人参与

# 怎么防止在试用期被辞退 #

115147次浏览 865人参与

# 毕业论文怎么查AI率 #

13458次浏览 880人参与

# 机械人避雷的岗位/公司 #

11511次浏览 67人参与

# 一觉醒来，我成论文导师了… #

8792次浏览 181人参与

# SHEIN求职进展汇总 #

8951次浏览 39人参与

# 哪些瞬间让你真切感受到了工作的乐趣 #

8274次浏览 53人参与

# Tplink求职进展汇总 #

121663次浏览 688人参与

# 哪个瞬间让你对大厂祛魅了？ #

294555次浏览 2198人参与

# 为什么国企只招应届生 #

160572次浏览 1103人参与

# 你觉得材料多少算高薪 #

18347次浏览 145人参与

# 大城市找工作会更容易吗 #

20850次浏览 187人参与

# 小红书取消大小周 #

20115次浏览 108人参与

# 机械人怎么评价今年的比亚迪 #

52168次浏览 179人参与

牛客网
牛客企业服务