怎么使用python生成词云图
作者:夜之王。
词云图是什么?
词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。
相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。
怎么使用python制作词云图?
制作词云图很简单,首先需要导入3个库:
import jieba import wordcloud import imageio
其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。
然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明
bg=imageio.v2.imread('D:\kgr1.jpg') with open('D:/111.txt',encoding='utf-8') as f: t=f.read()
提取关键字
ls=jieba.lcut(t) txt=" ".join(ls)
生成词云
w=wordcloud.WordCloud(width=1000,height=700,#词云比例 font_path="msyh.ttc",colormap='pink',#字体&颜色 background_color='white',mask=bg)#背景色&模板 w.generate(txt) w.to_file(r'D:\pic.png')
效果图如下:
背景模板图片:
生成的词云图:
引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。
wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:
wordcloud = WordCloud(font_path='simhei.ttf', # 字体 prefer_horizontal= ,#大部分都是横向排放 background_color=' ', # 背景色 max_words= , # 显示单词数 max_font_size= , #最大字号 stopwords= , # 过滤噪声词 mask= ,#背景轮廓 colormap= ,#使用自定义颜色 collocations=False ).generate(txt) image = wordcloud.to_image() image.show() # 展示图片 wordcloud.to_file(' ') # 保存图片
遇到的坑
做词云图会遇到第三方库安装失败的情况。
试了很多的方法,最后发现以下的方法是可行的:
wordcloud:
安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:
https://www.lfd.uci.edu/~gohlke/pythonlibs/
这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。
下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。
jieba:
同理,但可以试试到这个链接下下载:
https://pypi.tuna.tsinghua.edu.cn/simple/jieba/
总结
到此这篇关于怎么使用python生成词云图的文章就介绍到这了,更多相关python生成词云图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!