网站用品推广网页,更新wordpress图片地址,2015做哪个网站致富,公司网络维修一种用Python生成词云
我们在阅读一篇很长的文章时#xff0c;总先看看文章的关键词来获知文章的大概内容。今天我们就来制作一个词云程序#xff0c;将文章中出现次数较多的词语提取出来#xff0c;生成一张词云图。词云图的生成原理#xff1a;
程序会将这篇文章中的所有…一种用Python生成词云
我们在阅读一篇很长的文章时总先看看文章的关键词来获知文章的大概内容。今天我们就来制作一个词云程序将文章中出现次数较多的词语提取出来生成一张词云图。词云图的生成原理
程序会将这篇文章中的所有词组识别出来然后统计每个词组出现的次数出现次数越多词组的字号越大最后把所有词组拼合成一张图像也就是我们想要的词云图。我们需要把这篇文章储存在一个txt文档里把这个文档和程序放在同一个文件夹下。
首先需要安装好了python的运行环境并且以pycharm作为默认工具,安装所需的第三方库,它们分别是jieba 和wordcloud.安装可以参考
https://www.jb51.net/article/141320.htm
然后开始制作词云程序。在pycharm中新建一个python文件。
首先调用jieba 和worldcloud模块。
import jieba
import worldcloud
接着我们把储存在程序目录下的txt文档命名为”b站测试题.txt”
在程序中输入以下代码来读取这个文档。
fopen(“b站测试题.txt”,”r”,encoding”gbk”)
现在我们要读取文档中的文字 把它储存在一个新的变量中
tf.read()
然后关闭文档
f.close()
然后提取词组
Isjieba.icut(t)
Txt” ”.join(Is)
现在我们已经将词组提取出来并用空格分开提取出来的词组保存在一个新的变量txt 里面
下一步我们要新建一个词云的对象 并设定一些参数
Wwordcloud.wordcloud(width2000,
Height1400,
Font_path”msyh.ttc”
)
在上面这段代码中我们新建了一个词云的对象并将其命名为。我们设定生成词云图片的宽度为2000像素高度为1400像素设定文字的字体为微软雅黑。
现在我们要把之前生成的词组变量txt导入词云对象w中。
w.generate(txt)
w.to_file(“pic.png”)
然后运行测试
打开程序所在的文件夹 我们可以看到这里生成了一个名为pic.png的图片文件。还可以进行个性化譬如换个背景色
只需要加入一行代码
Wwordcloud.wordcloud(width2000,
Height1400,
Background_color”Grey”
Font_path”msyh.ttc”
)
颜色可以查询下表也可以用16进制数值模式以#开头的6位16进制数表示颜色你可以在下面这个网站上找到自己想要的颜色的 进制颜色数值。
http://tool.oschina.net/commons?type3也可以使用colormap改变文字颜色
还以自定义词云显示行状譬如奔马、五角星等
我们需要准备一张白色背景的图片将其放到程序所在的文件夹里程序会把白色的背景抠除将文字放在主体部分再填充上背景颜色。这里我选了一个五角星的图片将它放置在程序所在的目录下
现在我们需要调用一个新的库imageioimageio是python自带的一个库可以用来读取图
像数据。
在程序开头添加下面的代码
import imageio
然后建立一个变量mask来读取图像数据
Maskimageio.imread(“五角星.png”)
然后我们需要在建立词云对象的代码中添加一行代码
Wwordcloud.wordcloud(width2000,
Height1400,
Font_path”msyh.ttc”
Maskmask,
)
运行如下图思路参考威海市文登区七里汤中学宋海霞《用python生成词云图》
除了用Pycharm还可以用sublime可以参考
https://blog.csdn.net/ydydyd00/article/details/80665028
未来的编程就这样很多基础的功能已经函数或者库化了直接调用就可以了。这样避免了频繁的制造锤子但是这些库大部分都是国外开发的国内直接“拿来主义”了未来会有越来越多的国产库了。