Python使用wordcloud生成词云图

闲来无事,搞个词云玩玩,此功能用来数据分析的居多,请各位自行食用~

首先要安装了python的环境,将环境变量配置好,然后再安装pip,我这里因为没有识别pip,所以选择的是手动安装配置

使用pip –version(python2版本)或者pip3 –version(python3以上版本)查看是否安装好

我的pip位置是:

C:\Users\Administrator\AppData\Local\Programs\Python\Python310\Lib\site-packages\pip

在这个位置,添加一个pip.ini,内容如下:

[global]
index-url = https://mirrors.aliyun.com/pypi/simple/
timeout = 1000
trusted-host = mirrors.aliyun.com

安装完之后开始下载项目,项目地址:https://github.com/amueller/word_cloud

pip install wordcloud

wordcloud默认是为了英文文本来做词云的,如果需要制作中文文本词云,就需要先对中文进行分词。这里就需要用到中文分词库「jieba」

「jieba」是优秀的中文分词库,需要安装。它的原理是利用一个中文词库,确定中文字符之间的关联概率,汉字间概率大的组成词组,形成分词结果,除了分词,还可以添加自定义词组。

pip install jieba

这里使用jieba.lcut(s),返回列表型分词结果,s是形参,不是固定参数

新建一个文件,我是在桌面,新建test.py,如下:

Image

Image

在命令行中运行python test.py即可生成对应的效果图

主要参数详细说明:

font_path:字体路径。在win10系统中字体文件夹为C:\Windows\Fonts

width:输出的画布高度宽度,默认为400像素

height:输出的画布高度,默认为200像素

prefer_horizontal:词语水平方向排版出现的频率,默认 0.9。设置词语垂直方向排版出现频率为 0.1

mask : 用于设置自定义画布的背景

scale : 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍

min_font_size :显示的最小的字体大小,默认为4font_step :字体步长,默认为1,如果步长大于1,会加快运算但是可能导致结果出现较大的误差

mode:模式,默认为’RGB’,当为’RGBA’时,如果背景颜色为None,则会得到透明的背景

max_words :要显示的词的最大个数,默认为200

stopwords :停用词,设置需要屏蔽的词,标点符号、语气词等,如果为空,则使用内置的STOPWORDS

background_color : 背景颜色,默认是black(黑色)

max_font_size :显示的最大的字体大小

relative_scaling :词频和字体大小的关联性

regexp : 使用正则表达式分隔输入的文本

collocations :是否包括两个词的搭配,默认是True

=============================我是分割线=============================

关于lhy_comments.txt文件和641.png是我自己的图片和文件
主要是模拟接口获取的数据和词云生成的参考图形,词云的默认生成图形是长方形,参考如下:
Image
上传了指定的图片之后,就会生成对应的图片
Image

这个主要是WordCloud中mask参数控制的

Image
至此完成了词云图的生成~
参考链接:
https://mp.weixin.qq.com/s/FL_lt9QR3SoIeRycopEnxQ
https://cloud.tencent.com/developer/article/2321974

 

本文为 今天也想见到你 博客文章,转载无需和我联系,但请注明来自 今天也想见到你 博客 0925.wang
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Image
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇