python怎么生成词云图

2023-10-31

  1. 词云图是什么?

词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。

相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。

2.怎么使用python制作词云图?

制作词云图很简单,首先需要导入3个库:

import jieba
import wordcloud
import imageio

其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。

然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明

bg=imageio.v2.imread('D:\kgr1.jpg')
with open('D:/111.txt',encoding='utf-8') as f:
    t=f.read()

提取关键字

ls=jieba.lcut(t)
txt=" ".join(ls)

生成词云

w=wordcloud.WordCloud(width=1000,height=700,#词云比例
font_path="msyh.ttc",colormap='pink',#字体&颜色
background_color='white',mask=bg)#背景色&模板
w.generate(txt)
w.to_file(r'D:\pic.png')

效果图如下:

背景模板图片:

生成的词云图:

引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。

wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:

wordcloud = WordCloud(font_path='simhei.ttf',  # 字体
                              prefer_horizontal=  ,#大部分都是横向排放
                              background_color='  ',  # 背景色
                              max_words=  ,  # 显示单词数
                              max_font_size=  ,  #最大字号
                              stopwords=   ,  # 过滤噪声词
                              mask=  ,#背景轮廓
                              colormap=   ,#使用自定义颜色
                              collocations=False
                              ).generate(txt)
    image = wordcloud.to_image()
    image.show()  # 展示图片
    wordcloud.to_file(' ')  # 保存图片

3.遇到的坑

做词云图会遇到第三方库安装失败的情况。

试了很多的方法,最后发现以下的方法是可行的:

wordcloud:

安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:

https://www.lfd.uci.edu/~gohlke/pythonlibs/

这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。

下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。

jieba:

同理,但可以试试到这个链接下下载:

https://pypi.tuna.tsinghua.edu.cn/simple/jieba/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python怎么生成词云图 的相关文章

随机推荐

  • 【小程序】input输入双向数据绑定

    小程序中 input标签中的数据为单向绑定
  • 7.27 Qt

    制作简易小闹钟 Timer pro QT core gui texttospeech greaterThan QT MAJOR VERSION 4 QT widgets CONFIG c 11 The following define ma
  • ubuntu 配置nfs 出现Failed to start nfs.service: Unit nfs.service not found

    ubuntu 10 0开启配置nfs 服务service nfs start时出现 Failed to start nfs service Unit nfs service not found 原因是ubuntu 10 0以上的版本取消了s
  • Pycharm--flake8的配置使用

    前言 Flake8 是由Python官方发布的一款辅助检测Python代码是否规范的工具 Flake8检查规则灵活 支持集成额外插件 扩展性强 一 安装flake8 进入虚拟环境 pip install flake8 二 在pycharm中
  • 安装imageio

    在python下安装imageio cmd中输入如下 pip install imageio
  • EWM100学习笔记(一)

    Unit 1 EWM与WM模块的差异 英文不太好 大概翻译了一部分内容 第一张大概介绍了一下WM与EWM各自的作用 最后总结了一下EWM相比WM的优势 SAP的常规操作 S 4后干脆就直接没有了WM模块 直接推EWM WM主要的功能 Tra
  • CSS-颜色属性+颜色函数+自定义变量

    最近更新时间 2017年5月8日16 08 13 我的博客地图 离开校园踏入职场 不是到达人生巅峰 而是人生才刚刚开始 校园里学的知识远不足工作需求 而且校园里的学习深度也比较浅显 因此 对于刚毕业前三年的工程师来说 马不停蹄不分昼夜的学习
  • 睿智的目标检测41——Pytorch搭建Retinanet目标检测平台

    睿智的目标检测41 Keras搭建Retinanet目标检测平台 学习前言 什么是Retinanet目标检测算法 源码下载 Retinanet实现思路 一 预测部分 1 主干网络介绍 2 从特征获取预测结果 3 预测结果的解码 4 在原图上
  • 思维模式

    1 整体思维 整体宏观的思考 2 反向思维 不断的问自己如果不这样 3 方法思维 不断的寻找方法 不断的提高自己 从知识范围 方法等宏观角度 还有特有技术方向
  • 字符输入流

    字符输入流 Character Input Stream 是用于从输入源 如文件 网络连接等 读取字符数据的流对象 在 Java 中 主要使用 java io Reader 及其子类来实现字符输入流的操作 FileReader 是 Java
  • uniapp 页面跳转的坑

    uniapp 页面跳转的坑 我们在使用 uniapp 的时候 经常使用到页面跳转 uniapp 的几个常用跳转我就不一一列表了 我就说我遇到的坑吧 如下图 我要从第一个页面跳到第二个页面 我在组件里面写的跳转 大家移位到下一张图 如下图 这
  • LaTex 使用特殊章节符号 (§)

    参考 LaTex 使用特殊章节符号 LaTex 使用特殊章节符号 在 tex文件开头 加上以下内容 usepackage utf8 inputenc usepackage cleveref crefname section Crefname
  • Android动画进阶指北

    原文链接 Android Animation Advanced Tricks 前面的文章介绍了动画的基本使用方法 本文来聊一聊涉及到动画的高级技巧 以及一些非常优质的学习资源和动画三方库和框架 页面之间的过渡动画 常规的动画都是针对某一页面
  • java配置文件中数据库密码加密

    最近 有位读者私信我说 他们公司的项目中配置的数据库密码没有加密 编译打包后的项目被人反编译了 从项目中成功获取到数据库的账号和密码 进一步登录数据库获取了相关的数据 并对数据库进行了破坏 虽然这次事故影响的范围不大 但是这足以说明很多公司
  • VScode使用pip已经下载了faker,但还是报错ModuleNotFoundError: No module named ‘faker‘

    修复一下pip python m ensurepip pip install faker 但是在安装faker的时候 出现了这样的情况 提示warning 换一种写法 pip install faker i http pypi douban
  • 给定一个介于0和1之间的实数,类型为double,打印它的二进制表示

    给定一个介于0和1之间的实数 0 625 类型为double 打印它的二进制表示 如果该数字无法精准地用32位以内的二进制表示 则打印 ERROR 先上代码 public class printbinary public static vo
  • ABAP DOI 技术

    用户提出的报表 是用EXCLE显示的 有许多特殊格式 比如 加粗 大小字体等 普通的ALV报表输出并不能满足用户的要求 那么只能用ALV与EXCLE的集成技术 目前已知的技术有两种 一种是OLE技术 用SMW0上传模板 然后填写数据 多数用
  • Springboot的pom.xml需要用到的依赖总结:

  • 蜣螂优化(DBO)算法(含MATLAB代码)

    先做一个声明 文章是由我的个人公众号中的推送直接复制粘贴而来 因此对智能优化算法感兴趣的朋友 可关注我的个人公众号 启发式算法讨论 我会不定期在公众号里分享不同的智能优化算法 经典的 或者是近几年提出的新型智能优化算法 并附MATLAB代码
  • python怎么生成词云图

    词云图是什么 词云图又称文字云 是信息可视化的表现形式之一 词云是把文本中出现频率较高的关键词进行视觉上的突出显示 形成关键词云层或关键词渲染 从而过滤掉大量的文本信息 读者可以快速领略文本的主旨 相对柱状图 折线图 饼图等用来显示数据的图