R语言之词云:wordcloud&wordcloud2安装及参数说明

2023-11-10

一、wordcloud安装说明

      install.packages("wordcloud");

二、wordcloud2安装说明

      install.packages("devtools");     

      devtools::install_github("lchiffon/wordcloud2",type="source") 

      错误提示:

 

      解决办法:

      install.packages("htmltools");

三、wordcloud参数说明

3.1 函数原型

 wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE, random.color=FALSE, rot.per=.1,colors="black",ordered.colors=FALSE,use.r.layout=FALSE,...)

3.2 常用参数

1words——关键词列表

2freq——关键词对应的词频列表

3scale——字号列表。c(最大字号, 最小字号)

4min.freq——最小限制频数。低于此频数的关键词将不会被显示。

5max.words——限制词云图上关键词的数量。最后出现在词云图上的关键词数量不超过此限制。

6random.order——控制关键词在图上的排列顺序。T:关键词随机排列;F:关键词按频数从图中心位置往外降序排列,即频数大的词出现在中心位置。

7random.color——控制关键词的字体颜色。T:字体颜色随机分配;F:根据频数分配字体颜色。

8rot.per——控制关键词摆放角度。T:水平摆放;F:旋转90度。

9colors——字体颜色列表

10ordered.colors——控制字体颜色使用顺序。T:按照指定的顺序给出每个关键词字体颜色,(似乎是要求颜色列表中每个颜色一一对应关键词列表);F:任意给出字体颜色。

11use.r.layout=T;F

  四、wordcloud2参数说明

4.1 函数原型

wordcloud2(data, size = 1, minSize = 0, gridSize =  0, 

fontFamily = NULL, fontWeight = 'normal',

color = 'random-dark', backgroundColor = "white", minRotation = -pi/4, maxRotation = pi/4, rotateRatio = 0.4,  shape = 'circle', ellipticity = 0.65, widgetsize = NULL)

4.2 常用参数:

(1)data:词云生成数据,包含具体词语以及频率;

(2)size:字体大小,默认为1,一般来说该值越小,生成的形状轮廓越明显;

(3)fontFamily:字体,如‘微软雅黑’;

(4)fontWeight:字体粗细,包含‘normal’,‘bold’以及‘600’;;

(5)color:字体颜色,可以选择‘random-dark’以及‘random-light’,其实就是颜色色系;

(6)backgroundColor:背景颜色,支持R语言中的常用颜色,如‘gray’,‘blcak’,但是还支持不了更加具体的颜色选择,如‘gray20’;

(7)minRontatin与maxRontatin:字体旋转角度范围的最小值以及最大值,选定后,字体会在该范围内随机旋转;

(8)rotationRation:字体旋转比例,如设定为1,则全部词语都会发生旋转;

(9)shape:词云形状选择,默认是‘circle’,即圆形。还可以选择‘cardioid’(苹果形或心形),‘star’(星形),‘diamond’(钻石),‘triangle-forward’(三角形),‘triangle’(三角形),‘pentagon’(五边形);

 

备注:中文分词工具:

 

install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")

示例程序:

#第一步,文本分词
require(Rwordseg)
test<- readLines("E:\\FBB1.txt",encoding='UTF-8')     #读取数据
res = test[test != " "]      #读取test,且剔除test=“ ”
words = unlist(lapply(X = res,FUN = segmentCN))   #分词,并调整表结构,将有相同词频的词归类
word = lapply(X = words,FUN = strsplit," ")       #给每个词根据顺序赋个顺序指
v = table(unlist(word))               #重建表
v = sort(v,deceasing=T)           #降序排列
v[1:100]
head(v)                                           #给每列字段赋标题
d = data.frame(word = names(v),freq = v)         #更改标题
write.csv(d,"E:\\学习.csv",header = T)          #导出数据,为下一步做准备

 

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R语言之词云:wordcloud&wordcloud2安装及参数说明 的相关文章

  • 聚类算法(二)--层次聚类法

    本文主要介绍层次聚类法的基本原理 距离计算方法 算法的优缺点 以及R语言实战 一 概述 层次聚类 Hierarchical Clustering 试图在不同层次上对数据集进行划分 从而形成树形的聚类结构 数据集的划分可采用 自底向上 的聚合
  • Navicat for MySQL客户端启动报missing required library libmysq_e.dll126 错误

    Navicat for MySQL客户端启动报missing required library libmysq e dll126 错误 是因为缺少libmysq e dll 文件所致 下载libmysq e dll 文件拷贝到到Navica
  • Rstudio更换主题/样式

    github项目地址 https github com gadenbuie rsthemes 安装 在 rstudio 的控制台console中数据 install packages devtools devtools install gi
  • 看书标记【R语言数据分析与挖掘实战】4

    第四章 数据预处理 4 1 数据清洗 缺失值处理 使用is na 判断缺失值是否存在 complete cases 可以识别样本数据是否完整从而判断缺失情况 删除法 na omit 函数移除所有含有缺失数据的行 data p 删除p列 替换
  • Error in createDataPartition(...):y must have at least 2 data points

    项目场景 在R中使用caret包 划分训练集和测试集时 出现错误Error in createDataPartition data OS STATUS p 0 5 list FALSE y must have at least 2 data
  • 三句话,我让R语言自动升级了

    R语言是为数学研究工作者设计的一种数学编程语言 主要用于统计分析 绘图 数据挖掘 跟所有计算机语言一样 R语言也面临升级的问题 本文讲述了最快捷的升级R语言办法 不用重新安装之前的安装包 首先 进入R交互模式 然后三条命令搞定 instal
  • 生信技能树R语言学习

    一 数据类型和向量 1 数据类型 1 1 判断数据类型class 1 2 按Tab键自动补全 1 3 数据类型的判断和转换 1 is 族函数 判断 返回值为TRUE或FALSE is numeric 123 is character a i
  • 1.R语言基础知识

    目录 一 R语言的介绍 R语言的下载与按照 Rstudio R包的安装 工作空间管理 基本运算 二 R的数据结构 1 数据类型 2 数据类型的转换和判断 3 数据结构 三 导入 导出数据 获取内置数据集 获取其他格式的数据 四 数据框的常用
  • R语言实现文本情感分析

    在本博客中 我们将介绍如何使用R语言进行文本情感分析 我们将介绍如何处理文本数据 构建模型 训练模型并进行情感预测 这里我们将使用IMDb电影评论数据集进行示例分析 数据准备 首先 我们需要下载并加载IMDb电影评论数据集 可以从这里下载数
  • r如何让新增加的列出现在第一列 r如何调整新增加的列的位置

    https www cnblogs com liujiaxin2018 p 16211983 html 1 任意位置插入列 复制代码 gt a lt letters 1 5 gt b lt LETTERS 1 5 gt c lt sampl
  • 统计学三大分布(卡方、t、F)即相应概率密度图的R语言实现

    三大统计分布 1 2 chi 2 2分布 设随机变量 X 1
  • 统计建模与r软件课后习题五 5.1~5.11题

    第五章 假设检验 问题导向 由正常男子血小板计数均值这句话 容易判断属于对均值进行检验的问题 H0 与正常男子无差异等于225 H1 与正常男子有差异 不等于225 x c 220 188 162 230 145 160 238 188 2
  • R数据科学-第九章使用lubridate处理日期和时间

    本章将会使用以下三个包 gt library tidyverse gt library lubridate gt library nycflights13 一 创建日期或时间 表示日期或时间的数据有三种 日期 在tibble中显示为date
  • 使用lattice包的bwplot函数绘制箱图比较多个模型在不同指标上的性能差异(R语言)

    使用lattice包的bwplot函数绘制箱图比较多个模型在不同指标上的性能差异 R语言 箱图是一种常用的数据可视化方法 用于表示一组数据的分布特征 包括中位数 四分位数 异常值等 在比较多个模型在多个指标上的性能差异时 箱图可以提供直观的
  • 不同kNN模型在R语言中的比较

    不同kNN模型在R语言中的比较 k近邻 k Nearest Neighbors 简称kNN 是一种常见的机器学习算法 被广泛用于分类和回归问题 它基于一个简单的假设 与某个样本集中距离最近的k个样本具有相似的特征和标签 本文将探讨在R语言中
  • R-INLA Project目录

    集成嵌套拉普拉斯近似法 INLA 是一种近似贝叶斯推断的方法 在过去的几年里 由于其速度和通过R INLA软件包的易用性 它已经成为马尔科夫链蒙特卡洛等其他方法的替代品 尽管INLA方法的重点是可以表达为潜伏高斯马尔可夫随机场 GMRF 的
  • 2021-05-03

    一 R中安装 phyloseq 的方法 很多网上的教程使用的都是 source https bioconductor org biocLite R biocLite phyloseq 但是我尝试了很多次 最后还是没有成功 下面能成功安装 p
  • R语言实现RMF模型

    RMF模型说明 RMF模型是客户管理中 常被用来衡量客户价值和客户创利能力的重要方法 它主要考量三个指标 最近一次消费 Recency 近期购买的客户倾向于再度购买 消费频率 Frequency 经常购买的客户再次购买概率高 消费金额 Mo
  • 主成分分析R语言实现

    主成分分析是一种常见的降维统计方法 它通过适当的变量替换 使得新变量成为原变量的线性组合 并且新变量间彼此独立 从而可从错综复杂的关系中寻求主要成分信息 揭示变量内在关系 本次主要分享的是该方法的R语言实现 目录 数据集展示 一 计算相关系
  • R语言——基本操作(二)

    目录 一 矩阵与数组 二 列表 三 数据框 四 因子 五 缺失数据 六 字符串 七 日期和时间 参考 一 矩阵与数组 matrix 创建矩阵 nrow 和 ncol 可以省略 但其值必须满足分配条件 否则会报错 只写一个值则自动分配 默认按

随机推荐

  • 计算机复习6----码分多址CDMA计算

    该部分知识位于书P57 看题 解法 将 A B C D每个的码片与收到的码片序列 逐个进行乘法 例 1 将A中第一位 1与S中第一位 1 相乘 得 1 2 第二位 1 1 1 以此类推 3 得 1 1 3 1 1 3 1 1 4 对所得 相
  • 在Java中使用tabula提取PDF中的表格数据

    问题 如何将pdf文件中指定的表格数据提取出来 尝试过的工具包有 pdfbox tabula 最终选用tabula 两种工具的比较 pdfbox 其中 pdfbox能将pdf中的内容直接提取成String 代码片段 public stati
  • 梦断代码阅读笔记01

    以前的我很难理解软件时间这个问题 以为就是敲代码的时间总和就是 因为以前的我在做项目的时候没有计划 直接上来就是敲 没有任何预估 但是读完这本书的前一部分发现 我以前真是太愚昧了 真正的项目不单单是敲代码 反而敲代码占得比例还不是很大 而主
  • C++内存泄漏及解决办法

    1 C 内存泄漏是什么 内存泄漏指的是由于疏忽或错误造成了程序未能释放掉不再使用的内存 2 造成的后果 性能不良 内存会耗尽 3 C 没有垃圾回收机制 我们需要关注那些类型的内存泄漏 堆内存泄漏 在内存中程序员手动分配的一块内存 mallo
  • IDEA将java项目打包为jar包

    方法 首先在src gt resources目录下建立一个文件夹 然后再在新建文件夹里面建立META INF文件夹 不推荐直接建立META INF 否则后面打包完的jar包需要手动修改配置 然后点击File gt Project Struc
  • R - 简单随机抽样

    本文使用的包 library tidyverse library moderndive 使用的数据集 总共有2400个红球和白色球 bowl 此处采用简单随机抽样 从2400个球中估算出红球所占比例 采用不同的抽取方法 一组是一次性抽取30
  • 使用docker搭建自己的jupyterhub多用户服务器

    1 选择基础镜像 这里我们选择jupyterhub的官方镜像 docker pull jupyterhub jupyterhub 2 启动容器 docker run p 8000 8000 d name jupyterhub jupyter
  • EndnoteX7/8/9参考文献不按顺序出现

    1 问题 EndNote插入文献序号正文的文献引用和后面的序号都能一一对上 但是正文中的排序并不按照行文顺序来 好尴尬 其实出版论文里有不按 1 2 3 顺序出现的文章 不过大多是严格按 1 2 3 顺序的文章 换句话说也就是说EndNot
  • Git 之 上传本地仓库到远程仓库

    文章目录 需求 切记 新建远程仓库 添加ssh key 在本地建立仓库 添加文件 git remote add git add git commit git push 参考连接 需求 建立远程仓库 在本地建立工程及仓库 将本地仓库push到
  • (二)zookeeper实战——zookeeper集群搭建

    前言 本节内容我们主要介绍一下如何在centos系统下搭建一套高可用的zookeeper集群 zookeeper是我们常用的中间键之一 例如使用zookeeper实现分布式锁 Hadoop集群高可用 kafka集群高可用等等 我们以以下三台
  • OD动调之脱壳:使用ESP定律寻找

    OD动调之脱壳 使用ESP定律寻找 using OD F8 sigle step Until stop Then data window follow Block then F9 Jmp gt oep 401171 You can unpa
  • android 腾讯微博开发 OAuth认证(一):获取请求指令RequeToken

    第一步 下载腾讯微博SDK 第二步 创建Android项目 并配置Build Path 加入SDK中httpmime 4 1 3 jar Android SDK v1 2 jar的源文件 里面包含错误需要自己进行相关的修改 两个库文件 相关
  • STM32开发实例 基于STM32单片机的智能机房系统

    一 系统设计 由 STM32F103C8T6单片机最小系统 DHT11温湿度传感器 ACS712测电流模块 MO 2烟雾传感器 ESP8266无线传输模块 可以通过RSP8266将温湿度值 烟雾浓度值 测得电流值显示到上位机 在上位机可以调
  • orange's一个操作系统的实现的前五章文件组织整理

    Orange s一个操作系统的实现的前五章文件组织整理 Tree Makefile a img 虚拟软盘 bochsrc bochs虚拟机配置 boot boot asm 编译为boot bin文件后被BIOS加载到内存 然后在a img中
  • CentOS7编译安装Nginx(Openresty)

    环境准备 yum y install automake autoconf libtool make gcc gcc c gcc g77 readline devel pcre devel openssl devel tcl perl lib
  • ABP.io 迁移数据库遇到的BUG

    文章目录 项目描述 1 Your startup project AbpDemo Application doesn t reference Microsoft EntityFrameworkCore Design 2 An error o
  • idea隐藏文件或文件夹

    strings gt Editor gt File Types gt Ignored Files and Folders中添加要隐藏的文件或文件夹 支持通配符
  • 【netty】Netty粘包问题TooLongFrameException: Adjusted frame length exceeds

    文章目录 1 概述 1 概述 此问题参考 Flink Flink 任务报错 akka remote connection TooLongFrameException adjusted frame length discarded 我这里主要
  • 边缘计算概念以及应用

    什么是边缘计算 边缘计算是为应用开发者和服务提供商在网络的边缘侧提供云服务和IT环境服务 边缘计算的目标是在靠近数据输入或用户的地方提供计算 存储和网络带宽 边缘计算 是一种分散式运算的架构 在这种架构下 将应用程序 数据资料与服务的运算
  • R语言之词云:wordcloud&wordcloud2安装及参数说明

    一 wordcloud安装说明 install packages wordcloud 二 wordcloud2安装说明 install packages devtools devtools install github lchiffon w