R 中具有两个单独值的词云

2024-02-02

作为 R 新手，我正在制作一个显示两个变量的词云：frequency and rating。使用通用表格，我希望按州显示假设的大学数量（字体=数字从大到小）以及假设的平均大学评级

1 = 绿色（良好），
3 = 黄色（平均），
5 = 红色（坏）

我能够创建这个描述字体 = 大学数量的云，但无法将评级与第三列联系起来。这是我的通用表：

State   Colleges    Rating
Alabama        220      1
Alaska         100      3
Arizona         50      5
Arkansas       275      1
California     155      3
Colorado        68      5
Connecticut    235      1
Delaware       189      3
Florida         32      5
Georgia        219      1
Hawaii         117      3
Idaho           63      5
Illinois       264      1
Indiana        167      3
Iowa            76      5
Kansas         287      1
Kentucky       178      3
Louisiana       67      5
Maine          246      1
Maryland       169      3
Massachusetts   46      5
Michigan       225      1
Minnesota      132      3
Mississippi     23      5
Missouri       219      1
Montana        194      3
Nebraska        97      5

下面是我非常简单的脚本：

library(wordcloud)
library(rcolorbrewer)

data <- read.csv("wordcloud.csv", header = T)
pal <- brewer.pal(9, "RdYlGn")
wordcloud(data$State, data$Colleges, scale = c(4,1), colors = pal, rot.per=.5)

上面的脚本允许文本大小反映大学数量，但我无法链接 1 = 绿色（好）到 3 = 黄色（平均）到 5 = 红色（差）的色带。非常感谢任何建议。

在这种情况下，还可以绘制比较云。

为此，我们首先将数据从长格式转换为宽格式：

library(reshape2)
df1 <- dcast(df1,State + Colleges ~ Rating, value.var = "Colleges")

然后我们执行一些标准操作来准备合适的矩阵：

rownames(df1) <- df1[,1] #use name of States as row names
df1 <- df1[,-c(1,2)] #remove "States" and "Colleges" column
df1[is.na(df1)] <- 0  #set NA values to zero
df1 <- as.matrix(df1) #convert into matrix
colnames(df1) <- c("good", "average", "bad")

最后，我们可以绘制比较云并根据需要为各组分配颜色：

library(wordcloud)
comparison.cloud(df1,max.words=Inf,random.order=FALSE, scale = c(4,.5), 
                     title.size = 1,  colors=c("green","orange","red"))

data

df1 <- structure(list(State = structure(1:27, .Label = c("Alabama", 
"Alaska", "Arizona", "Arkansas", "California", "Colorado", "Connecticut", 
"Delaware", "Florida", "Georgia", "Hawaii", "Idaho", "Illinois", 
"Indiana", "Iowa", "Kansas", "Kentucky", "Louisiana", "Maine", 
"Maryland", "Massachusetts", "Michigan", "Minnesota", "Mississippi", 
"Missouri", "Montana", "Nebraska"), class = "factor"), Colleges = c(220L, 
100L, 50L, 275L, 155L, 68L, 235L, 189L, 32L, 219L, 117L, 63L, 
264L, 167L, 76L, 287L, 178L, 67L, 246L, 169L, 46L, 225L, 132L, 
23L, 219L, 194L, 97L), Rating = c(1L, 3L, 5L, 1L, 3L, 5L, 1L, 
3L, 5L, 1L, 3L, 5L, 1L, 3L, 5L, 1L, 3L, 5L, 1L, 3L, 5L, 1L, 3L, 
5L, 1L, 3L, 5L)), .Names = c("State", "Colleges", "Rating"), 
class = "data.frame", row.names = c(NA, -27L))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

WordCloud

R 中具有两个单独值的词云的相关文章

如何提取与 R 中主题 ID 列表匹配的行？

我有一个包含许多主题 ID 的数据框每个主题都有重复观察我还有一个单独的数据框其中只有一个主题 ID 列表我想从更大的数据框中匹配和提取如何以允许我引用不同数据帧中的SubjectID列表的方式编写代码不确定我是否完全理解这个问
从 R 中的向量中选择所有可能的元组

我正在尝试用 R 编写一个程序当给定一个向量时将返回所有可能的tuples http en wikipedia org wiki Tuples该向量中的元素例如元组 c a b c c a b c 出租车 c a c c b c c
基于服务器中的条件逻辑呈现闪亮的用户输入

我正在尝试设置一个闪亮的导航栏面板页面其中用户控制我根据一组单选按钮中所做的初始选择来显示更改我直接在 ui 中渲染单选按钮然后在 Server r 中的观察到的逻辑控制结构内构建条件控件弹出错误是因为我的初始 if 语句计算结
将 Instagram/youtube 嵌入 Shiny R 应用程序

我想通过点击图表来播放 Instagram 或 Youtube 视频例如显示异常值等到目前为止明确告诉 Shiny 视频内容是有效的 require shiny require ggplot2 data df lt data fram
如何对同一列上的数据帧列表中的所有数据帧进行排序？

我有一个数据框列表dataframes list 举个例子我把dput dataframes list 在底部我想对列列表中的所有数据框进行排序enrichment 我可以对一个数据框进行排序 first dataframe lt da
将年月格式转换为 POSIXct [重复]

这个问题在这里已经有答案了我有一些年月形式的数据我想将其格式化以用于绘图ggplot date lt c 2016 03 2016 04 2016 05 2016 06 2016 07 2016 08 2016 09 2016 10 2
LDA with topicmodels，如何查看不同文档属于哪些主题？

我正在使用 topicmodels 包中的 LDA 我已经在大约 30 000 个文档上运行它获取了 30 个主题并获得了主题的前 10 个单词它们看起来非常好但我想看看哪些文档属于哪个主题的概率最高我该怎么做 myCorpus
使用 broom 和 tidyverse 总结 r 平方游戏

我发布了一个问题here https stackoverflow com questions 48627287 getting adjusted r squared value for each line in a geom smooth
如何用外部图像填充地图边界？

我正在创建一张带有州边界的巴西地图这可以直接使用ggplot2 and geom sf 然而这一次我不想用数据填充每个状态的颜色而是想用外部图像 png 填充每个状态的边界类似于this https online olivet e
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
选择 R 中的数据表中隐藏时（在绿色加号下方）列的显示顺序

Context 使用 DataTables 库制作交互式表格时当屏幕宽度对于列的数量和宽度来说太窄时列将隐藏在绿色号下我有一个非常宽的表格有 20 多列其中一些内容非常冗长因此某些列在所有屏幕宽度下总是隐藏的每次隐藏新列时
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
绘制点之间的所有线

我有以下 R 代码 x lt c 0 01848598 0 08052353 0 06741172 0 11652034 y lt c 0 4177541 0 4042247 0 3964025 0 4074685 d lt data fr
kernlab 中 SVM 训练之外的核矩阵计算

我正在开发一种新算法该算法可以生成修改后的核矩阵以用于 SVM 训练但遇到了一个奇怪的问题出于测试目的我比较了使用 kernelMatrix 接口和普通内核接口学习的 SVM 模型例如 Model with kernelMatri
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
在 R 中使用 lapply 绘制多个数据帧

我正在尝试使用 lapply 函数绘制多个数据帧每个数据帧一个图但是尽管有关此主题的所有帖子我都找不到答案因为我不断收到错误图的输出列表为空我的数据结构如下 df1 lt mtcars gt group by cyl gt tal
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这

随机推荐

Java byte[] 到字符串转换输出字节

在我的代码中我通过互联网发送一个编码为字节数组的 txt 文件然后在另一端将消息转换回并显示它问题是当我尝试显示它时它总是显示为 B 1ef9f1d 或 B 1764be1 等这是接收数据的地方 private void par
C语言UART通信（十六进制）

我想向写入函数发送一个十六进制值例如 0 90 这是因为需要通信的设备接收到的是十六进制数的命令未使用的变量在测试时出现并注释为丢失十六进制值稍后将被删除如何编写具有字符串以外的十六进制值的写入函数对于初学者请告诉我们如何通过
Ransack：如何使用不同的别名多次连接表？

假设我有 items 与 has many 与 properties 关联那么我可以像这样搜索具有名称为 a name 和值 a value 的属性的所有项目 q properties name eq a name properties
C - 指针初始化，星号位置[重复]

这个问题在这里已经有答案了放置星号的最正确方法是什么为什么 1 type var 2 type var 只要您只声明一个指针这并不重要它通常像第二个示例一样编写在我通常读写的代码中但对于编译器来说是相同的如果您声明多个指针
目标 C：如何解决代码中的泄漏（来自仪器的结果）

我为我的应用程序运行了仪器其中包含 UITableView 并得到了以下结果每次单元格变得可见时单元格将调用方法 UICustomButton SetButtonWithAnswer 编辑添加了更多屏幕截图问题是我不确定到底是什么
将计算列添加到 pandas 数据框中

我对 Python pandas 和一般编程完全陌生我无法弄清楚以下内容我在 pandas 的帮助下访问了数据库并将查询中的数据放入数据框 df 中其中一列包含生日可以采用以下形式 1980 年 1 月 25 日字符串 01 2
CYPHER 查询中的 LIKE 子句

Cypher 查询似乎不支持 LIKE 是否有任何其他构造可以执行相同的任务例如 start n node where n Name LIKE SUBSTRING return n Name n 使用正则表达式 http neo4j co
“%H:%M”格式的时间增量

有一种方法可以转换timedelta列转换为 H M 格式的字符串我什至需要这个timedeltas超过24小时我想这样做是为了制作一个可在类似电子表格的软件 excel google Sheets 中使用的 csv 文件没有任何内置
Nodejs for 循环并等待循环完成

我有以下代码 Marks all users which are reading the book with the bookId var markAsReading function bookId cb User find functio
詹金斯转义 sed 命令

有人可以为我在 Jenkins groovy 脚本中转义这个 sed shell 命令吗 So hard sh sed s AssemblyInformationalVersion 1 productVersion 3 g Assembly
如何确定Android .so文件的ABI（即armeabi或armeabi-v7a）？

我有一个由第三方供应商提供的 so 文件该文件将包含在我的 Android 应用程序中我无法访问源代码也无法轻松联系供应商有没有办法让我通过检查 so 文件来确定它是否是针对armeabi or armeabi v7a ABI
如何使用其他表中的列/字段对 PostgreSQL 表进行集群

我想根据其他表中的信息对 PostgreSQL 表进行聚类想象一下两张桌子 foos id baz id name and bars foo id name bars foo id是一个外键引用foos id 我想对 bar 表进行聚类
我可以访问来自不同语言环境的 android 资源吗？

我的应用程序中有两个区域设置我可以访问资源例如来自不同语言环境的字符串数组而不更改当前语言环境吗我的意思是对于编码我不喜欢在设置中更改它更好的解决方案是如果您使用的是 API 17 NonNull protected St
在包安装期间执行 R 脚本

希望这有一个简单的答案但我还没有找到它我正在编写一个 R 包当安装在 Windows 上时我希望它执行一个搜索系统文件的脚本即list files path C Program Files 然后将该路径保存到包目录作为文本文件以供
使用 jquery 将 html 表格转为 excel

我有这个有效的 jquery 函数但我需要添加一些东西我在桌子上设置了一个过滤器来隐藏列当我隐藏列并单击导出时它无论如何都会使用所有字段如何只导出未隐藏的表列 var write to excel function var uri
使用 ggplot 在 R 中创建堆积百分比条形图

我一直在寻找一种方法能够根据受访者的性别分类将堆积条形图响应显示为百分比值我成功地使用变量性别进行填充创建了堆积条形图但我希望该图显示该变量之间的比例我知道使用 count sum count 和 scale y 可以更改 y
使用WCF上传文件

我需要一个 WCF 服务来由用户上传大文件以下哪一项提供了更优化的性能 OperationContract public void UploadFile Stream inputsreaam or OperationContract pu
在 EF6 中将匿名类型转换为 IEnumerable<>

我正在使用实体框架开发 MVC 应用程序我想从表中获取 5 列并将它们返回到一个IE可枚举类型我的代码是 IEnumerable
T-SQL 将日期时间修剪为最近的日期？

重复的删除日期时间值 SQL Server 的时间部分的最佳方法是什么 https stackoverflow com questions 2775 我有一个列用于跟踪使用日期时间创建事物的时间但我想生成一个按天分组的报告因此我需要
R 中具有两个单独值的词云

作为 R 新手我正在制作一个显示两个变量的词云 frequency and rating 使用通用表格我希望按州显示假设的大学数量字体数字从大到小以及假设的平均大学评级 1 绿色良好 3 黄色平均 5 红色坏我能够创建这个

R 中具有两个单独值的词云

R 中具有两个单独值的词云 的相关文章

随机推荐

热门标签

R 中具有两个单独值的词云的相关文章