ggplot 的scale_y_log10 行为

2024-03-07

尝试使用绘制堆积直方图ggplot:

set.seed(1)
my.df <- data.frame(param = runif(10000,0,1), 
                    x = runif(10000,0.5,1))
my.df$param.range <- cut(my.df$param, breaks = 5)

require(ggplot2)

不记录 y 轴：

ggplot(my.df,aes_string(x = "x", fill = "param.range")) + 
    geom_histogram(binwidth = 0.1, pad = TRUE) + 
    scale_fill_grey()

gives:

但我想对 y 轴进行 log10+1 变换以使其更易于阅读：

ggplot(my.df, aes_string(x = "x", y = "..count..+1", fill = "param.range")) + 
    geom_histogram(binwidth = 0.1, pad = TRUE) + 
    scale_fill_grey() + 
    scale_y_log10()

这使：

y 轴上的刻度线没有意义。

如果我进行 log10 变换而不是 log10+1，我会得到相同的行为：

ggplot(my.df, aes_string(x = "x", fill = "param.range")) + 
    geom_histogram(binwidth = 0.1, pad = TRUE) + 
    scale_fill_grey() + 
    scale_y_log10()

知道发生了什么事吗？

看起来像是调用scale_y_log10使用堆叠直方图导致 ggplot 绘制product每个堆栈中每个组件的计数x垃圾桶。下面是一个演示。我们创建一个名为的数据框product.of.counts包含产品，在每个x每个的计数箱param.range垃圾桶。我们用geom_text将这些值添加到图中，并查看它们与每个直方图条形堆栈的顶部重合。

起初我以为这是一个错误，但后来一点搜索 https://stackoverflow.com/a/9507037/496488，我想起了 ggplot 进行对数转换的方式。正如链接的答案中所述，“scale_y_log10进行计数，将其转换为对数，堆叠这些对数，然后以反对数形式显示比例。然而，堆叠日志并不是线性变换，因此你要求它做的事情没有任何意义。”

举一个更简单的例子，假设堆积条形图的五个组成部分的计数均为 100。那么所有五个组成部分的 log10(100) = 2，对数之和将为 10。然后 ggplot 取尺度的反对数，它给出条形的总高度（即 100^5）10^10，即使实际高度为 100x5=500。这正是你的情节所发生的情况。

library(dplyr)
library(ggplot2)

# Data
set.seed(1)
my.df <- data.frame(param=runif(10000,0,1),x=runif(10000,0.5,1))
my.df$param.range <- cut(my.df$param,breaks=5)

# Calculate product of counts within each x bin
product.of.counts = my.df %>% 
  group_by(param.range, breaks=cut(x, breaks=seq(-0.05, 1.05, 0.1), labels=seq(0,1,0.1))) %>%
  tally %>%
  group_by(breaks) %>% 
  summarise(prod = prod(n),
            param.range=NA) %>%
  ungroup %>%
  mutate(breaks = as.numeric(as.character(breaks)))

ggplot(my.df, aes(x, fill=param.range)) + 
  geom_histogram(binwidth = 0.1, colour="grey30") + 
  scale_fill_grey() + 
  scale_y_log10(breaks=10^(0:14)) +
  geom_text(data=product.of.counts, size=3.5, 
            aes(x=breaks, y=prod, label=format(prod, scientific=TRUE, digits=3)))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ggplot 的scale_y_log10 行为的相关文章

R中添加水印

我在用magickR中的库我想在一些图片上添加水印 I used image annotate功能如下 img lt image read C Users Maydin Desktop manzara png image annotate
将命名参数列表传递给函数？

我想编写一个小函数来从适当的分布生成样本例如 makeSample lt function n dist params values lt makeSample 100 unif list min 0 max 10 values lt m
R::bigmemory - 如何创建角色big.matrix？

我尝试使用bigmemory封装在R我一开始就陷入困境我愿意 temp lt matrix paste a 1 10 5 2 并得到一个字符矩阵没关系但后来我尝试 x lt as big matrix temp type char 我
如何对同一列上的数据帧列表中的所有数据帧进行排序？

我有一个数据框列表dataframes list 举个例子我把dput dataframes list 在底部我想对列列表中的所有数据框进行排序enrichment 我可以对一个数据框进行排序 first dataframe lt da
如何在R中删除重复项

我有一个非常大的数据集如下所示 df lt data frame school c a a a b b c c c year c 3 3 1 4 2 4 3 1 GPA c 4 4 4 3 3 3 2 2 school year GPA
将年月格式转换为 POSIXct [重复]

这个问题在这里已经有答案了我有一些年月形式的数据我想将其格式化以用于绘图ggplot date lt c 2016 03 2016 04 2016 05 2016 06 2016 07 2016 08 2016 09 2016 10 2
numpy.histogram 的 hist 维度，密度 = True

假设我有这个数组 A array 0 0019879 0 00172861 0 00527226 0 00639585 0 00242005 0 00717373 0 00371651 0 00164218 0 00034572 0 008
kableExtra 中的 row_spec() 函数不会在 html 输出中创建水平线

我想在 kableextra 表中的某一行下方添加一条水平线 row spec 函数的参数 hline after 应该在行下方添加水平线 row spec 文档 https www rdocumentation org packages
计算每个唯一值出现的次数

假设我有 v rep c 1 2 2 2 25 现在我想计算每个唯一值出现的次数 unique v 返回唯一值是什么但不返回它们的数量 gt unique v 1 1 2 我想要一些能给我的东西 length v v 1 1 25 le
我无法下载 R 中的 reshape2 包 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试安装 R 包时收到此响应 gt installed packages reshape2 Package LibPath V
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
纵向序列数据的三次样条方法？

我有一个串行数据格式如下 time milk Animal ID 30 25 6 1 31 27 2 1 32 24 4 1 33 17 4 1 34 33 6 1 35 25 4 1 33 29 4 2 34 25 4 2 35 24
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
绘制点之间的所有线

我有以下 R 代码 x lt c 0 01848598 0 08052353 0 06741172 0 11652034 y lt c 0 4177541 0 4042247 0 3964025 0 4074685 d lt data fr
尝试读取 CSV 文件时出现“无法识别的字符串转义”

我正在尝试导入一个 csv文件以便我可以观看此视频 R ggplot2 图形直方图 http www youtube com watch v 47kWynt3b6M 我安装了所有正确的软件包包括ggplot以及相关的包视频中的第一个说
从命令行运行 R 代码 (Windows)

我在名为 analysis r 的文件中有一些 R 代码我希望能够从命令行 CMD 运行该文件中的代码而无需通过 R 终端并且我还希望能够传递参数并在我的代码中使用这些参数例如就像下面的伪代码 C gt execute r scri
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
在 r 中的 group_by 之后建模后取消列表列的嵌套

我想对所有组进行线性回归group by 将模型系数保存在列表列中然后使用 unnest 扩展列表列这里我用的是mtcars以数据集为例注我想用do here becausebroom tidy 不适用于所有型号 mtcars gt

随机推荐

我们可以在 CloudWatch 中为 Sagemaker 笔记本实例生成自定义日志吗？

CloudWatch 默认记录 Sagemaker 实例的日志例如内核启动内核关闭笔记本保存等不过我想列出一些自定义日志以及这些默认日志请看一下所附图片 Sagemaker 笔记本实例的默认日志在 CloudWatch 中的外观
WPF 文本框绑定到小数点尊重文化

我已将 TextBox 绑定到 Decimal 我的问题是绑定使用美国数字标准使用点进行小数分隔 1 5 我的系统是德语系统并配置为使用逗号作为小数分隔 1 5 我需要 TextBox 绑定来显示并使用逗号而不是点来分隔小数如何获得
Django 迁移错误：您无法更改 M2M 字段或从 M2M 字段更改，也无法在 M2M 字段上添加或删除 through=

我正在尝试将 M2M 字段修改为外键字段命令 validate 显示没有问题当我运行syncdb 时 ValueError Cannot alter field xxx into yyy they are not compatible
https://service.oneaccount.com/onlineV2_B/OSV2?event=login&pt=3 上的 QtNetwork SSL 握手错误

当我使用 QT 应用程序下载此页面时使用 QNetworkAccessManager gt get url 我在回复对象中收到网络错误 QNetworkReply NetworkError 错误字符串是 SSL 握手失败但是 sslEr
使用 PHP 生成 SNMP 陷阱

我正在拼命寻找一种从 PHP 生成 SNMP 陷阱的方法我知道使用 snmpget 的内置方法但我无法弄清楚如何发送 SNMP 陷阱有人知道它的类代码片段吗除了使用 exec 调用 cli 工具之外在网络上搜索没有找到任何其他内
条件切换的问题

下面的示例摘自http php net manual de control structs switch php http php net manual de control structures switch php
C 警告冲突类型

我的代码是 void doc mycode return 我的警告是 conflicting types for doc 任何人都可以解决它在 C 中如果调用函数时没有原型则假定返回一个int并采用未指定数量的参数然后当您稍后将函
使用 Azure 中的 ASP.NET Core 将用户会话保存在 Redis 中

我正在使用 redis 缓存来保存项目中的一些内容我正在使用 Azure WebApp 当我在预生产环境与生产环境之间进行交换时用户会话丢失他需要在我的网页中重新登录我正在使用 Identity 3 0 和 UseCookieAut
React-router v4 一次显示多个路由

我遇到一个问题我使用react router dom 的路由同时显示所有路由因此当我渲染我的应用程序组件和包含路由的开头时我会看到每个路由的页面彼此重叠所以它看起来像这样现在开始这一切是如何开始的这是我的 index jsx
MySQL 17.6m rows (1.2 GB)全表更新太慢

我有一张有 17 6m 行的表 CREATE TABLE tmp hist ti int 11 DEFAULT NULL cip6 varchar 15 DEFAULT NULL date varchar 20 DEFAULT NULL f
如何使用案例类将简单的 DataFrame 转换为 Spark Scala DataSet？

我正在尝试将 Spark 中的示例中的简单 DataFrame 转换为 DataSet https spark apache org docs latest sql programming guide html https spark ap
给定 RGB 值，在数据库中找到最接近匹配的最佳方法是什么？

我有一个 RGB 值如果它不存在于我的数据库的颜色表中我需要找到最接近的颜色我正在考虑比较所有值并找出差异红色绿色和蓝色然后取平均值最低平均偏差应该是最接近的颜色在我看来应该有更好的方法有任何想法吗将颜色视为 3 维空间
iPhone：内存泄漏分析器是否存在？

有没有像 iPhone 应用程序的内存分析器这样的东西我想知道任何时候内存中有哪些对象您将需要使用 Instruments 来分析您的应用程序您可以使用不同的模板运行您的应用程序在 XCode 中选择运行 gt 使用性能工具启动
解释预乘 alpha 的工作原理

有人可以解释一下为什么使用预乘 alpha 和修正后的混合函数渲染看起来与正常 alpha 不同而从数学上来说它们是相同的我研究了这篇文章以了解预乘阿尔法 http blogs msdn com b shawnhar archi
如何限制模板函子返回和参数类型

我的代码如下所示 template
为什么终止挂起（不可恢复）的服务实例会返回 Failed，但它已终止

为什么终止挂起不可恢复的服务实例报告失败但却被终止在挂起可恢复和挂起不可恢复实例上使用 Microsoft BizTalk Operations BizTalkOperations TerminateInstance 路
如何高效并行brms::brm？

问题总结我正在装修一个brms brm multiple 模型到一个大型数据集其中缺失的数据已使用mice包裹数据集的大小使得并行处理的使用非常可取但是我不清楚如何最好地利用计算资源因为我不清楚如何brms在核心之间划分估算数据
如何在rails中设置“快捷方式图标”？ [复制]

这个问题在这里已经有答案了我看不到我设置的图像上面的代码有什么问题我怎样才能成功运行 See doc http apidock com rails ActionView Helpers AssetTagHelper favicon l
在链接之前或之后放置图标以指示文件类型的最佳做法是什么（例如：链接 Adobe PDF、音频或视频）

我的团队正在讨论在我们网站上的各种媒体文件类型的链接后插入图标的最佳实践是什么例如链接到 PDF 并希望插入图标图像以让用户知道它是 PDF 同样的方法也可用于视频或音频文件我建议使用 CSS 在上放置一个类并使用 after 创建
ggplot 的scale_y_log10 行为

尝试使用绘制堆积直方图ggplot set seed 1 my df lt data frame param runif 10000 0 1 x runif 10000 0 5 1 my df param range lt cut my d

ggplot 的scale_y_log10 行为

ggplot 的scale_y_log10 行为 的相关文章

随机推荐

热门标签

ggplot 的scale_y_log10 行为的相关文章