如果小于行标准差，则将行值更改为零

2023-11-22

如果行的所有值小于该行的标准差，我想将它们更改为零。

set.seed(007)
X <- data.frame(matrix(sample(c(5:50), 100, replace=TRUE), ncol=10))

   X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1  37 10 43 45 11 17 39 13 13  44
2  10 24 32 16  7 50 41 47  9  39
3  23 49 46 35 16 30 22 10 11  46
4  41 46 19 28 47 39 27 40 49  13
5  29 23 49 10 50 17 42 43  7  31
6  31 26 11 36 35 43 45 29 33   9
7  21 12  5 21 29 12 31 30  7  30
8  32 24  8 43  9 17 35 44 41   8
9  20 44 39  8 40 17 27 45 14  37
10 50  8  5 48 27 15 15 12 30  15

下面的几行似乎可以完成这项工作，但在我的实际用例中速度非常慢，而且我有点不确定 sapply 正在返回什么......

Y <- t(sapply(1:nrow(X), function(i) 
      sapply(1:ncol(X), function(j) 
        ifelse(X[i,][[j]] < sd(X[i,]), 0, X[i,][[j]]))))

      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]   37    0   43   45    0   17   39    0    0    44
 [2,]    0   24   32    0    0   50   41   47    0    39
 [3,]   23   49   46   35   16   30   22    0    0    46
 [4,]   41   46   19   28   47   39   27   40   49    13
 [5,]   29   23   49    0   50   17   42   43    0    31
 [6,]   31   26    0   36   35   43   45   29   33     0
 [7,]   21   12    0   21   29   12   31   30    0    30
 [8,]   32   24    0   43    0   17   35   44   41     0
 [9,]   20   44   39    0   40   17   27   45   14    37
[10,]   50    0    0   48   27    0    0    0   30     0

什么是更快、更有效的方法？

UPDATE非常感谢大家快速有效的答复！

这是他们的堆积方式...

set.seed(007)
size <- 1e5
X <- matrix(sample(c(5:50), size, replace=TRUE), ncol=size/2)

library(microbenchmark)    
results <- microbenchmark(
  X[ sweep(X, 1, apply(X,1,sd) ) < 0 ] <- 0,
  X[t(apply(X, 1, function(x) x - sd(x) < 0))] <- 0,
  sapply(X, function(x) ifelse(x < sd(x), 0, x)),
  times = 100L)
print(results)
Unit: milliseconds
                                              expr         min          lq     median         uq        max neval
          X[sweep(X, 1, apply(X, 1, sd)) < 0] <- 0    7.966167   10.869785   12.38399   15.00107   45.41557   100
 X[t(apply(X, 1, function(x) x - sd(x) < 0))] <- 0    7.344227    9.675577   11.22283   14.34280   53.70728   100
    sapply(X, function(x) ifelse(x < sd(x), 0, x)) 3028.336236 3221.325598 3302.16115 3466.66875 4539.88358   100
# plot
if (require("ggplot2")) {
  plt <- ggplot2::qplot(y=time, data=results, colour=expr)
  plt <- plt + ggplot2::scale_y_log10()
  print(plt)
}

enter image description here

看起来阿伦的答案是最快的一点点（正如阿伦所说）。然而，DWin 的打字少了 8 个字符，并且以使用异国情调（对我来说）而闻名sweep功能。

一个小的娱乐更新，Arun 的方法明显更快（t = 2.0112，df = 191.985，p 值 = 0.04571），或者，如果您愿意，Arun 函数的平均速度比 DWin 的平均速度快得多（使用这种稳健的贝叶斯估计方法，第 1 组 = DWin，第 2 组 = Arun，尽管 Arun 的计时不太适合 t-dist）：

enter image description here

这个怎么样？

X[t(apply(X, 1, function(x) x - sd(x) < 0))] <- 0
#    X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
# 1  50  0 34 36 41 31  0 18 45  20
# 2  23 15 18 17 22 38 28 32 45   0
# 3   0 40 50  0 39 40 40 43 16  46
# 4   0  0 46  0 25 33 36 33 39   0
# 5  16 25 50 22 46 38 30  0 22  38
# 6  41  0  0 43 19 22 35 31  0  31
# 7  20 30 33 27  0 12 26 25  0  29
# 8  49  0 27 41 42  0 27 25 40  21
# 9   0 50 49 43 46 22 20 33 21  42
# 10 26 19 21 26 49 17 24 47 24  13

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rows

standarddeviation

如果小于行标准差，则将行值更改为零的相关文章

如何让 print() 将参数传递给 R 中用户定义的打印方法？

我在 R 中定义了一个 S3 类它需要自己的打印方法当我创建这些对象的列表并打印它时 R 按其应有的方式对列表中的每个元素使用我的打印方法我想对打印方法实际显示的数量进行一些控制因此我的类的 print 方法需要一些额外的参数但
返回数据帧 R 中的下一行

我有一个看起来像这样的数据框 kind datetime book 2016 04 23 04 23 00 pen 2016 04 23 04 30 00 toy 2016 04 23 06 45 00 我想为数据集中的每一行返回下一行的日
基于另一个数据集获取数据集的子集

假设我有一个数据集即 dat1 ID block plot SPID TotHeight 1 1 1 4 44 5 2 1 1 4 51 3 1 1 4 28 7 4 1 1 4 24 5 5 1 1 4 27 3 6 1 1 4 20
如何在R中删除重复项

我有一个非常大的数据集如下所示 df lt data frame school c a a a b b c c c year c 3 3 1 4 2 4 3 1 GPA c 4 4 4 3 3 3 2 2 school year GPA
将年月格式转换为 POSIXct [重复]

这个问题在这里已经有答案了我有一些年月形式的数据我想将其格式化以用于绘图ggplot date lt c 2016 03 2016 04 2016 05 2016 06 2016 07 2016 08 2016 09 2016 10 2
numpy.histogram 的 hist 维度，密度 = True

假设我有这个数组 A array 0 0019879 0 00172861 0 00527226 0 00639585 0 00242005 0 00717373 0 00371651 0 00164218 0 00034572 0 008
kableExtra 中的 row_spec() 函数不会在 html 输出中创建水平线

我想在 kableextra 表中的某一行下方添加一条水平线 row spec 函数的参数 hline after 应该在行下方添加水平线 row spec 文档 https www rdocumentation org packages
如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
重复测量引导统计数据，按多个因素分组

我有一个看起来像这样的数据框但显然还有更多行等 df lt data frame id c 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 cond c A A B B A A B B A A B B A A B B co
纵向序列数据的三次样条方法？

我有一个串行数据格式如下 time milk Animal ID 30 25 6 1 31 27 2 1 32 24 4 1 33 17 4 1 34 33 6 1 35 25 4 1 33 29 4 2 34 25 4 2 35 24
使用 purrr 迭代替换数据帧列中的字符串

我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
如何使用 R 计算成为列表中中位数的概率？

假设我有以下数据集其中显示了假设实验的每个状态的三个观察结果的列表 state lt c Iowa Minnesota Illinois outcome lt list c 5 11 11 c 3 12 8 c 9 14 2 dat lt
选择 R 中的数据表中隐藏时（在绿色加号下方）列的显示顺序

Context 使用 DataTables 库制作交互式表格时当屏幕宽度对于列的数量和宽度来说太窄时列将隐藏在绿色号下我有一个非常宽的表格有 20 多列其中一些内容非常冗长因此某些列在所有屏幕宽度下总是隐藏的每次隐藏新列时
如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o
更改闪亮 R 中的默认浏览器

我在 RStudio 中使用 01 hello 虽然在 IE 中默认打开程序时它不会显示直方图但即使在 Chrome 中滑块也不起作用我无法滑动条形图并看到直方图中的变化如何更改 R 中的默认浏览器以便闪亮启动 Chrome 而不
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集

随机推荐

Matlab：从循环中重复调用相同的 mex 函数是否会产生太多开销？

我有一些 Matlab 代码需要加速通过分析我确定了一个特定的函数是导致执行速度减慢的罪魁祸首该函数在一个循环内被调用数十万次我的第一个想法是将函数转换为 mex 使用 Matlab Coder 以加快速度然而常识告诉我 Mat
迁移匿名配置文件的最佳方法

是否有另一种方法可以隐式迁移所有参数或者有什么其他优点 From MSDN public void Profile OnMigrateAnonymous object sender ProfileMigrateEventArgs args
如何去除JInternalFrame中的边框？

我能够从JInternalFrame但我不知道如何删除边框要删除边框只需调用frame setBorder null 任何边界是null根本就没有显示出来
tomcat部署WAR文件时出错

请帮助我解决在尝试在 Tomcat 服务器上部署 WAR 文件时遇到的以下异常 07 46 50 076 WARN HostConfig 606 Exception while expanding web application archi
如何从 Spacy NER 模型获得每个实体的预测概率？

我用过这个官方示例代码使用我自己的训练样本从头开始训练 NER 模型当我在新文本上使用此模型进行预测时我想获得每个实体的预测概率 test the saved model print Loading from output dir nl
使用 SimpleDateFormat 将字符串转换为日期会返回随机日期[重复]

这个问题在这里已经有答案了我对以下行为感到非常困惑我从一个方法返回 2 个日期作为字符串 getLastSupplierFlightResults 我添加了一个屏幕截图将返回的日期分别显示为 2018 06 20 00 00 00 和
firebase/firestore：创建并存储文档的唯一ID（用户为USERID）

我想根据位置为每个用户生成唯一的 ID 例如如果用户来自 newyouk 则 ID 为 NY 23234 当用户第一次注册我的应用程序时应该会发生这种情况我发现我可以使用自动生成的 firestore ID 但它对于分配为 id 来说
SQL Server Reporting Services Round() 函数

我在 SQL Server Reporting Services 中生成的报告发生了一些奇怪的事情我希望我没有太愚蠢我使用 Round 函数来获取整数有时4 5会四舍五入到4 5 5会四舍五入到6 这是由于舍入方法的原因吗我正在使用
Firefox 上的按钮太高

我遇到了 Firefox 特有的问题我正在尝试设置链接和按钮的样式以使其看起来exactly相同在除 Firefox 之外的所有浏览器上这都可以按预期工作在 Firefox 上按钮内容的高度为 18 像素而链接的高度为 15 像
MongoDB 反向正则表达式

我在 MongoDB 中有一个带有正则表达式属性的文档 id ObjectId 516023189732da20ce000004 regex my your s regex 我需要用类似的东西检索这个文档db col find regex
在同一服务器中部署多个网络应用程序[关闭]

Closed 这个问题是基于意见的目前不接受答案我正在考虑使用以下架构在同一服务器上部署多个和不同的 Web 应用程序 www mydomain com app1 www mydomain com app2 这是一个好的做法吗有什么
borderStyle 在 android 中不起作用-react-native

这仍然显示实体边框样式经过大量研究后我发现在某些情况下使用 borderRadius 显示 borderStyle 但 borderStyle dotted 和 dashed 仍然对其没有影响
VBA 项目资源管理器仍然显示由宏关闭的 Excel 工作簿

我创建了一个宏用于打开 Excel 工作簿并执行一些操作最后关闭文件该宏运行良好现在当我在 vba 编辑器中打开 VBA 项目资源管理器时它显示宏已打开的文件列表即使它们已关闭如何从项目资源管理器窗口中删除它们为什么它仍然
Google IAB 退货购买错误类型=3 子类型=4

当我尝试购买所有商品时它返回如下消息您请求的商品无法购买和 logcat 日志 09 04 10 06 25 374 D 芬斯基 7185 1购买Fragment handleError 错误 PurchaseError type 3
Electron - 使用 showOpenDialog 时抛出不允许加载本地资源

我只是想用showOpenDialog并加载图像但是当我选择图像时应用程序会崩溃 main js ipcMain on open file dialog function event const window BrowserWindow
自定义验证属性指定的方法未被调用

我正在使用 System ComponentModel DataAnnotations CustomValidationAttribute 来验证我的 POCO 类之一当我尝试对其进行单元测试时它甚至没有调用验证方法 public cl
YouTube：如何在静音的情况下呈现嵌入视频

我正在尝试嵌入一个静音的视频但我不知道它是如何工作的目前我正在使用这个但不起作用你们中有人知道我怎样才能完成这项工作吗 Updated Add mute 1到你的网址的末尾您的新代码将是
使用 Owin 进行 Twitter 外部登录会出现 HTTP 403（禁止）

ASP NET MVC 5 项目欧文版本 4 0 0 0 启动 Auth app UseTwitterAuthentication consumerKey somekey consumerSecret someSecretKey 异常发生
VBScript创建excel 2016对象

我的机器上安装了两个版本的 excel 2010 和 2016 我想在 excel 2016 上运行 vbscript 但是那 CreateObject Excel Application 只创建 Excel 2010 我怎样才能将其更改
如果小于行标准差，则将行值更改为零

如果行的所有值小于该行的标准差我想将它们更改为零 set seed 007 X lt data frame matrix sample c 5 50 100 replace TRUE ncol 10 X1 X2 X3 X4 X5 X6 X

如果小于行标准差，则将行值更改为零

如果小于行标准差，则将行值更改为零 的相关文章

随机推荐

热门标签

如果小于行标准差，则将行值更改为零的相关文章