data.table 相当于 dplyr::filter_at

2024-05-22

考虑数据：

library(data.table)
library(magrittr)

vec1 <- c("Iron", "Copper")

vec2 <- c("Defective", "Passed", "Error")

set.seed(123)
a1 <- sample(x = vec1, size = 20, replace = T)
b1 <- sample(x = vec2, size = 20, replace = T)

set.seed(1234)
a2 <- sample(x = vec1, size = 20, replace = T)
b2 <- sample(x = vec2, size = 20, replace = T)

DT <- data.table(
  c(1:20), a1, b1, a2, b2
) %>% .[order(V1)]

names(DT) <- c("id", "prod_name_1", "test_1", "prod_name_2", "test_2")

我需要过滤其值为test_1 OR test_2 is "Passed"。因此，如果这些列都没有指定的值，则删除该行。和dplyr，我们可以使用filter_at() verb:

> # dplyr solution...
> 
> cols <- grep(x = names(DT), pattern = "test", value = T, ignore.case = T)
> 
> 
> DT %>% 
+   dplyr::filter_at(.vars = grep(x = names(DT), pattern = "test", value = T, ignore.case = T), 
+                    dplyr::any_vars(. == "Passed")) -> DT.2
> 
> DT.2
  id prod_name_1 test_1 prod_name_2    test_2
1  3        Iron Passed      Copper Defective
2  5      Copper Passed      Copper Defective
3  7      Copper Passed        Iron    Passed
4  8      Copper Passed        Iron     Error
5 11      Copper  Error      Copper    Passed
6 14      Copper  Error      Copper    Passed
7 16      Copper Passed      Copper     Error

凉爽的。有没有类似的方法来执行此操作data.table?

这是我最接近的：

> lapply(seq_along(cols), function(x){
+   
+   setkeyv(DT, cols[[x]])
+   
+   DT["Passed"]
+   
+ }) %>% 
+   do.call(rbind,.) %>% 
+   unique -> DT.3
> 
> DT.3
   id prod_name_1 test_1 prod_name_2    test_2
1:  3        Iron Passed      Copper Defective
2:  5      Copper Passed      Copper Defective
3:  8      Copper Passed        Iron     Error
4: 16      Copper Passed      Copper     Error
5:  7      Copper Passed        Iron    Passed
6: 11      Copper  Error      Copper    Passed
7: 14      Copper  Error      Copper    Passed
> 
> identical(data.table(DT.2)[order(id)], DT.3[order(id)])
[1] TRUE

你们有更优雅的解决方案吗？最好是包含在动词中的东西，例如dplyr::filter_at().

我们可以指定“cols”.SDcols，循环遍历 Data.table 的子集（.SD) 比较该值是否为“通过”，Reduce它到一个单一的vector with |并对行进行子集化

res2 <- DT[DT[,  Reduce(`|`, lapply(.SD, `==`, "Passed")), .SDcols = cols]]

与dplyrOP帖子中的输出

identical(as.data.table(res1), res2)
#[1] TRUE

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

dataTable

data.table 相当于 dplyr::filter_at 的相关文章

如何在 R 中匹配多个 ggplot2 图中的调色板？

自从被问到这个问题以来已经有一段时间了但我知道一个事实我很快就会提取新数据我想弄清楚如何用这种技术来绘制它看起来评论和答案中的人知道如何做到这一点但我无法完全弄清楚所给我的内容还有人想尝试一下吗我正在尝试使用具有多个级别的因子
如何从 R 中的 txt 文件读取矩阵？

我有一个带有矩阵的txt文件 Matrix txt 重要数字之间没有空格 0100 1001 1100 我想在 R 中将其作为矩阵读取我该怎么做我尝试使用 as matrix read table Matrix txt sep 但失败
R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案：函数是否存在，我应该编写自己的函数，还是我错过了重点？

最近我发现了base files命令与其他命令一起使用例如getwd write lines file show dir等等似乎有许多 bash 函数的 R 等价物我还在 R 中编写了一些函数来简化对ssh and rsync通过
条件字体颜色 R Markdown

我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
线性判别分析图

如何将样本 ID 行号作为标签添加到此 LDA 图中的每个点 library MASS ldaobject lt lda Species data iris plot ldaobject panel function x y points
闪亮应用程序中的本地图像没有 img(src())？

我想按照以下说明在我的闪亮应用程序中包含本地图像文件在闪亮的应用程序中嵌入图像 https stackoverflow com questions 21996887 embedding image in shiny app 然而由于某种
如何更改ggplot2中x轴和y轴的位置

在我的真实研究世界中在顶部或顶部和底部显示 x 轴在右侧显示 y 轴是很常见的然而 ggplot2 中的默认位置是 x 位于底部 y 位于左侧下列的科斯克在这里发帖 https groups google com forum f
删除字符串中的转义符，或者“我怎样才能让 \ 不碍事？”

转义字符在 R 中会带来很多麻烦前面的问题证明了这一点更改列中的值 https stackoverflow com questions 10046357 change the values in a column 10046412 10
r - 选择每组最后出现的 n 次

情况我有一个数据框df df lt structure list person structure c 1L 1L 1L 1L 2L 2L 2L 3L 3L Label c pA pB pC class factor date struc
rvest如何通过id选择特定的css节点

我正在尝试使用 rvest 包从网页中抓取数据简单来说 html 代码如下所示 div class style div
将数字提高到非整数幂时出现奇怪的 NaN [重复]

这个问题在这里已经有答案了我执行了以下代码 tau lt 0 25 h lt 0 6 n 1 5 4 5 dnorm qnorm tau 4 qnorm tau 2 qnorm tau 2 1 2 1 5 R 继续生产NaN 然而 R 实
Rstudio 中的 Sweave — pdf 中没有显示任何图

这里是 Sweave Latex 新手我在生成常规函数输出时没有问题但绘图没有显示这是一个基本示例 documentclass article begin document SweaveOpts concordance TRUE lt
为什么 statsmodels 和 R 的逻辑回归结果不同？

我正在尝试比较 python 的 statsmodels 和 R 中的逻辑回归实现 Python版本 import statsmodels api as sm import pandas as pd import pylab as pl i
R闪亮数据表在开始时不显示记录（行）

我正在构建一个带有数据表的闪亮应用程序我想要的是启动时不显示任何记录行这样您只能看到表格顶部的过滤器当您开始输入时会显示行我在数据表中找不到选项这可能吗下面是示例代码 shinyApp ui navbarPage title
grep() 搜索数据框的列名

有没有更清晰更简单更直接更短的方法来做到这一点其中 df1 是数据框 names df1 grep Yield names df1 我想返回任何包含单词 yield 的列名称 Thanks grep has a value应该适用于
简单的数据框重塑

我刚刚从长时间的写作中断中回到 R 并且在记住如何重塑数据方面遇到了一些实际问题我知道我想做的事情很容易但出于某种原因我今晚很愚蠢并且将自己与融化和重塑混淆了如果有人能快速指出我正确的方向我将不胜感激我有一个这样的数据框 pe
如果“testthat”测试在“R”中失败，则打印自定义诊断信息

I use a testthat单元测试来检查是否data frame函数返回的结果与我期望它返回的结果相同如果测试失败 testthat打印一些诊断信息例如 MyFunction df orig is not identical to
如何使用 r 中的 caret 包在最佳调整超参数的 10 倍交叉验证中获得每次折叠的预测？

我试图使用 R 中的插入符包使用 10 倍交叉验证和 3 次重复来运行 SVM 模型我想使用最佳调整的超参数获得每次折叠的预测结果我正在使用以下代码 Load packages library mlbench library caret
将summary()写入as.data.frame以在ggplot / R中使用

请查找 af 数据样本t below 我正在使用以下方法进行竞争风险分析etmCIF来自etm package 产生以下结果这很好但需要更好的图形曾经有一个ggtrans etm函数将数据导入ggplot 然而这个功能显然被删除了
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示

随机推荐

为 Promise 编写循环的正确方法。

如何正确构造循环以确保满足以下条件承诺电话和被束缚的记录器 log res 通过迭代同步运行蓝鸟 db getUser email then function res logger log res this is a promise 我尝
使用 isdigit 表示浮点数？

a raw input How much is 1 share in that company while not a isdigit print You need to write a number n a raw input How m
python-messaging 无法处理 HTTP 请求

我正在使用下面的代码尝试使用 python messaging 发送彩信https github com pmarti python messaging blob master doc tutorial mms rst https gith
将整个网页设计为 SVG 文件

免责声明我意识到鉴于标题的荒谬这听起来像一个巨魔然而这是一个真正的问题我的背景涉及OpenGL x86 汇编我最近开始学习网络编程我真的很喜欢 SVG CSS 并且想知道为什么人们不使用 SVG 设计整个网页 Context
快速检查网络速度

我想从我的 swift 应用程序检查网络速度我发现很多帖子描述了Reachability特别是查找连接是否可达以及是 WIFI 连接还是 WWAN 连接的方法我的问题是否可以检测 WWAN 的类型 2G 3G 4G 你可以用以下命令检
std::vector::data() 的状态是什么？

我刚刚意识到我一直在使用std vector data 出于与 std string 的相似性但一位同事指出它不是标准的显然 Gcc 实现了它但是查看它的包含文件我发现了这样的注释 GLIBCXX RESOLVE LIB DEFEC
使用 RenderTargetBitmap 的 WPF 画布区域的快照

我想在我的应用程序中创建画布区域的快照我使用 Visual Brush 来获取快照并使用 PngEncoder 保存相同的快照但生成的 PNG 只是一个空的黑色图像我不确定问题是与创建的 BitmapSource 还是 PNGEnco
x86 LargeAddressAware 兼容性的单元测试

对于 win32 可执行文件 x86 我们可以设置 LargeAddressAware 标志以便它在 x64 Windows 上运行时可以访问 4 GB 而不是仅 2 GB 的虚拟地址空间这看起来很吸引人然而这也存在风险例如参见
Twig dump 不打印任何内容

我现在有点困惑我总是像其他树枝函数一样使用树枝转储函数但现在它完全没有输出没有错误异常什么都没有其他一切都工作正常例如反式过滤器 dump test prints nothing layout booking chooseAr
.then(functionReference) 和 .then(function(value){return functionReference(value)}) 之间有区别吗？

给定一个用于处理的命名函数Promise value function handlePromise data do stuff with data return data a 传递命名函数handlePromise作为参考 then pro
pandas dataframe 对列进行排序会引发索引上的 keyerror

我有以下数据框 df peaklatency snr 0 52 99 0 0 1 54 15 62 000000 2 54 12 82 000000 3 54 64 52 000000 4 54 57 42 000000 5 54 13 7
从 Presto 中的 JSON 列获取特定值

我有一个带有 JSON 列的表points其中一行为 0 0 2 1 1 2 2 0 5 15 1 2 20 0 7 我想获取键的值 1 and 20 并将它们存储为别名例如first and second在查询中到目前为止我所做的是
Web UI 中的 .Result 出现死锁

我正在阅读以下主题http blog stephencleary com 2012 07 dont block on async code html http blog stephencleary com 2012 07 dont bloc
如何从矩形点计算旋转角度？

我有4分1 2 3 4闭合一个矩形这些点按以下方式排列在数组中 x1 y1 x2 y2 x3 y3 x4 y4 我遇到的问题是矩形可以旋转一定角度如何计算原始点灰色轮廓和角度我试图在 javascript css3 transfo
如何为多个元素添加Class？

我正在使用这段 javascript 向多个元素添加一个类我试图引用多个 div 并向它们添加类它只适用于第一个 JavaScript
如何知道并加载特定文件夹中的所有图像？

我有一个应用程序 C Builder 6 0 需要知道特定文件夹中的图像总数然后我必须加载它们在 ImageList 或 ComboBoxEx 中或任何其他控件中我怎样才能做到这一点我知道如何在控件中加载图像或保存在 TList
在 Julia 中保存和检索字典的正确方法是什么？

我已经看到 Julia 充分解释了 MAT 文件这些文件中的结构可以毫无问题地作为字典读取现在我创建了自己的字典其结构如下 String String gt Int Int Int 在每个条目上我可以保存它writedlm它产生了一
如何以编程方式设置 ConstraintLayout 的 XML 属性“layout_constrainedWidth”？

ConstraintLayout中如何转换xml属性 app layout constrainedWidth true false in code 如果你想设置constrainedWidth Height以编程方式那么你必须采取Con
如何向 UWP 项目添加 .NET dll 引用？

我有几个适用于 NETv4 x 的 NET dll 项目我将版本更改为 4 6 1 并重新构建没有出现问题当我尝试从 UWP 项目向它们添加引用时出现错误项目的目标是 NETCore 而文件引用的目标是 NET框架这不是受支持的
data.table 相当于 dplyr::filter_at

考虑数据 library data table library magrittr vec1 lt c Iron Copper vec2 lt c Defective Passed Error set seed 123 a1 lt sampl

data.table 相当于 dplyr::filter_at

data.table 相当于 dplyr::filter_at 的相关文章

随机推荐

热门标签