R：按组检查，对于一个 var 的每个唯一值，是否至少存在一个观察值，其中该 var 的值等于另一个 var 的值

2024-02-16

我认为这段代码的方向是正确的，但我还没有完全做到这一点。

我尝试在 Google 和 SE 上找到一些有用的东西，但我似乎无法以某种方式提出问题，从而得到我正在寻找的答案。

I could写一个for-loop为此，比较每个id对于每个独特的价值a每行，但我努力实现更高水平的 R 理解，因此希望避免循环。

id <- c(1,1,1,2,2,2,3,3,3,4,4,4,5,5,5)
a <- c(1,1,1,2,2,2,3,3,4,4,4,5,5,5,6)
b <- c(1,2,3,3,3,4,3,4,5,4,4,5,6,7,8)

require(data.table)
dt <- data.table(id, a, b)

dt
dt[,unique(a) %in% b, by=id]
tmp <- dt[,unique(a) %in% b, by=id]
tmp$id[tmp$V1 == FALSE]

在我的例子中，IDs结果应为 2、3 和 5，决策规则为：“通过id，检查是否对于每个唯一值a如果至少有一个观察值b等于值a."

但是，我的代码只输出IDs2 和 5，但不是 3。这是因为ID 3, the 4与4之前的观察结果。

结果应该输出不满足条件的 ID，或者向原始表添加一个虚拟变量来指示该 ID 是否满足条件。

怎么样

dt[, all(sapply(unique(a), function(i) any(a == i & b == i))), by = id]

#   id    V1
#1:  1  TRUE
#2:  2 FALSE
#3:  3 FALSE
#4:  4  TRUE
#5:  5 FALSE

如果要在原表中添加虚拟变量，可以这样修改

dt[, check:=all(sapply(unique(a), function(i) any(a == i & b == i))), by = id]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

R：按组检查，对于一个 var 的每个唯一值，是否至少存在一个观察值，其中该 var 的值等于另一个 var 的值的相关文章

在 R 中进行 Cox 回归后，将预测危险比列添加到数据帧中

在 R 中运行 Cox PH 回归后我需要在数据框中添加预测风险比的列数据框是面板数据其中 numgvkey 如果公司标识符和年龄是时间标识符您可以从此链接下载一小部分日期 https drive google com file
指定 R 中 hist() 中的 bin 数量？

我尝试指定垃圾箱的数量hist R为10 如下 gt hist x breaks 10 但垃圾箱的数量并不完全是 10 我尝试了几个其他数量的垃圾箱结果发生了同样的情况 hist says breaks可以指定给出直方图单元格数量的单个
如何生成向量的所有组合[重复]

这个问题在这里已经有答案了假设我有 3 个绿球 2 个橙球和 8 个黄球我想订购它们鉴于所有相同颜色的球都是相同的如何生成所有可能的序列在 R 中使用gregmisc 我可以 balls lt c orange orange g
用于清除工作空间和转储存储的 R 全局函数

我希望创建一个全局函数来清除我的工作区并转储我的内存我将我的函数称为 cleaner 并希望它执行以下代码 remove list ls gc 我尝试在全局环境中创建该函数但是当我运行它时控制台仅打印该函数的文本在我要获取的函数文件
在 mac (iMac OSX ) 终端中远程运行脚本（r 脚本）到其他计算机

我有一个小示例脚本 script p r 如下所示打算在终端中运行 usr bin Rscript sink output capture txt mn lt mean 1 10 and so on much longer list of
使用 R 的 flextable 包时，有没有办法将传递给 add_header_lines() 的字符串部分加粗

我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格但是我在将表格标题中的部分文本加粗时遇到了一些麻烦例如我希望标题为 Table 1 我的表格标题的其余部分而不是表 1 我的表格标题的其余部分 I 找到这个
如何在 R 中为传单中的数值变量设置不对称颜色渐变

我想让传单调色板以零为中心红白绿发散我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时我得
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
逻辑回归/二项式的 glmnet 误差

当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
将数据从 R 导出到 Excel

我试图将从 R 获得的一些结果导出到 Excel 中但未成功我尝试过以下代码 write table ALBERTA1 D ALBERTA1 txt sep t write csv ALBERTA1 ALBERTA1 csv your
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
使用 R 进行项目组织 [重复]

这个问题在这里已经有答案了可能的重复统计分析和报告撰写的工作流程 https stackoverflow com questions 1429907 workflow for statistical analysis and repor
为什么这些数字不相等？

下面的代码显然是错误的有什么问题 i lt 0 1 i lt i 0 05 i 1 0 15 if i 0 15 cat i equals 0 15 else cat i does not equal 0 15 i does not eq
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
使用predictNLS围绕R中的拟合值创建置信区间？

我想使用 R 中 propogate 包中的 PredictNLS 围绕一大组拟合值构建置信区间作为示例我将使用它们在函数描述中引用的数据集 https rdrr io github anspiess propagate man pre
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
单击 R 中的 Sankey Chart 线时添加额外的标签值

以下 R 闪亮脚本创建一个桑基图如下面的快照所示我的要求是当我单击左右节点之间的任何链接即 a1 和 a2 时我希望相应的 a3 的总和出现在标签中例如 a1 中的 A 和 a2 中的 E 总共具有值 50 和 32 因此我想

随机推荐

#ifdef 和 #ifndef 的作用

define one 0 ifdef one printf one is defined ifndef one printf one is not defined 在这其中的作用是什么 ifdef and ifndef 输出是什么里面的文
制作带有多个堆叠部分的黑白 ggplot 条形图的最佳方法？

我正在尝试使用 ggplot 为仅以黑白打印的出版物制作带有堆叠条形的条形图我每个栏都有 6 个堆栈所以使用scale fill grey 使它看起来很奇怪并且难以阅读有没有更好更干净的方法来做到这一点这是我的数据 dput he
Integer.parseInt() 和捕获异常或在转换之前使用模式验证字符串哪个更好？ [复制]

这个问题在这里已经有答案了我见过两种在 Java 中检查变量是否为有效整数的样式一个通过做一个Integer parseInt并捕获任何由此产生的异常另一种是使用模式以下哪一个是更好的方法 String countStr int c
将列表中的一组 URL 表示为树结构

我有一个存储 URL 的字典列表它只有两个字段 title and url 例子 title Index Page url http www example com something index htm title Other Page
将一个 Github 存储库连接到多个 Aptana 项目

有没有一种方法可以将一个 Github 存储库连接到 Aptana 中的多个不同项目换句话说要将单个 Github 存储库中的不同目录连接到不同的 Aptana 项目我需要这种能力因为我是一名从事许多项目的自由职业者而且我不想向
如何在 Mac OS Sierra 10.12 上安装 Nokogiri

我在 Mac OS Sierra 10 12 上安装 Nokogiri 1 6 8 1 时遇到问题我尝试使用brew install libxml2 libxslt然后使用命令行选项引用安装目录但没有帮助打开 Xcode 然后从菜单中
Android Camera2 API - 设置 AE 区域不起作用

在我的 Android Camera2 API 项目中我想为曝光计算设置一个区域不幸的是它不起作用另一方面焦点区域工作没有任何问题设备三星 S7 Nexus 5 1 CONTROL AF MODE 和 CONTROL AE MO
如何为html创建iPhone联系人标题滚动效果？

我已经设置了一个基本的 jsFiddle 来更多地了解我想要发生的事情 http jsfiddle net nicekiwi p7NaQ 2 http jsfiddle net nicekiwi p7NaQ 2 希望如果您根据您正在查看的联
pwrite 和 pread 相对于 fwrite 和 fread 有何优点？

有什么优点pwrite and pread over fwrite and fread 有两部分之间的区别pread pwrite and read write 它们都处于同一级别即系统调用有两个区别 p 变体采用偏移量进行读取因此
System.Interactive：Memoize() 和 MemoizeAll() 之间的区别？

在反应式扩展的 System Interactive dll v1 0 2521 0 中 EnumerableEx都有一个Memoize方法和一个MemoizeAll方法两者的 API 文档是相同的创建一个仅枚举原始可枚举一次并缓存其结
强制转换 c_str() 仅适用于短字符串

我正在 C 中使用 C 库并编写了一个包装器有一次我需要转换一个std string到一个c风格的字符串有一个带有函数的类它返回一个字符串如果字符串很短则转换返回的字符串有效否则无效这是一个简单的简化示例来说明该问题 incl
如何让conemu双击打开bat文件？

我有一个家庭服务器我在其中运行开发minecraft服务器并已转移到conemu作为CMD替代品除了每次我想启动服务器时我都需要CD到DIR并运行start bat 有没有一种方法可以创建一个快捷方式只需双击即可在conemu中启
Dompdf 古吉拉特语和印地语文本无法正确显示

在我的 Laravel 项目中我使用 DOMPDF 从 html Blade 文件生成 pdf 我想根据语言选择显示印地语或古吉拉特语文本这是我的控制器代码 pdf PDF loadView my htmlt pdffile heade
删除这种左递归方式来定义 SELECT 语句

我正在尝试解析以下内容SELECT陈述 select 1 union all select 1 union all with cte as select 1 select 1 from tbl limit 1 union all selec
在不同条件下向 pandas Dataframe 添加列

我有一个熊猫数据框 import pandas as pd data pd DataFrame a 0 1 0 0 1 1 0 1 b 0 0 1 0 1 0 1 1 c 0 0 0 1 0 1 1 1 rate 0 0 1 0 11 0
对于 Node.js 中的本地文件，我是否应该使用异步文件 IO 方法而不是同步方法？

我有一个非常简单的实用程序脚本是用 JavaScript 为 node js 编写的它读取文件进行一些计算然后写入输出文件当前形式的源代码看起来像这样 fs readFile inputPath function err data
javascript“多态可调用对象”

I saw 这篇关于多态可调用对象的文章 http ajaxian com archives javascript tips for rookies and gurus并试图让它工作但似乎它们并不是真正的多态或者至少它们不尊重原型链这
告诉 LINQ Distinct 返回哪个项目

我了解如何在 IEnumerable 上执行 Distinct 并且我必须为更高级的东西创建 IEqualityComparer 但是有没有办法可以告诉您返回哪个重复的项目例如说你有一个List
Google Analytics 集成 iOS 时出错

我需要将谷歌分析添加到我的 iOS 应用程序中我已经实施了这 3 个步骤 Step 1 下载谷歌分析库文件并将该文件添加到项目中 GAI h GAITracker h GAITrackedViewController h GAIDicti
R：按组检查，对于一个 var 的每个唯一值，是否至少存在一个观察值，其中该 var 的值等于另一个 var 的值

我认为这段代码的方向是正确的但我还没有完全做到这一点我尝试在 Google 和 SE 上找到一些有用的东西但我似乎无法以某种方式提出问题从而得到我正在寻找的答案 I could写一个for loop为此比较每个id对于每个独特的价

R：按组检查，对于一个 var 的每个唯一值，是否至少存在一个观察值，其中该 var 的值等于另一个 var 的值

R：按组检查，对于一个 var 的每个唯一值，是否至少存在一个观察值，其中该 var 的值等于另一个 var 的值 的相关文章

随机推荐

热门标签

R：按组检查，对于一个 var 的每个唯一值，是否至少存在一个观察值，其中该 var 的值等于另一个 var 的值的相关文章