按 ID 划分的行频率

2024-01-05

数据集包含三个变量：id、性别和年级（因素）。

mydata <- data.frame(id=c(1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,4), sex=c(1,1,1,1,1,0,0,0,0,0,0,0,0,1,1,1,1,1),
                     grade=c("a","b","c","d","e", "x","y","y","x", "q","q","q","q", "a", "a", "a", NA, "b"))

对于每个 ID，我需要查看我们有多少个唯一的成绩，然后创建一个新列（调用 N）来记录成绩频率。例如，对于 ID=1，我们有五个唯一的“等级”值，因此 N = 4；对于 ID=2，我们有两个唯一的“等级”值，因此 N = 2；对于 ID=4，我们有两个唯一的“等级”值（忽略 NA），因此 N = 2。

最终的数据集是

mydata <- data.frame(id=c(1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,4), sex=c(1,1,1,1,1,0,0,0,0,0,0,0,0,1,1,1,1,1),
                     grade=c("a","b","c","d","e", "x","y","y","x", "q","q","q","q", "a", "a", "a", NA, "b"))
mydata$N <- c(5,5,5,5,5,2,2,2,2,1,1,1,1,2,2,2,2,2)

新答案：

The uniqueN- 函数数据表 /questions/tagged/data.table has a na.rm参数，我们可以如下使用：

library(data.table)
setDT(mydata)[, n := uniqueN(grade, na.rm = TRUE), by = id]

这使：

> mydata
    id sex grade n
 1:  1   1     a 5
 2:  1   1     b 5
 3:  1   1     c 5
 4:  1   1     d 5
 5:  1   1     e 5
 6:  2   0     x 2
 7:  2   0     y 2
 8:  2   0     y 2
 9:  2   0     x 2
10:  3   0     q 1
11:  3   0     q 1
12:  3   0     q 1
13:  3   0     q 1
14:  4   1     a 2
15:  4   1     a 2
16:  4   1     a 2
17:  4   1    NA 2
18:  4   1     b 2

旧答案：

With 数据表你可以这样做：

library(data.table)
setDT(mydata)[, n := uniqueN(grade[!is.na(grade)]), by = id]

or:

setDT(mydata)[, n := uniqueN(na.omit(grade)), by = id]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

按 ID 划分的行频率的相关文章

如何将闪亮 UI 输入框中的值传递回 R 脚本中的变量并运行它？

我有以下代码source R我正打算逃离闪亮的目前脚本中有硬编码值例如 10000 55 15 200 等以及这些值下面的一些矩阵相关元素 rnorm2 lt function n mean sd mean sd scale rnor
R 中的自定义对比：对比系数矩阵或对比矩阵/编码方案？以及如何到达那里？

自定义对比在分析中应用非常广泛例如这个三水平因子的第 1 级和第 3 级的 DV 值是否有显着差异直观上这种对比用单元均值表示为 c 1 0 1 这些对比中的一个或多个以列的形式绑定形成对比系数矩阵例如 mat matrix
在 R 中粘贴向量的所有组合

我有一个向量说 vec c A B C 我想粘贴向量中每个项目的单个组合得到结果 AB AC BC 我知道我可以使用outer来获得向量的所有可能的组合但我对如何只获得上面的结果感到困惑在这种情况下顺序并不重要因此结果也可能是 B
使用名义变量删除 r 中的异常值

比如说我有三列 x lt c 10 1 6 50 x1 lt c 20 1 6 60 z lt c 1 2 3 4 5 6 7 8 检查 x 的异常值 bx lt boxplot x bx out 检查 x1 的异常值 bx1 lt bo
使用 tidyverse 在 tibble 中“取消嵌套” data.frame 列

我正在处理从 www 调用返回的一些数据jsonlite and as tibble以某种方式转换成data frame column This result数据有一个Id整数列和ActionCodedata frame 列有两个内部列这
如何绘制沿染色体图形的位置

我想生成一个图描绘我所研究的生物体的 14 条线性染色体按比例绘制并在每条染色体的指定位置上用彩色条表示理想情况下我想使用 R 因为这是我有经验的唯一编程语言我探索了多种方法来做到这一点例如使用 GenomeGraphs 但我
使用 Eclipse 和 Rserve 从 Java 调用 R 的简单程序

我的应用程序必须执行 R 操作例如 m matrix sample 0 1 100 rep T ncol 10 结果应该可供 Java 应用程序使用 The 预留套餐 http www rforge net Rserve 将 R 与其他语
如何让 print() 将参数传递给 R 中用户定义的打印方法？

我在 R 中定义了一个 S3 类它需要自己的打印方法当我创建这些对象的列表并打印它时 R 按其应有的方式对列表中的每个元素使用我的打印方法我想对打印方法实际显示的数量进行一些控制因此我的类的 print 方法需要一些额外的参数但
par(mfrow=c(1,2)) 不显示并排密度图[重复]

这个问题在这里已经有答案了 par mfrow c 1 2 plot 1 12 log y plot 1 2 xaxs i 然而当我尝试做并排密度图时图会单独输出 load the stud recs dataset library U
将循环转换为并行计算的函数

我正在使用 R 编程语言我遇到这个问题我试图找出两个 shapefile 之间的成对交集即第一个 shapefile 中的每个多边形与第二个 shapefile 中的所有多边形相交的百分比我想我找到了解决这个问题的基本方法 Load
使用 R Shiny 从 XLConnect 下载 Excel 文件

有没有人尝试过使用 R Shiny 中的下载处理程序通过 XLConnect 下载新创建的 Excel 文件在 ui R 中有一行不起眼的行 downloadButton downloadData Download 在 server R
从 R 中的向量中选择所有可能的元组

我正在尝试用 R 编写一个程序当给定一个向量时将返回所有可能的tuples http en wikipedia org wiki Tuples该向量中的元素例如元组 c a b c c a b c 出租车 c a c c b c c
如何在R中计算文本中的句子数？

我使用 R 将文本读入readChar 功能我的目的是测试文本句子中字母 a 出现次数与字母 b 出现次数一样多的假设我最近发现了 stringr 包它帮助我对文本做很多有用的事情例如计算字符数以及整个文本中每个字母出现的总数现在
将 Instagram/youtube 嵌入 Shiny R 应用程序

我想通过点击图表来播放 Instagram 或 Youtube 视频例如显示异常值等到目前为止明确告诉 Shiny 视频内容是有效的 require shiny require ggplot2 data df lt data fram
将年月格式转换为 POSIXct [重复]

这个问题在这里已经有答案了我有一些年月形式的数据我想将其格式化以用于绘图ggplot date lt c 2016 03 2016 04 2016 05 2016 06 2016 07 2016 08 2016 09 2016 10 2
kableExtra 中的 row_spec() 函数不会在 html 输出中创建水平线

我想在 kableextra 表中的某一行下方添加一条水平线 row spec 函数的参数 hline after 应该在行下方添加水平线 row spec 文档 https www rdocumentation org packages
在 R 中创建一个运行计数变量？

我有一个足球比赛结果的数据集我希望通过创建一组类似于世界足球 Elo 公式的运行评级来学习 R 我遇到了麻烦在 Excel 中看似简单的事情在 R 中并不完全直观例如 4270 个观察中的前 15 个具有必要的变量 date t 1
如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
如何使用 R 计算成为列表中中位数的概率？

假设我有以下数据集其中显示了假设实验的每个状态的三个观察结果的列表 state lt c Iowa Minnesota Illinois outcome lt list c 5 11 11 c 3 12 8 c 9 14 2 dat lt

随机推荐

ConnectNamedPipe 和 asio 重叠的 ptr

我将管道服务器命名为使用 boost asio 编写的服务器创建命名管道并调用 ConnectNamedPipe 将 asio 重叠 ptr 传递给它问题是传递给 asiooverlaped 的完成处理程序永远不会被调用即在客户端调用
如何在android studio中启用版本控制窗口

对于我的某些分支我无法获得版本控制窗口例如如果我进入分支develop 然后窗口显示如果我进入master它已经消失了我无能为力把它找回来我试图通过从开发到掌握来欺骗它但一旦我掌握了它又消失了该问题相对较新 7 天过去不
为什么 Scala 案例类字段不反映为公共字段？

我一直将案例类的构造函数参数理解为定义公共值但是当我反映这些字段时 isPublic 方法出现错误有什么想法吗 scala gt class Test val name String val num Int defined class
自定义 Ansible 回调未接收 group_vars/host_vars

我正在编写一个自定义的 ansible 回调 class CallbackModule CallbackBase CALLBACK VERSION 2 0 CALLBACK TYPE aggregate CALLBACK NAME my c
如何在mayavi（imshow）中绘制彩色图像

是否可以使用mayavi绘制具有3个颜色通道的图像根据 mayavi 的文档 mayavi mlab imshow只能处理形状为 n x m 的图像 Method 我必须使用 Mayavi 的自定义色彩图请参阅http docs ent
用于网站和 Api 的 Ninject - 序列不包含元素

我有一个带有 Web Api 项目和 MVC 3 项目的 VS2010 解决方案 Web APi 和 MVC 项目都有自己的 App Start 和 NinjectWebCommon 并在其中声明了自己的绑定当尝试使用 Api 时我总是
PHP 中的 OOP：来自变量的类函数？

是否可以像这样从类中调用函数 class new class function name do the thing req class gt function name 类似的解决方案这似乎不起作用是的这是可能的这就是众所周知的变量
在单个 ASP.NET Core WebAPI 服务中托管多个产品 API

我正在设计一个基于 ASP NET Core 的 Web API 它需要支持我的产品的多个变体比方说基于许可证或安装的品种我没有为每种类型的产品提供多种服务而是考虑使用一个服务来容纳托管多个端点或 URL 我将在安装时在 appse
如何在c中读取图像的像素？

假设我们的位图图像具有高度 M 和宽度 N 我们总是假设在本实验中宽度 N 是 4 的倍数这简化了文件中的字节布局对于该图像像素数组存储正好 3 x N x M 字节如下所示每组 3 个字节代表一个像素其中字节存储按顺
如何在 main 中设置 Nimbus 外观

我刚刚学习Java 仍然无法解决我遇到的这个小问题我的弹出日历使用 Nimbus 外观和感觉但我有使用 Java 外观和感觉的面板和容器 Jtable 我试图使每个 GUI 屏幕窗口都使用 Nimbus 外观和感觉 Merky 建议将
从 numpy 数组到 DICOM

我的代码读取 DICOM 文件将像素信息放入 numpy 数组然后修改 numpy 数组它使用列表是因为我试图同时操作多个 DICOM 文件我还没有找到任何关于如何获取修改后的 numpy 数组并再次使其成为 DICOM 文件的信息
通过 Windows API 检索 PCI 坐标（用户模式）

有没有办法使用 Windows c c API 例如 PnP Configuration Manager API 获取设备的 PCI 坐标总线插槽功能号我已经知道如何在内核模式下执行此操作我需要一个用户模式解决方案我的目标系统是
在“for”循环中递增 1 时格式化背后的技术原因？

整个网络上都有代码示例for循环看起来像这样 for int i 0 i lt 5 i 当我使用以下格式时 for int i 0 i 5 i 我这样做是因为我相信这样会更有效率但是在大多数情况下这真的很重要吗每个人都喜欢他们的微观优化
使用来自 json 文件的字符串将字符串数组传递给 React 组件，并允许内联 span 标签

我正在尝试获取一个字符串数组来显示为段落并允许在这些字符串内使用内联跨度标签我的问题是当在段落内添加值时会将标记的开头和结尾解码为其解码值有没有一种简单的方法可以使其工作而无需为此情况制作特定组件我的React组件如下 con
从 Flask 运行 Scrapy

我有这个文件夹结构 app py flask app app datafoo scrapy cfg crawler py blogs pipelines py settings py middlewares py items py spid
boto3 s3 对象过期“MalformedXML”错误

我尝试使用以下命令设置 Amazon S3 存储桶中子目录的生命周期配置boto3 put bucket lifecycle configuration 我使用了这段代码AWS 文档 https docs aws amazon com co
在图形之间移动或复制补丁

如何在图形之间移动或复制补丁matplotlib 我正在处理一组腌制的人物并想将它们合并到一个情节中使用线图时这没有问题因为我可以通过以下方式访问数据ax get lines 然而在使用直方图时 ax get lines回报 a
在主页小部件中使用 ScrollView 时出现问题

我能够在应用程序的布局 xml 文件中成功使用 ScrollView 但是当我尝试在小部件的布局 xml 文件中使用 ScrollView 时一旦将小部件放入模拟器中就会收到加载小部件时出现问题错误如果我注释掉 ScrollVi
是否可以禁用在页面中查找的 Ctrl + F 功能？

我有一个拼图网站这是一种可怕的作弊方式只做一部分也可以但是能做到吗我的想法是用图像替换字母但还有比这更简单的吗 Code window addEventListener keydown function e if e keyCod
按 ID 划分的行频率

数据集包含三个变量 id 性别和年级因素 mydata lt data frame id c 1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 4 sex c 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1

按 ID 划分的行频率

按 ID 划分的行频率 的相关文章

随机推荐

热门标签

按 ID 划分的行频率的相关文章