从分组数据中选择两个随机且连续的行

2024-01-01

在下面的数据中（包括dput），我对三个人（IndIDII）进行了重复观察（纬度和经度）。请注意，每个人都有不同数量的位置，并且它们是按以下顺序排列的：IndYear.

  IndIDII      IndYear  WintLat  WintLong
1 BHS_265 BHS_265-2015 47.61025 -112.7210
2 BHS_265 BHS_265-2016 47.59884 -112.7089
3 BHS_770 BHS_770-2016 42.97379 -109.0400
4 BHS_770 BHS_770-2017 42.97129 -109.0367
5 BHS_770 BHS_770-2018 42.97244 -109.0509
6 BHS_377 BHS_377-2015 43.34744 -109.4821
7 BHS_377 BHS_377-2016 43.35559 -109.4445
8 BHS_377 BHS_377-2017 43.35195 -109.4566
9 BHS_377 BHS_377-2018 43.34765 -109.4892

我想filter并制作一个新的df每个都有两个连续的行IndIDII。在我的较大数据集中，所有个体至少有 2 个观察值（即行），每个个体有 2 到 4 个观察值。显然，对于只有 2 行的个人，代码将返回仅有的 2 行可用。随着更多数据，第 1 行和第 2 行，or2和3，or3 和 4 将被随机选择。行的顺序并不重要，只要它们是连续的（即可以返回 3 和 4or4 和 3)。

一如既往，非常感谢！

Dat <- structure(list(IndIDII = c("BHS_265", "BHS_265", "BHS_770", "BHS_770", 
"BHS_770", "BHS_377", "BHS_377", "BHS_377", "BHS_377"), IndYear = c("BHS_265-2015", 
"BHS_265-2016", "BHS_770-2016", "BHS_770-2017", "BHS_770-2018", 
"BHS_377-2015", "BHS_377-2016", "BHS_377-2017", "BHS_377-2018"
), WintLat = c(47.6102519805014, 47.5988417247191, 42.9737859090909, 
42.9712914772727, 42.9724390816327, 43.3474354347826, 43.3555934579439, 
43.3519543396226, 43.3476466990291), WintLong = c(-112.720994832869, 
-112.708887595506, -109.039964727273, -109.036693522727, -109.050923061224, 
-109.482114456522, -109.444522149533, -109.45659254717, -109.489241553398
)), class = "data.frame", row.names = c(NA, -9L))

您可以使用ave。在每个组中，创建一个行索引 (i <- seq_along(x)）。要获取要保留的行的第一个索引，请从除最后一个行索引之外的所有行中采样一行（sample(head(i, -1), 1)。还包括下一行（+ 0:1）。检查采样行中有哪些行索引（i %in% ...）。将结果强制返回逻辑子集数据。

Dat[as.logical(ave(Dat$IndIDII, Dat$IndIDII, FUN = function(x){
  i <- seq_along(x)
  i %in% (sample(head(i, -1), 1) + 0:1)
})), ]

#   IndIDII      IndYear  WintLat  WintLong
# 1 BHS_265 BHS_265-2015 47.61025 -112.7210
# 2 BHS_265 BHS_265-2016 47.59884 -112.7089
# 4 BHS_770 BHS_770-2017 42.97129 -109.0367
# 5 BHS_770 BHS_770-2018 42.97244 -109.0509
# 7 BHS_377 BHS_377-2016 43.35559 -109.4445
# 8 BHS_377 BHS_377-2017 43.35195 -109.4566

以类似的方式，但更简洁，data.table及其内置行索引 (.I）和每组的行数（.N)

library(data.table)
setDT(Dat)
Dat[Dat[ , (sample(.I[-.N], 1)) + 0:1, by = IndIDII]$V1]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

从分组数据中选择两个随机且连续的行的相关文章

正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
为什么 R 更新后 sim_slopes() 中会出现此错误？

我正在尝试使用交互包来创建简单斜率的约翰逊尼曼图但是当尝试运行 sim slopes 函数时出现以下错误直到我将R更新到4 2 2 我才没有遇到这个问题我使用的是 macOS Ventura 13 1 Error class
使用 ggmap 截断密度多边形

我在使用 R ggmap 绘制密度图时遇到问题我的数据如下所示 gt head W date lat lon dist 1 2010 01 01 31 942 86 659 292 415 2 2010 01 10 32 970 84 1
R：如何获取该月的周数

我是 R 新手我想要该日期所属月份的周数通过使用以下代码 gt CurrentDate lt Sys Date gt Week Number lt format CurrentDate format U gt Week Number 3
投资决策：R中的NPV、IRR、PB计算

我正在尝试计算不同数量项目的净现值 NPV 内部收益率 IRR 和投资回收期 PB 时间以评估哪个投资项目提供最佳回报到目前为止我可以为每个项目单独计算几行代码但我想做的是编写一个函数它接受一个包含许多不同项目及其现金流的矩阵
R“错误：“}”中出现意外的“}”[重复]

这个问题在这里已经有答案了我有一个字符串变量对于缺少数据的情况它具有空值我想将空值重新编码为缺失而不是说空值我正在尝试编写一个循环来删除这些空值条目但我不断收到错误错误中出现意外的 for row in dat
以编程方式将字符串宽度值插入到 sprintf() 中

我正在尝试以编程方式将字符串宽度值插入到sprintf 格式期望的结果是 sprintf 20s hello 1 hello 但我想插入20在同一通话中即时进行因此它可以是任何号码我努力了 sprintf ds 20 hello 1
条件字体颜色 R Markdown

我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
无法更改 RStudio 中的 R 版本

我的 RStudio V 0 99 491 无法更改 R 版本我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题也许
麦当劳 omega：R 中的警告

我正在计算几种不同尺度的欧米茄并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全当我使用从 alpha 到 omega 内部一致性估计普遍问题的
在 Shiny 中的用户会话之间共享反应数据集

我有一个相当大的反应数据集该数据集是通过轮询文件然后按预定义的时间间隔读取该文件而派生的数据更新频繁需要不断重新加载诚然重新加载可以增量完成并附加到 R 中的现有对象但事实并非如此然而目前尽管会话中的数据相同但此操作是针对

随机推荐

具有独立条件的 NHibernate 查询...

我有这个 var query session Query
与 java 和 .net 相比，mcrypt blowfish php 结果略有不同

以下是一些更改了键值和有效负载的示例代码 key 4rTInjwg H nA key base64 decode key data val 100 val 200 val 300 val 400 val 500 val 600 val 70
c++-default_random_engine 始终创建相同的数字序列

我正在使用神经网络我想随机创建权重所以如果我创建 30 个神经网络每个神经网络最终都会具有相同的权重应该是随机的所以当我给它们所有相同的输入时输出是相同的而事实并非如此有什么帮助吗这是主要功能 int main std
Python @precondition / @postcondition 用于成员函数 - 如何？

我试图在类的成员函数返回的值上使用 postcondition 装饰器如下所示 def out gt0 retval inval assert retval gt 0 Return value lt 0 class foo object
在新版本的包中重命名函数时，是否有最佳/推荐的做法可以遵循？

我正在更新一个旧包并缩短一堆非常长的函数名称如何让用户知道旧功能已被弃用我记录一切roxygen2所以我想知道是否 alias我应该使用什么想法即使您只是缩短函数名称我仍然会像对包的公共 API 进行任何更改一样对待它随着新函数
Google Maps API v3 中的 OVER_QUERY_LIMIT：如何在 Javascript 中暂停/延迟以减慢速度？

我遇到了一个在这些论坛中讨论得很好的问题但是没有一个建议似乎对我有用所以我正在寻找一些完整的 javascript 当保存为 html 文件时可以工作问题是当我尝试使用 Javascript 调用的 V3 API 对 Google
如何使用 Jasmine 测试内部功能所需的内部功能

function window document var trimString function string var trimString trimString string replace s s g return trimString
通过 ajax 将 jquery 中的数组传递给 c# webmethod

我想将数组传递给 c webmethod 但没有很好的示例可以遵循感谢您的任何帮助这是我到目前为止所拥有的我的阵列 jobRole each function index var jobRoleIndex index var jobR
流类型注释和有效的 JavaScript 源

我正在使用 Facebook 的新 Flow Type 检查系统 In Flow 遇见 Underscore http flowtype org docs underscore html看来他们改变了这段 JavaScript 代码 var
使用 Espresso 导航视图 Android Kotlin - androidx.test.espresso.NoMatchingViewException

我是 Espresso 新手试图编写 NavigationView 菜单项单击的测试用例 HomeActivityClass 中的以下方法 accountMenu is the NavigationView predefined clas
如何将 for-each 循环应用于字符串中的每个字符？

所以我想迭代字符串中的每个字符所以我认为 for char c xyz 但我收到编译器错误 MyClass java 20 foreach not applicable to expression type 我怎样才能做到这一点最简单的
C++ std::async 在主线程上运行

有没有办法在主线程上运行函数因此如果我通过异步调用一个函数来下载文件然后解析数据然后它会调用一个回调函数该函数将在我的主 UI 线程上运行并更新 UI 我知道默认 C 实现中的线程是相等的因此我必须创建一个指向主线程的共享指针
更改 PostgreSQL 数据库及其表的所有者的最佳方法？

我正在尝试更改 PostgreSQL 数据库版本 gt 8 2 及其表的所有者我读过这个解决方案在 PostgreSQL 中同时修改所有表的 OWNER https stackoverflow com questions 134812
gStreamer 视频录制内存泄漏

您好我正在尝试录制来自摄像机的 rtsp 流 H264 格式我正在使用以下 gst 命令以 MPEG4 格式进行录制 gst launch e rtspsrc location rtsp 10 17 8 136 mediainput h
Pyrocms 模块或小部件或插件

这让我抓狂我想在网站主页上包含一个简单的联系表格我无法确定是否需要构建模块小部件或插件他们似乎都不太正确模块似乎只能作为独立页面工作例如现有的联系人模块小部件似乎只显示数据从数据库或某种提要例如 Twitter 获取而插
Ajax 并返回由 PHP GD 创建的图像

我有一个 PHP 脚本可以使用 PHP GD 生成图像生成图像后将其保存并在 Ajax 调用时发送以下输出 imagejpeg img data filename jpg echo img src filename jpg jpg
如何对 PHP 应用程序进行负载平衡？

我正在寻找有关如何对 php 应用程序进行负载平衡的指南建议或示例我的设置是 Ubuntu 10 04 和 PHP 5 3 我以前从未使用过负载平衡服务器我正在寻找提供的任何帮助 Update 这是一个 Web 应用程序预计将有数百
如何使用 NodeJS imagemagick 库将 PDF 的第一页转换为 JPG？

我正在尝试将 pdf 文件转换为预览图标 jpg 使用 NodeJS 的 imagemagick 库我在尝试着仅生成预览第一页适用于多页 pdf 在普通的命令行 imagemagick 程序中这可以是很容易通过说转换文件 pdf
java正则表达式键：值多行

我有这样的文字 33 88 app 2 8 superman taman 蒲种 36100 马来西亚 22 布拉布拉布拉布拉布拉布拉 32 45 dsfd qdsfqsdf 72D Example 这个例子有一个形式核心价值值可以是
从分组数据中选择两个随机且连续的行

在下面的数据中包括dput 我对三个人 IndIDII 进行了重复观察纬度和经度请注意每个人都有不同数量的位置并且它们是按以下顺序排列的 IndYear IndIDII IndYear WintLat WintLong 1 BHS

从分组数据中选择两个随机且连续的行

从分组数据中选择两个随机且连续的行 的相关文章

随机推荐

热门标签

从分组数据中选择两个随机且连续的行的相关文章