数列识别

2024-03-19

从另一个问题发展而来:

识别R中重复数字的序列 https://stackoverflow.com/questions/7509381/identifying-sequences-of-repeated-numbers-in-r/15328802#15328802

我已经使用该问题的答案来识别数据中的序列,这不是问题,但是在识别不同数字的序列时我陷入困境,例如:序列可能是:126,126,25 而不是重复的数字,

我当前使用的代码与上面的问题(rle)相同

样本数据:

   d<-read.table(text='Date.Time Aerial
794  "2012-10-01 08:18:00"      1
795  "2012-10-01 08:34:00"      1
796  "2012-10-01 08:39:00"      1
797  "2012-10-01 08:42:00"      1
798  "2012-10-01 08:48:00"      1
799  "2012-10-01 08:54:00"      1
800  "2012-10-01 08:58:00"      1
801  "2012-10-01 09:04:00"      1
802  "2012-10-01 09:05:00"      1
803  "2012-10-01 09:11:00"      1
1576 "2012-10-01 09:17:00"      2
1577 "2012-10-01 09:18:00"      2
804  "2012-10-01 09:19:00"      1
805  "2012-10-01 09:20:00"      1
1580 "2012-10-01 09:21:00"      2
1581 "2012-10-01 09:23:00"      2
806  "2012-10-01 09:25:00"      1
807  "2012-10-01 09:32:00"      1
808  "2012-10-01 09:37:00"      1
809  "2012-10-01 09:43:00"      1', header=TRUE, stringsAsFactors=FALSE, row.names=1)

识别重复数字序列的代码(相同数字重复 4 次):

tmp <- rle(d$Aerial)
d$newCol <- rep(tmp$lengths>=4, times = tmp$lengths)

但是我不知道如何识别包含不同数字的序列,例如序列可能是:1,2,2,1(如 d$Aerial 中)在“2012-10-01 09:11:00”

有各种图案。数据是在给定时间在给定天线上检测到的信号,但为了保持问题的开放性,我将其简化为上面的内容。因此模式为 1,2,2,1,即在空中检测 1,然后 2,然后 2,然后 1(在空中列中)。根据我的数据,当这种模式发生时,它表明动物的行为运动。如果我能够识别它,我就可以对其进行更多计算。

上面的代码表示一个数字重复4次,但无法识别4个彼此不同的数字的重复:1,2,2,1

这个序列 (1,2,2,1) 可能会在数据中出现多次,我想每次都识别它。


暴力解决方案:

pat <- c(1,2,2,1)
x <- sapply(1:(nrow(d)-length(pat)), function(x) all(d$Aerial[x:(x+length(pat)-1)] == pat))

d[which(x),]  # "which" prevents recycling of the shorter vector "x"
##               Date.Time Aerial
## 803 2012-10-01 09:11:00      1
## 805 2012-10-01 09:20:00      1

zoo has rollapply可以用于此目的:

require(zoo)
x <- rollapply(d$Aerial, length(pat), FUN=function(x) all(x == pat))

d[which(x),]
##               Date.Time Aerial
## 803 2012-10-01 09:11:00      1
## 805 2012-10-01 09:20:00      1

对于(现已删除)注释,查找与模式的最后一个字符匹配的行:

d[which(x)+length(pat)-1,]
##               Date.Time Aerial
## 804 2012-10-01 09:19:00      1
## 806 2012-10-01 09:25:00      1
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数列识别 的相关文章

  • 将列表中的列转换为 R 中的数据框

    我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
  • dplyr,do(),从模型中提取参数而不丢失分组变量

    R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
  • 使用 dplyr:group_by 将数据帧分成多个子集?

    有没有办法根据 group by 组使用 dplyr 将一个数据帧拆分为数据帧的子集 mtcars gt group by cyl gear gt codes 非常感谢 好吧 并不是你真的想要 但你可以这样做tidyr 即nearly一样的
  • R 中的发散积分可在 Wolfram 中求解

    我知道我以前问过同样的问题 但由于我是新来的 这个问题问得不好而且不可重现 因此我在这里尝试做得更好 如果我只编辑旧的 可能没有人会读它 我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
  • R:将 readRDS 应用于 .Rds 文件名的列表对象

    我有几个包含数据帧对象的 Rds 文件 我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中 但是 当我尝试从文件名列表中读取多个 Rds 文件时 我收到错误 FUN X i 中的错误 从连接读取时出错 readRDS 不适用于列表吗 R
  • 错误:“rjags”的包或命名空间加载失败

    在终端的 conda 环境之一中 我能够成功安装包 rjags 但是 当我在该环境中运行 R 并运行库 rjags 时 出现以下错误 加载所需的包 coda 错误 rjags 的包或命名空间加载失败 rjags 的 loadNamespac
  • 将 VLMC 拟合到很长的序列

    我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集 我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
  • R 更改小数位且不四舍五入

    gt signif 1 89 digits 2 1 1 9 我想要1 8 这有点笨拙 但它会起作用并保持所有数字 x lt 1 829380 trunc dec lt function x n floor x 10 n 10 n Resul
  • 解析,用三点参数替换

    让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
  • R 中的字符串作为函数参数

    数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数 它
  • 在 R 中使用 Huggingface Transformer 模型

    我正在尝试在 R 中使用不同的 Huggingface 模型 这是通过 reticulate 导入 Transformer 包来实现的 谢谢 https rpubs com eR ic transfoRmers https rpubs co
  • 为什么 geom_boxplot 比基本箱线图识别更多异常值?

    这是一个可重复的示例 与基本箱线图相比 最后一个治疗组又发现了一个异常值 dta lt structure list Treatment c A A A A A A A A A A A A A A A A B B B B B B B B B
  • 16 位以上整数的计算

    我有两个大整数 两者都超过 16 位 确切地说是 20 位 而且我知道由于双精度浮点运算 我在使用这些数字进行计算甚至将它们存储在变量中 独立于编程语言 时受到限制 不过 我想也许gmp图书馆应该处理它们 但不幸的是它没有 可以计算更大的整
  • 具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

    全部 我想使用以下方法从相关矩阵中获取 p 值dplyr 和 或扫帚包 并同时测试多个变量 我知道其他方法 但 dplyr 对我来说似乎更简单 更直观 此外 dplyr 需要关联每个变量以获得特定的 p 值 这使得该过程更容易 更快 我检查
  • R 中的 Websocket

    我设法在 R 中建立到 Mtgox websocket 的连接 规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
  • 非闪亮上下文中的反应式对象绑定

    实际问题 你怎样才能近似反应性环境 行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数 或者甚至可能在一个函数中使用这些函数无光泽上下文以
  • 更改计划的开始日期以优化资源

    我有很多工作需要在特定的时间间隔执行 然而 我们每天完成这项工作的资源有限 因此 我正在尝试优化开始时间日期 开始时间日期只能向前移动 不能向后移动 以便每天使用的资源与我们的预算更加不相似 这些函数在下面的示例中使用 Function t
  • 检查单词是否存在于英语词典 r 中

    我正在对多个进行一些文本分析resume生成一个wordcloud using wordcloud包装连同tm用于在 R 中预处理文档语料库的包 我面临的问题是 检查语料库中的单词是否具有某种含义 即 它属于英语词典 如何一起挖掘 处理多份
  • 捕获段错误、内存未映射错误

    我试图在 R 中找到 1347 x 209974 矩阵的列的相关性 每次我这样做 使用一个简单的命令cor matrix 我收到消息 caught segfault address 0xffffffffd058abf8 cause memo
  • R中将矩阵拆分为子矩阵的函数

    我有一个 16 行 12 列的矩阵 M 我想将其拆分为 16 个矩阵的数组 每个矩阵有 4 行 3 列 我可以通过以下方式手动完成 M matrix sample 0 127 16 12 replace TRUE c 16 12 ma1 M

随机推荐

  • Python 中的肥皂调用

    我试着打电话给肥皂服务公司 我的调用成功 但返回空值 下面我附上了我的肥皂请求和响应架构 它接受一维数组作为输入并返回该数组 请求架构
  • 如何为 HTTPS 调用指定出站证书别名?

    我正在调用需要客户端证书身份验证的 Web 服务 如果我指定一个包含单个证书 服务期望的客户端证书 的 Java 密钥库 那么一切都会正常工作 但是 如果我使用包含多个证书的密钥库 那么我似乎无法指定客户端应选择哪个证书 客户端似乎会选择第
  • 托管调试助手“FatalExecutionEngineError”0xc0000005

    托管调试助手 FatalExecutionEngineError 运行时 遇到了致命错误 错误的地址是 0x641ad419 在线程 0x5d0c 上 错误代码为0xc0000005 这个错误 可能是 CLR 或不安全或不可验证部分的错误
  • 更新 UI5 中的模型,使用格式化程序时双向数据绑定变为单向数据绑定

    在我的 UI5 应用程序中 我有一个表 其中每行包含一个sap m Switch https sapui5 hana ondemand com api sap m Switch 它通过以下方式绑定到模型formatter https sap
  • HttpUrlConnection getOutputStream 有问题

    我制作了一个android应用程序并用于HttpUrlConnection POST 方法 HoloEverywhere 库 但我有问题 为什么会出现我不知道的问题 我认为 getOutputStream 错误 因为如果用于 getOutp
  • Pandas 稀疏数据导出到 csv - 速度解释

    我正在尝试导出由类型列组成的 Pandas 数据框的子集pd SparseDtype float32 np nan 到 csv 我注意到直接写入 csv 与使用sparse to dense 然后写入csv 谁能向我解释一下这是怎么回事 一
  • Perl/regex 删除字符串的前 3 行和后 3 行

    我正在寻找构建一个正则表达式语句以始终删除前 3 个 字符串的行 以及字符串的最后 3 行 中间部分 可以是任意 n 行内容 任何干净的正则表达式方式来实现 这个输出 即总是删除我们的前 3 行和最后 3 行 字符串 并保留中间部分 这可以
  • dos2unix:找到二进制符号,跳过二进制文件

    我当前遇到一个问题 当尝试对文件执行 dos2unix 命令时 我的脚本失败 这就是我在脚本中的内容 dos2unix n data file data tmp file dos2unix Binary symbol found at li
  • 提示用户输入汇编 ci20 seg 错误

    我目前正在 ci20 机器上开发一个小程序 提示用户输入整数值 然后将该值打印到屏幕上 我当前的代码 data prompt asciiz Please enter an integer message asciiz nValue ente
  • 如何使用 ES6 Fat Arrow .filter() 对象数组

    我正在尝试使用 ES6 箭头函数 filter返回成人 杰克和吉尔 看来我不能使用 if 语句 为了在 ES6 中执行此操作 我需要了解什么 var family name Jack age 26 name Jill age 22 name
  • 转发引用是否仍然是右值引用?

    我仍然对支持移动和转发而发明的规则感到困惑 我仍然不确定的一件事是 是转发参考 just 右值引用 和 应用参考折叠规则 如果它是右值引用 那么该函数为什么会这样 template
  • 显示数据库表中的动态范围并计算每个范围内的行数

    我有这样的数据库表 我想显示不同的 5 岁年龄范围以及该范围内的学生数量 如下所示 此处 最低年龄为 10 岁 因此我们首先计算范围 10 15 该范围内有 5 名学生 对于第二个范围 我们需要找到年龄 gt 15 即18 因此 第二个范围
  • 如何将 JSONString 解析为数据集?

    我正在使用 Web 服务创建 C 应用程序 在我的网络服务中我使用JSONString数据 但我无法将此字符串转换为DataSet My JSONString is Table DisplayVoucherNumber A101239Z A
  • 为什么在 Python 包中使用绝对导入而不是相对导入?

    我最近创建了一个 Python 包 在其中仅使用相对导入来访问存储在其他方法中的函数 现在 在 Numpy 中 我看到很多文件大量使用绝对导入 例如这个文件 https github com numpy numpy blob 8f547f2
  • io:ios应用程序开发选项变灰

    我刚刚签署并创建了一个具有钥匙串访问权限的证书 然后在开发人员门户中单击证书 gt 开发人员 gt 当系统提示我您需要什么类型的证书时 正在开发的ios应用程序开发是灰色的 有人知道为什么吗 我需要吊销证书吗 每个用户只能申请一份开发证书
  • 将 Facebook Connect 与 Authlogic 结合使用

    我正在努力使 Authlogic 和 Facebook Connect 使用 Facebook 发挥良好作用 以便您可以通过正常注册方式或使用 Facebook Connect 创建帐户 我已经能够以一种方式使连接正常工作 但注销仅在 Fa
  • 查询输入必须至少包含一个表或查询

    我在 access 中有一个查询 应该在插入之前检查该项目是否已存在于数据库中 INSERT INTO FinalizedPrintedStickers Values 0000846043 481 9 0 48IG 1F Straight
  • 装箱和拆箱,为什么输出不是都是“System.Object”?

    我得到以下代码 object var3 3 Console WriteLine var3 GetType ToString Console WriteLine typeof object ToString 输出是 System Int32
  • 动态加载.js文件时捕获onload事件?

    有没有捕获onload在 IE 中使用 JavaScript 动态添加脚本标签时会发生事件吗 下面的代码适用于 FireFox 和 Chrome 但不适用于 IE
  • 数列识别

    从另一个问题发展而来 识别R中重复数字的序列 https stackoverflow com questions 7509381 identifying sequences of repeated numbers in r 15328802