将时间序列中的分类列扩展到多个每秒计数列

2024-01-09

进行以下转变的最佳方式是什么？此转换分为两个部分。第一个是将速度转换为每秒平均值。第二种方法是获取分类列并将其转换为多列——每个分类值一列，其中该值是每秒发生的次数。例如：

输入（xts A）：

Time(PosixCT), Observed Letter, Speed
2011/01/11 12:12:01.100,A,1
2011/01/11 12:12:01.200,A,2
2011/01/11 12:12:01.400,B,3
2011/01/11 12:12:01.800,C,4
2011/01/11 12:12:02.200,D,2
2011/01/11 12:12:02.200,A,7

输出：(xts B)

Time, A_Per_Second, B_Per_Second, C_Per_Second, D_Per_Second, Aggregate_Speed
2011/01/11 12:12:01,2,1,1,0,2.5
2011/01/11 12:12:02,1,0,0,1,4.5

我希望以一种不需要知道所有类别是什么的方式来做到这一点。基本上，我试图将时间压缩为每秒，而不丢失任何分类数据，并将数值数据总结为每秒平均值。

我不经常使用时间序列格式的数据（即xts），所以我提供了一个使用数据的解决方案data.frame format.

（另请注意，我已将此数据框的列名称更改为单个单词，以使其更易于使用。我在本问题的末尾发布了数据框的结构。）

我使用两个包：

HMisc for truncPOSIXt 类的方法
plyr实现一些分割、应用和组合数据的魔法

代码：

A <- as.data.frame(A)

library(Hmisc)
A$Date <- trunc(A$Date, units="secs")
A

library(plyr)
ddply(A, .(Date, Observed), summarise, Speed=mean(Speed))

结果的格式与您指定的格式略有不同，但应该很容易将其重新调整为您要求的宽格式。

                 Date Observed Speed
1 2011-01-11 12:12:01        A   1.5
2 2011-01-11 12:12:01        B   3.0
3 2011-01-11 12:12:01        C   4.0
4 2011-01-11 12:12:02        A   7.0
5 2011-01-11 12:12:02        D   2.0

这里是dputA的结果：

A <- structure(list(Date = structure(list(sec = c(1, 1, 1, 1, 2, 2
), min = c(12L, 12L, 12L, 12L, 12L, 12L), hour = c(12L, 12L, 
12L, 12L, 12L, 12L), mday = c(11L, 11L, 11L, 11L, 11L, 11L), 
    mon = c(0L, 0L, 0L, 0L, 0L, 0L), year = c(111L, 111L, 111L, 
    111L, 111L, 111L), wday = c(2L, 2L, 2L, 2L, 2L, 2L), yday = c(10L, 
    10L, 10L, 10L, 10L, 10L), isdst = c(0L, 0L, 0L, 0L, 0L, 0L
    )), .Names = c("sec", "min", "hour", "mday", "mon", "year", 
"wday", "yday", "isdst"), class = c("POSIXlt", "POSIXt"), tzone = c("", 
"GMT", "BST")), Observed = structure(c(1L, 1L, 2L, 3L, 4L, 1L
), .Label = c("A", "B", "C", "D"), class = "factor"), Speed = c(1L, 
2L, 3L, 4L, 2L, 7L)), .Names = c("Date", "Observed", "Speed"), row.names = c(NA, 
-6L), class = "data.frame")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

TimeSeries

将时间序列中的分类列扩展到多个每秒计数列的相关文章

如何修复 R 中 Kaplan Meier 图的风险表计算错误

以下是一个数据帧其中 6 个参与者中的每一个都有唯一的 record ID 我想绘制一个生存分析图其中包含感兴趣事件的复发以及在时间间隔 tstart 到 tstop 内暴露药物剂量数值变量的时间依赖性协变量每个参与者的最大
麦当劳 omega：R 中的警告

我正在计算几种不同尺度的欧米茄并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全当我使用从 alpha 到 omega 内部一致性估计普遍问题的
如何将plot中的单变量列表图表转换为ggplot2格式？

我正在搜索但仍然找不到一个非常简单的问题的答案我们如何使用 R 中的 ggplot2 生成一个变量的简单线图我正在分析时间序列数据并且想要对图表进行更复杂的操作我认为如果我使用 ggplot2 代替会更好plot It works
在 R 中打印具有长字符串的数据帧

让我们有一列包含长字符串的数据框 df lt data frame short rnorm 10 0 1 long replicate 10 paste rep sample letters runif 1 5 8 collapse 如何打
dplyr 将字符串拆分为逗号分隔的列表

我正在尝试使用 dplyr 将字符串拆分为逗号分隔的字符串但运气不佳 dat lt data frame key 1 4 labels c a ab abc b 我试图将标签列设置为 c a a b a b c b 我已经尝试了以下所有变
使用 geom_tile() 的 R ggplot 热图：如何按年份排序并在 y 轴上显示所有年份？

在研究了哈德利的书并在这里搜索后我创建了一个由年和月矩阵组成的热图颜色根据时间序列变量的百分比变化而变化热图和我用来获取它的代码如下所示我还有一些我自己无法解决的问题 1 如何对矩阵进行排序排序以便 y 轴中的年份从最早到最晚
什么时候在“strsplit”中设置“perl=TRUE”不起作用（按预期或根本不起作用）？

我只是在尝试优化一些代码时做了一些基准测试并观察到strsplit with perl TRUE is faster比跑步strsplit with perl FALSE 例如 set seed 1 ff lt function paste
Rstudio 中的 Sweave — pdf 中没有显示任何图

这里是 Sweave Latex 新手我在生成常规函数输出时没有问题但绘图没有显示这是一个基本示例 documentclass article begin document SweaveOpts concordance TRUE lt
R：大向量的高效迭代子集和过滤

我想更快地执行以下操作 Logic 我有一个向量big共 4 个元素1 2 3 4 我还有一个相同长度的阈值向量1 1 3 1 4 1 5 1 我希望每个元素找到第一个元素的索引next元素高于相应的阈值在这种情况下我的预期输出是 2
dplyr / left_join 中的嵌套管链

在尝试获取分组滞后变量的过程中仅使用这是不可能的 lag 建议的解决方案是将数据拉出滞后不同的行然后重新加入它我更喜欢在不创建中间对象的情况下执行此操作并且希望在链中间执行此操作然而它似乎没有像我预期的那样工作问题似乎是使用
如果“testthat”测试在“R”中失败，则打印自定义诊断信息

I use a testthat单元测试来检查是否data frame函数返回的结果与我期望它返回的结果相同如果测试失败 testthat打印一些诊断信息例如 MyFunction df orig is not identical to
使用 ggplot2 修改点子集的形状

我正在尝试绘制一个沿大量维度变化的大型散点图这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集我只是
在 mac (iMac OSX ) 终端中远程运行脚本（r 脚本）到其他计算机

我有一个小示例脚本 script p r 如下所示打算在终端中运行 usr bin Rscript sink output capture txt mn lt mean 1 10 and so on much longer list of
如何使用 R 中带引号的字符值内的序列读取 CSV？

这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来并且有一个顺序在值之一内转义引号加分隔符我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
在函数内部调用 clusterApply 时，性能会下降

我遇到了一个奇怪的问题clusterApply 我已经能够尽可能地隔离它如下所示首先我从全局环境运行以下代码 require parallel cl lt makeCluster rep localhost 20 SOCK xl lt
将列表中的列转换为 R 中的数据框

我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
如何在 R 中为传单中的数值变量设置不对称颜色渐变

我想让传单调色板以零为中心红白绿发散我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时我得
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST

随机推荐

Ruby 调试器在 STDIN 上失败。获取用户输入

我相信您可以轻松重现该问题只需使用新的 RubyMine 7 1 Mac 或 Windows 版本 Ruby 2 2 创建简单的脚本 puts Hi i m gonna break your debugger user input get
Android onKey 带虚拟键盘

我使用 onKey 方法捕获键盘事件按下 public boolean onKey View arg0 int arg1 KeyEvent arg2 do something return false 这对于物理键盘按下来说效果很好但对
从 Liquid 数组中获取下一个和上一个元素

简洁版本我想将 1 添加到液体模板中的数字并将结果用作数组索引 capture plus one 0 plus 1 endcapture div Value of plus one plus one div div This works
PropTypes 在 React 中不起作用

我正在运行 React 16 2 0 并且正在使用 PropTypes 15 6 1 我正在使用 ES6 语法和 Webpack 我试图让 PropTypes 在传递无效道具时发出警告但它不起作用这是代码 SimpleMessage j
在 R Shiny 中读取文件

因此我正在 R闪亮中构建一个应用程序要求用户上传 csv 文件一旦被 R闪亮读入我不确定如何实际操作该对象来使用一般代码语法如下用户界面文件 ui R Define UI for random distribution appl
如何在 64 位 Windows 7 计算机上安装 pycrypto？

我尝试使用安装 PyCryptopip 但它抱怨需要 vcvarsall bat 我安装了 Visual Studio 2008 但现在我得到了ValueError u path 当我尝试从安装它时pip 我尝试从下载预构建的二进制文件虚空
当我从应用程序中清除数据时，Sqlite 数据库被删除

我创造了Sqlite应用程序中的数据库当我清除数据时settings gt applications gt manage applications the Sqlite数据库已删除任何要保留的建议sqlite数据库原样当您按下Clea
为什么 IE11 错误地处理 Node.normalize() 的减号？

我遇到了一个问题即当使用 Node normalize 函数连接相邻文本节点时具有某些字符的 DOM 文本节点在 IE 中表现得很奇怪我创建了一个 Codepen 示例它允许您在 IE11 中重现该错误 http codepen i
从谷歌应用程序脚本预填写谷歌表单

我有一份学生登记表其中有学生证这是必填字段我有一个谷歌应用程序脚本函数可以告诉该学生是否注册了任何课程有没有办法通过调用 Google Apps 脚本函数是或否来自动填写注册的现场课程是的您可以使用表单 ID 创建预填
有没有办法有条件地应用注释？

在我的 java play 应用程序中我有注释 RequiresAuthentication clientName CasClient 在我的控制器内我只想在生产环境中对用户进行身份验证如何有条件地应用注释如果我处理身份验证的方式是
在 as3 中获取对象值的最快方法

好吧我发誓这个问题应该无处不在但事实并非如此我有一个值对象里面有很多 getter setter 它不是一个动态类我迫切需要搜索充满它们的 ArrayCollection 搜索涵盖所有领域因此我将使用大约 13 种不同类型的 V
测试带有浮点数的元组的断言

我有一个函数返回一个元组其中包含一个浮点值通常我使用assertAlmostEquals比较它们但这不适用于元组此外元组还包含其他数据类型目前我正在单独断言元组的每个元素但这对于此类元组的列表来说太多了对于这种情况有什么
如何让 JavaScript 随着时间的推移（而不是立即）写入结果？

我有一个程序它会写入很多 if 结果例如这个 const a prompt for let i 1 i lt a i console log i 不是实际的代码因此当您输入一个大数字时会有大量答案等待输入控制台因此当达到某个
Pandas - 如何检查多索引列是否存在

我的问题类似于如何检查 Pandas 中是否存在列 https stackoverflow com questions 24870306 how to check if a column exists in pandas但对于多索引列的情况
当我尝试首先使用 EF5 代码对数据库进行逆向工程时出现异常

该视频向我展示了如何从现有数据库使用 Code First http msdn microsoft com en us data jj572367 http msdn microsoft com en us data jj572367 所以
如何从 scala play 访问发布数据？

我有一条类型为 POST 的路线我正在将发布数据发送到页面我如何访问该帖子数据例如在 PHP 中您使用 POST 如何访问 scala 和 play 框架中的发布数据从 Play 2 1 开始有两种方法获取 POST 参数 1
Google 应用程序引擎示例应用程序抛出 503

我已经设置了 Google 应用引擎的示例 android本教程 https developers google com cloud samples mbs getting started 当我在 EditText 中输入内容并按发送按钮时
手工滚动 SOAP 请求

我正在尝试构建一个手动 HTTP 请求以便从我认为相当简单的 SOAP Web 服务调用返回响应但是我在正确构建请求时遇到了困难并且没有得到我期望的响应适用的wsdl声明 wsdl 目标命名空间 targetNamespace h
如何更改 FullCalendar 中选定日期的背景颜色

我正在尝试更改日历中所选日期的背景颜色在我的下面的代码中它突出显示所有点击的日期我怎样才能只突出显示最后点击的日期 dayClick function day var mydate new Date this 0 getAttribu
将时间序列中的分类列扩展到多个每秒计数列

进行以下转变的最佳方式是什么此转换分为两个部分第一个是将速度转换为每秒平均值第二种方法是获取分类列并将其转换为多列每个分类值一列其中该值是每秒发生的次数例如输入 xts A Time PosixCT Observed Lett

将时间序列中的分类列扩展到多个每秒计数列

将时间序列中的分类列扩展到多个每秒计数列 的相关文章

随机推荐

热门标签

将时间序列中的分类列扩展到多个每秒计数列的相关文章