每天在 R 数据帧上应用 cut()

2024-04-30

我在 R 中有一个数据表，我在其中应用了cut() and table()。我能够根据条件得到频率表。但我得到了总体频率。我想明智地做到这一点。我有一个名为timestamp其中有时间戳。我还有一个section具有价值的列A or B。如何根据每天每个部分进行切割。

我当前的输出：

Var1    Freq
0-30    1398
30-60   1051
60-80   1006
80-100  36
100>    2

预期输出：

Date        Sec  Var1    Freq
05-01-2020   A   0-30    1398
05-01-2020   A   30-60   1051
05-01-2020   A   60-80   1006
05-01-2020   A   80-100  36
05-01-2020   A   100>    2
05-01-2020   B   0-30    138
05-01-2020   B   30-60   151
05-01-2020   B   60-80   1056
05-01-2020   B   80-100  3
05-01-2020   B   100>    6
06-01-2020   A   0-30    398
06-01-2020   A   30-60   11
06-01-2020   A   60-80   16
06-01-2020   A   80-100  3666
06-01-2020   A   100>    25
06-01-2020   B   0-30    1948
06-01-2020   B   30-60   233
06-01-2020   B   60-80   33
06-01-2020   B   80-100  433
06-01-2020   B   100>    34
and so on.....

我的代码：

result = as.data.frame(table(cut(df$temp,breaks=c(0,30,60,80,100,1000),labels=c("0-30","30-60","60-80","80-100","100>"))))

样本数据：

timestamp        section    temp
01-05-2020 00:01:22 A   45
02-05-2020 00:01:22 A   10
03-05-2020 00:01:22 A   98
04-05-2020 00:01:22 A   23
05-05-2020 00:01:22 A   67
06-05-2020 00:01:22 A   89
07-05-2020 00:01:22 A   100
08-05-2020 00:01:22 A   110
09-05-2020 00:01:22 A   123
10-05-2020 00:01:22 A   12
01-05-2020 00:01:22 B   23
02-05-2020 00:01:22 B   44
03-05-2020 00:01:22 B   55
04-05-2020 00:01:22 B   12
05-05-2020 00:01:22 B   98
06-05-2020 00:01:22 B   45
07-05-2020 00:01:22 B   87
08-05-2020 00:01:22 B   65
09-05-2020 00:01:22 B   12
10-05-2020 00:01:22 B   8

这是一种选择。我们按“日期”和cut在“临时”列上，然后summarise得到频率n()

library(dplyr)
library(lubridate)
df %>%
    group_by(Date = as.Date(dmy_hms(timestamp)), section,
     Var1 = cut(temp, breaks=c(0,30,60,80,100,1000),
           labels=c("0-30","30-60","60-80", "80-100", "100>"))) %>%
    summarise(Freq = n())
# A tibble: 20 x 4
# Groups:   Date, section [20]
#   Date       section Var1    Freq
#   <date>     <chr>   <fct>  <int>
# 1 2020-05-01 A       30-60      1
# 2 2020-05-01 B       0-30       1
# 3 2020-05-02 A       0-30       1
# 4 2020-05-02 B       30-60      1
# 5 2020-05-03 A       80-100     1
# 6 2020-05-03 B       30-60      1
# 7 2020-05-04 A       0-30       1
# 8 2020-05-04 B       0-30       1
# 9 2020-05-05 A       60-80      1
#10 2020-05-05 B       80-100     1
#11 2020-05-06 A       80-100     1
#12 2020-05-06 B       30-60      1
#13 2020-05-07 A       80-100     1
#14 2020-05-07 B       80-100     1
#15 2020-05-08 A       100>       1
#16 2020-05-08 B       60-80      1
#17 2020-05-09 A       100>       1
#18 2020-05-09 B       0-30       1
#19 2020-05-10 A       0-30       1
#20 2020-05-10 B       0-30       1

data

df <- structure(list(timestamp = c("01-05-2020 00:01:22", "02-05-2020 00:01:22", 
"03-05-2020 00:01:22", "04-05-2020 00:01:22", "05-05-2020 00:01:22", 
"06-05-2020 00:01:22", "07-05-2020 00:01:22", "08-05-2020 00:01:22", 
"09-05-2020 00:01:22", "10-05-2020 00:01:22", "01-05-2020 00:01:22", 
"02-05-2020 00:01:22", "03-05-2020 00:01:22", "04-05-2020 00:01:22", 
"05-05-2020 00:01:22", "06-05-2020 00:01:22", "07-05-2020 00:01:22", 
"08-05-2020 00:01:22", "09-05-2020 00:01:22", "10-05-2020 00:01:22"
), section = c("A", "A", "A", "A", "A", "A", "A", "A", "A", "A", 
"B", "B", "B", "B", "B", "B", "B", "B", "B", "B"), temp = c(45L, 
10L, 98L, 23L, 67L, 89L, 100L, 110L, 123L, 12L, 23L, 44L, 55L, 
12L, 98L, 45L, 87L, 65L, 12L, 8L)), class = "data.frame", row.names = c(NA, 
-20L))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

每天在 R 数据帧上应用 cut() 的相关文章

正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
kernlab 中 SVM 训练之外的核矩阵计算

我正在开发一种新算法该算法可以生成修改后的核矩阵以用于 SVM 训练但遇到了一个奇怪的问题出于测试目的我比较了使用 kernelMatrix 接口和普通内核接口学习的 SVM 模型例如 Model with kernelMatri
删除特定数据表上的所有边框

我需要使用 PrimeFaces 隐藏一个数据表的所有边框而不是全部我尝试了很多事情但没有人奏效有谁知道该怎么做我已将以下样式单独应用于ui datatable class border hidden important bo
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
ggplot2 geom_密度和geom_histogram在一个图中

如何制作一个所有条形加起来为 1 的直方图并在适合的上方添加一个密度层 set seed 1234 df lt data frame sex factor rep c F M each 200 weight round c rnorm 2
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
在 Rcpp 中使用其他包中的 C 函数

我试图从 C 函数中的 cubature 包调用 C 例程来执行多维积分我试图重现的基本 R 示例是 library cubature integrand lt function x sin x adaptIntegrate integr
如何在 R 中匹配多个 ggplot2 图中的调色板？

自从被问到这个问题以来已经有一段时间了但我知道一个事实我很快就会提取新数据我想弄清楚如何用这种技术来绘制它看起来评论和答案中的人知道如何做到这一点但我无法完全弄清楚所给我的内容还有人想尝试一下吗我正在尝试使用具有多个级别的因子
ggplot2：如何标记事件发生的日期

我想从第二个情节中获取第一个情节的信息第二张图表示事件发生的天数它看起来更宽因为它没有图例但它是相同的时间尺度我选择在第一个图中手动分配颜色 I would like to overlay the second plot dots
R：如何获取该月的周数

我是 R 新手我想要该日期所属月份的周数通过使用以下代码 gt CurrentDate lt Sys Date gt Week Number lt format CurrentDate format U gt Week Number 3
R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案：函数是否存在，我应该编写自己的函数，还是我错过了重点？

最近我发现了base files命令与其他命令一起使用例如getwd write lines file show dir等等似乎有许多 bash 函数的 R 等价物我还在 R 中编写了一些函数来简化对ssh and rsync通过
read_html(url) 和 read_html(content(GET(url), "text")) 之间的区别

我正在看这个很棒的答案 https stackoverflow com a 58211397 3502164 https stackoverflow com a 58211397 3502164 解决方案的开头包括 library httr
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
闭包作为数据合并习惯的解决方案

我正在尝试解决闭包问题而且我think我发现了一个案例他们可能会有所帮助我有以下几部分需要处理一组正则表达式旨在清理状态名称位于函数中具有州名称上述函数创建的标准化形式和州 ID 代码的 data frame 用于链接两者

随机推荐

在 ruamel.yaml 的列表元素中添加注释

我使用 Python 在 YAML 文件的列表中动态添加元素并且我想在我添加的每个元素旁边添加注释以下是所有所需的格式 flow style example a b c first list d e second list block
flutter生成的3个APK有什么区别？

我需要了解Android设备架构以及为什么我使用时会生成三种不同类型的APK flutter build apk split per abi 当我使用 flutter build apk 我得到一个名为 fat APK 的大 APK 文件
Windows批处理文件：在for循环中设置变量

我有许多具有相同命名方案的文件作为示例四个文件分别称为 num 001 001 txt num 002 001 txt num 002 002 txt num 002 003 txt 第一组数字代表它来自哪个包第二组数字只是用来区分
CUDA 常量内存是否应该被均匀地访问？

我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化如果是如何确保所有线程同时访问同一地址既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化是的这缓存本身每
AJAX 表单不显示成功或错误消息

这个问题我以前也问过但还是没搞明白我做了一些改变但不幸的是我仍然没有得到任何运气表单本身可以工作但当用户尝试发送表单时它还应该显示错误或成功消息但它不显示消息而是发送表单而不显示它看看我的代码 HTML
我可以在运行时更改 Silverlight 浏览器外设置吗？

我有一个代码库可以在各种配置中安装 OOB SL5 应用程序根据运行时的配置由初始化参数选择我想在执行安装之前更新 OOB 设置标题窗口标题看来唯一的方法是在编译时通过 OutOfBrowserSettings xml 文件
对 Windows 窗体上的字段执行数据验证的最简单方法

我有一个 Windows 窗体项目我想在用户按下底部的计算按钮之前强制用户在某些字段中输入值这些字段包括三对单选按钮 five 文本框和一个组合框因此基本上所有这些字段都需要包含一个值才能执行计算此外文本框应包含numbers 任
定义 WebActivator.PreApplicationStartMethod 类的初始化顺序

我有几个 WebActivator PreApplicationStartMethod 装饰类一个用于 Ninject 另一个用于 AwesomeMVC 第三个用于后台任务调度程序问题是调度程序类需要利用 IoC 容器解决的依赖关系我
作用域对象的 Xtext 示例

我正在寻找一个示例在 XText 中说明如何在用户定义的对象成员上实现代码完成据我所知我需要使用 IScope 但所有这些如何连接在一起还不清楚鉴于trait是用户定义的类型我如何构建语法来编码完成验证其中包含的方法Strin
WordPress URL 中的正斜杠

我正在将我的网站从 Drupal 迁移到 Wordpress 在 Drupal 中我可以轻松地给 URL 指定一个别名这个别名可以是任何东西即 www example com abc xyz hello html 但在 WordPre
来自两个表的数据而不重复第一个表的数据？

我的 MySQL 数据库中有两个表用户表和用户元表我正在寻找一种方法通过一个查询从两个表中获取所有信息但不重复用户表中的信息这也是与用户 ID 号相关的所有信息例如 user id 1 有没有办法查询数据库并收集两个表中的所有信
如何从 URL 获取视图中的当前路由 ID (ASP.NET MVC)

在从 URL 例如 Controller Action 1 返回的视图中假设默认路由为controller action id 如何从视图中访问 ID 我不想在处理请求时将其添加到操作级别的 ViewData 字典中我认为这就是您正在寻
Crystal Reports 间歇性错误“无法提交请求以进行后台处理。”

我们在带有 NET Framework 3 5 SP1 的 Windows Server 2008 上运行 Crystal Reports 我见过许多导致一般错误无法提交请求进行后台处理的原因然而在其他论坛上由于特定报告的特定格式
两种模板类型和两个模板参数列表有什么区别？

这两个声明有什么区别 template
如何在自定义服务器控件asp中使用.resx和.resource文件？

我正在编写自己的服务器端控件并且使用存储在 resx文件在控制台应用程序中此代码运行良好 ResXResourceReader rsxr new ResXResourceReader Resource1 resx foreach Di
将 XML 反序列化为类

我有正在反序列化的 XML 这是我的 XML
自定义地图标注视图点击即可隐藏

我已经制作了自定义地图标注我的标注包含UIButtons and UITextView 当我点击时UIButton 按起来很好但是当我点击UITextView它将光标移动到点击位置然后取消选择图钉并消失标注我已经实施了hitTest
Postgres触发器函数更新另一个表中的聚合结果

我有两张桌子表 x 和表 y 表 x 每天都会更新我希望在表 x 中插入新数据后立即更新表 y 表 y 包含表 x 中每天所有更新的聚合值 Date为Date类型其余两列为real类型 Table x 可以每天更新 table y 应
当url中有空格时htaccess重定向

我想从仍然出现在谷歌搜索中的旧网址重定向到新网址旧的网址是这样的 http www marionettecolla org file 20 mostra milano mostra marionette milano htm 我想将其重定
每天在 R 数据帧上应用 cut()

我在 R 中有一个数据表我在其中应用了cut and table 我能够根据条件得到频率表但我得到了总体频率我想明智地做到这一点我有一个名为timestamp其中有时间戳我还有一个section具有价值的列A or B 如何根据每

每天在 R 数据帧上应用 cut()

data

每天在 R 数据帧上应用 cut() 的相关文章

随机推荐

热门标签