R中基于移动时间窗口连接数据

2024-03-03

我有每小时记录一次的天气数据，以及每 4 小时记录一次的位置数据 (X,Y)。我想知道 X、Y 位置的温度是多少。天气数据并不完全相同。因此，我为每个位置编写了这个循环，以扫描天气数据，查找日期/时间中的“最接近”并提取该时间的数据。问题是我编写的方式，对于位置#2，它扫描天气数据，但不允许分配为位置#1 分配的最接近的时间信息。假设位置 #1 和 2 是在下午 6 点和下午 6:10 的 10 分钟内拍摄的，最接近的天气时间是下午 6 点。我无法选择允许下午 6 点的天气数据。我是这样设置的，因为我的位置数据集中有 200 个位置（比如 3 个月），我不希望它从天气数据的时间 0 开始，当我知道最近的天气数据刚刚计算时最后一个位置，也恰好是该数据集的 3 个月内。下面是一些示例数据和我的代码。我不知道这是否有意义。

<h6>####Location data</h6>

<p>X   Y   DateTime <br />
1   2   4/2/2003    18:01:01
3   2   4/4/2003    17:01:33
2   3   4/6/2003    16:03:07
5   6   4/8/2003    15:03:08
3   7   4/10/2003   14:03:06
4   5   4/2/2003    13:02:00
4   5   4/4/2003    12:14:43
4   3   4/6/2003    11:00:56
3   5   4/8/2003    10:02:06</p>

<h2>2   4   4/10/2003   9:02:19</h2>

<p>Weather Data
DateTime        WndSp   WndDir  Hgt
4/2/2003 17:41:00   8.17    102.86  3462.43
4/2/2003 20:00:00   6.70    106.00  17661.00
4/2/2003 10:41:00   6.18    106.00  22000.00
4/2/2003 11:41:00   5.78    106.00  22000.00
4/2/2003 12:41:00   5.48    104.00  22000.00
4/4/2003 17:53:00   7.96    104.29  6541.00
4/4/2003 20:53:00   6.60    106.00  22000.00
4/4/2003 19:41:00   7.82    105.00  7555.00
4/4/2003 7:41:00    6.62    105.00  14767.50
4/4/2003 8:41:00    6.70    106.00  17661.00
4/4/2003 9:41:00    6.60    106.00  22000.00
4/5/2003 20:41:00   7.38    106.67  11156.67
4/6/2003 18:07:00   7.82    105.00  7555.00
4/6/2003 21:53:00   6.18    106.00  22000.00
4/6/2003 21:41:00   6.62    105.00  14767.50
4/6/2003 4:41:00    7.96    104.29  6541.00
4/6/2003 5:41:00    7.82    105.00  7555.00
4/6/2003 6:41:00    7.38    106.67  11156.67
4/8/2003 18:53:00   7.38    106.67  11156.67
4/8/2003 22:53:00   5.78    106.00  22000.00
4/8/2003 1:41:00    5.78    106.00  22000.00
4/8/2003 2:41:00    5.48    104.00  22000.00
4/8/2003 3:41:00    8.17    102.86  3462.43
4/10/2003 19:53:00  6.62    105.00  14767.50
4/10/2003 23:53:00  5.48    104.00  22000.00
4/10/2003 22:41:00  6.70    106.00  17661.00
4/10/2003 23:41:00  6.60    106.00  22000.00
4/10/2003 0:41:00   6.18    106.00  22000.00
4/11/2003 17:41:00  8.17    102.86  3462.43</p>

<h2>4/12/2003 18:41:00  7.96    104.29  6541.0</h2>

weathrow = 1
for (i in 1:nrow(SortLoc)) {
    t = 0
    while (t < 1) {
        timedif1 = difftime(SortLoc$DateTime[i], SortWeath$DateTime[weathrow], units="auto")
        timedif2 =  difftime(SortLoc$DateTime[i], SortWeath$DateTime[weathrow+1], units="auto") 
        if (timedif2 < 0) {
            if (abs(timedif1) < abs(timedif2)) {
                SortLoc$WndSp[i]=SortWeath$WndSp[weathrow]
                SortLoc$WndDir[i]=SortWeath$WndDir[weathrow]
                SortLoc$Hgt[i]=SortWeath$Hgt[weathrow]
            } else {
                SortLoc$WndSp[i]=SortWeath$WndSp[weathrow+1]
                SortLoc$WndDir[i]=SortWeath$WndDir[weathrow+1]
                SortLoc$Hgt[i]=SortWeath$Hgt[weathrow+1]
            }
            t = 1
        }
        if (abs(SortLoc$DateTime[i] - SortLoc$DateTime[i+1] < 50)) {
            weathrow=weathrow
        } else {
            weathrow = weathrow+1
            #if(weathrow = nrow(SortWeath)){t=1}
        }
    } #end while
}

你可以使用findInterval查找最接近值的函数：

# example data:
x <- rnorm(120000)
y <- rnorm(71000)
y <- sort(y) # second vector must be sorted
id <- findInterval(x, y, all.inside=TRUE) # finds position of last y smaller then x
id_min <- ifelse(abs(x-y[id])<abs(x-y[id+1]), id, id+1) # to find nearest

在你的情况下一些as.numeric可能需要。

# assumed that SortWeath is sorted, if not then SortWeath <- SortWeath[order(SortWeath$DateTime),]
x <- as.numeric(SortLoc$DateTime)
y <- as.numeric(SortWeath$DateTime)
id <- findInterval(x, y, all.inside=TRUE)
id_min <- ifelse(abs(x-y[id])<abs(x-y[id+1]), id, id+1)
SortLoc$WndSp  <- SortWeath$WndSp[id_min]
SortLoc$WndDir <- SortWeath$WndDir[id_min]
SortLoc$Hgt    <- SortWeath$Hgt[id_min]

一些补充：你应该从来没有，绝对更新添加值到data.frame在for循环中。检查这个比较：

N=1000
x <- numeric(N)
X <- data.frame(x=x)
require(rbenchmark)
benchmark(
    vector = {for (i in 1:N) x[i]<-1},
    data.frame = {for (i in 1:N) X$x[i]<-1}
)
#         test replications elapsed relative
# 2 data.frame          100    4.32    22.74
# 1     vector          100    0.19     1.00

data.frame版本慢 20 倍以上，并且如果包含的行数越多，差异就越大。

因此，如果您更改脚本并首先初始化结果向量：

tmp_WndSp <- tmp_WndDir <- tmp_Hg <- rep(NA, nrow(SortLoc))

然后更新循环中的值

tmp_WndSp[i] <- SortWeath$WndSp[weathrow+1]
# and so on...

并在最后（循环外）更新适当的列：

SortLoc$WndSp <- tmp_WndSp
SortLoc$WndDir <- tmp_WndDir
SortLoc$Hgt <- tmp_Hgt

它应该运行得更快。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R中基于移动时间窗口连接数据的相关文章

将summary()写入as.data.frame以在ggplot / R中使用

请查找 af 数据样本t below 我正在使用以下方法进行竞争风险分析etmCIF来自etm package 产生以下结果这很好但需要更好的图形曾经有一个ggtrans etm函数将数据导入ggplot 然而这个功能显然被删除了
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
将 JSON URL 转换为 R 数据帧

我在将 JSON 文件从 API 转换为 R 中的数据帧时遇到问题例如 URL 我尝试了 S O 的一些不同建议包括将json数据转换为R中的数据框 https stackoverflow com questions 28683769
如何使用 R 中带引号的字符值内的序列读取 CSV？

这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来并且有一个顺序在值之一内转义引号加分隔符我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
计算从给定日期开始的月份中的第几天？

我正在努力寻找一种简单有效的解决方案来计算每月的工作日例如如果给定日期是第一个星期一Monday 5th March 2018然后我想获取接下来 6 个月每个月第一个星期一的日期例如 Monday 2nd April 2018 and
在函数内部调用 clusterApply 时，性能会下降

我遇到了一个奇怪的问题clusterApply 我已经能够尽可能地隔离它如下所示首先我从全局环境运行以下代码 require parallel cl lt makeCluster rep localhost 20 SOCK xl lt
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
在 R 中绘制对数正态概率密度

我正在尝试在 R 中生成对数正态概率密度图其中包含 3 个不同的均值对数和标准差对数我尝试了以下方法但我的图表太丑了看起来一点也不好看 x lt seq 0 10 length 100 a lt dlnorm x meanlog 0
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
为绘图制作 2D 图例 - 双变量分区统计图

我一直在玩双变量 choropleth 地图并且一直在如何创建类似于 2d 图例的问题上陷入困境约书亚史蒂文斯 http www joshuastevens net cartography make a bivariate chorop
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
glmnet 未从 cv.glmnet 收敛 lambda.min

我跑了20倍cv glmnet套索模型以获得 lambda 的最佳值但是当我尝试重现结果时glmnet 我收到一个错误内容如下 Warning messages 1 from glmnet Fortran code error c
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
R - 通过覆盖和递归合并列表

假设我有两个带有名字的列表 a list a 1 b 2 c list d 1 e 2 d list a 1 b 2 b list a 2 c list e 1 f 2 d 3 e 2 我想递归地合并这些列表如果第二个参数包含冲突的值则
如何计算嵌套函数中的粘合表达式？

我正在尝试嵌套一个函数该函数将两个字符串粘合在一起该函数使用组合字符串来命名数据帧的列然而问题似乎是粘合表达式没有足够早地评估为字符串我可以并且应该强制在将表达式作为参数传递给另一个函数之前对其进行求值吗 library ti
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
GGPLOT2：如何在 ggplot() 脚本中绘制特定选择

这是一个名为的大型数据集的峰值P 其中有 10 个优惠 CS 有不同的商店 SHP 具有多个数值数据集列出了按周排序的它们 WK 2 tm 52 它创建一个大文件仅前 6 行出现峰值 WK MND CS SHP RevCY RevLY

随机推荐

' 中声明的私有成员' aria-label='Stringstream 错误：无法访问类 'std::basic_ios<_Elem,_Traits>' 中声明的私有成员'> Stringstream 错误：无法访问类 'std::basic_ios<_Elem,_Traits>' 中声明的私有成员

在创建一个简单的异常类扩展我可以更轻松地构造错误消息时我将错误隔离为以下简单代码 include
自动递增宏扩展

使用普通C预处理器宏是否可以创建类似以下内容 INIT BASE 0x100 init starting number define BASE A GET NEXT BASE equivalent to define BASE A 0x1
jQuery 查找浮动 li 中每行的项目数

有没有办法找到项目的数量 li标签内ul其中有它的float set to left 假设我有大量文件夹这些文件夹在视觉上表示为li标签由于浮动行为一旦li不适合单行它们将被向下推给出行和列的外观我的问题是使用 jQuery
JAVAFX：可以通过代码设置css吗？

我有以下代码 progress bar gt bar fx background color linear gradient from 0em 0 75em to 0 75em 0px repeat fx accent 0 fx accen
我如何向 Activemq 发送消息

我从来不工作JMS 最近我下载了Activemq并更改端口号61616 to 61617 in all conf activemq xml文件我从命令提示符运行以下命令并在浏览器上打开控制台页面 C Users Infratab Bang
如何自动缩放一组控件的字体大小？

我在 WPF 网格中有一些 TextBlock 我想根据它们的可用宽度高度进行缩放当我搜索自动缩放字体大小时典型的建议是将 TextBlock 放入 ViewBox 中所以我这样做了
Android MediaRecorder API 不断裁剪视频比特率

我使用 MediaRecorder API 一段时间了我以为所有问题都已经过去了但我想我错了我正在使用 MediaRecorder API 将视频录制到文件中当我使用高质量的 setProfile 时我得到了良好的质量但是当我尝
如何在 React Native 中拉伸静态图像作为背景？

我想在我的 React Native 应用程序中使用背景图像图像比屏幕小所以我必须拉伸它但如果图像是这样它就不起作用从资源包加载 var styles StyleSheet create bgImage flex 1 flexDir
使用 MediaWiki 从 Wikia 页面提取文本，但返回结果一片混乱，是否有更好的方法可以从每个部分提取文本？

我正在开发一个 Android 应用程序它从 Wikia 页面提取信息并将其显示在应用程序中我目前正在拉动所有类别进行导航并将我的应用程序设置为在 WebView 中显示页面但我只想拉动信息并自行格式化而不是通过传递到 WebVi
android：如何在字符串中添加下划线
按组计算值之间的差异并匹配时间

对于每只鸟我想计算不同日期的平均每小时体温 Tb 测量值 Tb Periods 之间的差异我的目标是能够比较 BirdX 从 0900 PreI 到 09 00 DayI 10 00 PreI 到 10 00 PostI 等的 Tb 变
如何在 POST 期间获取不同资源的 JAX-RS @Path？

我有两个用于涉及用户资源的简单 Web 服务 Jersey 和 GlassFish 的 REST 类一个对所有用户进行操作例如 POSTing 的工厂另一个对单个用户进行操作例如 GET PUT 删除他们位于 Stateless
在sql server中使用case语句更新多列

我想使用 case 语句更新表查询是这样的 select case columnname when name1 then begin update table set pay1 pay1 100 pay2 pay2 20 pay3 pa
.Net Core 无法使用位图

我正在使用 Net Core 2 1 开发 Web 服务我有一个字节数组其中包含所有像素值灰度宽度高度我想从这些参数创建一个位图这是我的代码来自一个正在运行的 Net Framework 4 项目 public FileRe
CollapsingToolbarLayout 未正确调用 requestLayout()

我有一个折叠的工具栏布局其中包含图像折叠时显示工具栏标题我需要更改工具栏标题字体因此我在工具栏布局中添加了一个文本视图现在每当我折叠工具栏时都会重复生成以下错误 08 12 13 14 19 604 2263 2263 com
什么时候应该从类方法返回对对象的引用

从类方法返回引用的最佳实践是什么是否希望在没有引用的情况下返回基本类型而希望通过引用返回类对象您推荐的任何文章最佳实践文章我假设你所说的类方法是指成员函数通过引用返回的意思是返回对成员数据的引用这主要与返回对 local
Coq 中的“错误：宇宙不一致”是什么意思？

我正在努力通过软件基础 http www cis upenn edu bcpierce sf current 目前正在做教堂数字的练习这是自然数的类型签名 Definition nat forall X Type X gt X gt X
Google Finance，如何获取 JSON 数据流？

我之前试图解释这一点但显然失败了因此如果您打开了谷歌金融图表例如 http www google com finance q INDEXNASDAQ IXIC http www google com finance q INDEXN
将 HTTP 响应正文解析为 XML

我使用此代码执行 HTTP 请求并解析 XML 响应 using HttpWebResponse resp req GetResponse as HttpWebResponse if resp StatusCode HttpStatusCo
R中基于移动时间窗口连接数据

我有每小时记录一次的天气数据以及每 4 小时记录一次的位置数据 X Y 我想知道 X Y 位置的温度是多少天气数据并不完全相同因此我为每个位置编写了这个循环以扫描天气数据查找日期时间中的最接近并提取该时间的数据问题是我编

R中基于移动时间窗口连接数据

R中基于移动时间窗口连接数据 的相关文章

随机推荐

热门标签

R中基于移动时间窗口连接数据的相关文章