R 中的滚动连接 data.table

2024-01-12

我试图更多地了解滚动连接的工作方式，但有些困惑，我希望有人能为我澄清这一点。举一个具体的例子：

dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50, key="id,t")
dt2 <- data.table(id=rep(1:5, 2), t=1:10, val2=1:10, key="id,t")

我预计这会产生很长的data.table其中的值dt2被卷起：

dt1[dt2,roll=TRUE]

相反，正确的方法似乎是：

dt2[dt1,roll=TRUE]

有人可以向我解释一下如何加入吗data.table有效，因为我显然没有正确理解它。我以为dt1[dt2,roll=TRUE]对应于 sql 等价物select * from dt1 right join dt2 on (dt1.id = dt2.id and dt1.t = dt2.t)，除了添加的功能 locf 之外。

另外，文档还说：

X[Y] is a join, looking up X's rows using Y (or Y's key if it has one) 
as an index.

这使得看起来只有 X 中的内容应该返回，并且正在进行的连接是内部连接，而不是外部连接。那么在这种情况下，当roll=T但那个特别的id不存在于dt1？再玩一会儿我就无法理解该列中放入了什么值。

文档中的引用似乎来自 FAQ 1.12X[Y] 和 merge(X,Y) 有什么区别。您是否在以下内容中找到了?data.table有帮助吗？

roll适用于最后一个连接列，通常是日期，但可以是任意有序变量、不规则变量和包含间隙的变量。如果 roll=TRUE 并且 i 的 row 匹配除最后一个 x 连接列之外的所有列，及其值最后我加入的列落在间隙中（包括在最后一个之后）该组的 x 观测值），则 x 的主要值为向前滚动。使用修改后的此操作特别快二分查找。该操作也称为最后一次观察向前（LOCF）。通常，x 的键中不应有重复项，最后一个键列是日期（或时间，或日期时间）并且所有列 x 的键被连接到。一个常见的习惯用法是选择一个跨一组标识符的同期常规时间序列 (dts) (ids): DT[CJ(ids,dts),roll=TRUE] 其中 DT 有一个 2 列键 (id,date) CJ 代表交叉连接。

rolltolast与滚动类似，但数据不会前滚到最后一个数据之后由连接列定义的每个组内的观察。价值 i 必须落在 x 的间隙中，但不能在数据结束之后，对于该组由除最后一个连接列之外的所有列定义。滚动和 rolltolast 可能不都是 TRUE。

就 SQL 连接的左/右类比而言，我更喜欢在 FAQ 2.14 的上下文中考虑这一点你能进一步解释一下为什么 data.table 受到 A[B] 语法的启发吗在基地。这是一个很长的答案，所以我不会将其粘贴在这里。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R 中的滚动连接 data.table 的相关文章

在 R 中打印具有长字符串的数据帧

让我们有一列包含长字符串的数据框 df lt data frame short rnorm 10 0 1 long replicate 10 paste rep sample letters runif 1 5 8 collapse 如何打
使用 R 将我的 shapefile 数据投影到传单地图上

我在 Win7 上试图获取我的 shapefile 数据 Here https www dropbox com s f3d46itleoozzjz shapefiles zip dl 0是数据文件要使用显示leaflet包裹但没有任
以给定的纵横比保存绘图

我正在使用非常棒的库 ggplot2 我想出了如何使用设置绘图的纵横比coord fixed 现在我想将绘图保存为具有指定宽度例如 10 厘米的 PDF 并计算所需的高度我不知道如何实现这一目标这可能吗您可以使用网格函数来计算
ggplot更改图例中的几何顺序[重复]

这个问题在这里已经有答案了我有两个堆积面积图上面画了一条线在这两种情况下我的绘图顺序都是这样的创建ggplot 添加堆叠区域 geom area 更改堆叠区域颜色添加行 geom line 改变线条颜色在我的第一张图中堆叠区
如何在R中得到一个大的稀疏矩阵？ (> 2^31-1)

我使用一些 C 代码从数据库中获取文本文件并从该文件创建 dgcMatrix 类型稀疏矩阵Matrix包裹我第一次尝试构建一个具有超过 2 31 1 个非稀疏成员的矩阵这意味着稀疏矩阵对象中的索引向量也必须比该限制长不幸的是向量似
在 Shiny 中设置一个绘图缩放以匹配另一个绘图缩放

我正在尝试使用情节重排获取一个图的 x 轴缩放限制并将它们应用到 Shiny 中的另一个图到目前为止我可以从 plot1 x轴限制获取相关的plotly relayout数据将其转换从数字到日期并在绘制 plot2 之前将其提
将密度曲线拟合到 R 中的直方图

R中有没有可以将曲线拟合到直方图的函数假设您有以下直方图 hist c rep 65 times 5 rep 25 times 5 rep 35 times 10 rep 45 times 4 看上去很正常但其实是歪曲的我想拟合一条倾
如何生成向量的所有组合[重复]

这个问题在这里已经有答案了假设我有 3 个绿球 2 个橙球和 8 个黄球我想订购它们鉴于所有相同颜色的球都是相同的如何生成所有可能的序列在 R 中使用gregmisc 我可以 balls lt c orange orange g
如何使用 r 中的 caret 包在最佳调整超参数的 10 倍交叉验证中获得每次折叠的预测？

我试图使用 R 中的插入符包使用 10 倍交叉验证和 3 次重复来运行 SVM 模型我想使用最佳调整的超参数获得每次折叠的预测结果我正在使用以下代码 Load packages library mlbench library caret
R read_excel：libxls 错误：无法解析文件

我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
在绘图中的线间隙之间添加注释

I have a graph like this 而不是在上面的日子symbol 我想知道是否有办法可以在行之间添加此注释从一个点到另一个点如果以防万一这可能是重复的我深表歉意 This is my expected output
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
如何在 dataTable.js 中转置行和列

我想在行而不是列中显示我的数据转置你可以在这里看到我的例子 var dataSet Tiger Nixon System Architect Edinburgh 5421 2011 04 25 320 800 Garrett Winte
使用 R 的 flextable 包时，有没有办法将传递给 add_header_lines() 的字符串部分加粗

我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格但是我在将表格标题中的部分文本加粗时遇到了一些麻烦例如我希望标题为 Table 1 我的表格标题的其余部分而不是表 1 我的表格标题的其余部分 I 找到这个
将列表中的列转换为 R 中的数据框

我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
如何更新条件公式？

让我直接进入示例考虑以下等式 frml lt formula y a b x z 使用这样的公式规范例如和AER ivreg 我想更新这个公式使其显示为 frml2 lt y a b c x z w 但是我不确定如何更新条件标志之前
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST

随机推荐

ORM 排序与模型“元”排序 - Django 1.11

小问题订购商品的更好方式是什么 1 class Table models Model class Meta ordering user 2 Table objects all order by user 我认为第二个更好因为第一个总是会
iOS - AudioOutputUnitStop 导致应用程序冻结并发出警告

有时执行 AudioOutputUnitStop inputUnit 导致应用程序冻结约 10 15 秒并显示以下控制台消息 WARNING 0x3b58918c AURemoteIO cpp 1225 Stop AURemoteIO St
如何使用nodeJS连接到隐式FTPS服务器？

对于一个项目我必须通过隐式连接连接到 FTPS 服务器我尝试使用node ftp 因为这似乎是唯一支持隐式连接的库我使用以下代码进行连接 var ftpC new FTPClient ftpC on ready function co
angular2 组件中的多个动画触发器

我想在一个组件中定义多个动画触发器这可能吗例如一种用于进入场景另一种用于悬停或者我是否需要为这种情况定义两个组件父子组件项目组件 ts removed the import and class part for better
Javascript / REGEX：删除字符串中以特定字母开头的特定文本（单词），单词之间以空格分隔

我知道这可以通过正则表达式快速完成我得到的字符串如下 Alpha OmegaS Sheol Gehena GSSaga Serekali 我想删除以 s 开头的单词所以我应该 Alpha OmegaS Gehena GSSaga 我尝试
ThreadStateException：尝试加入线程时线程尚未启动

就在最近我面试的时候遇到了这样一个问题 methid 计算执行的输出是什么 public void Calculate var threads Enumerable Range 0 50 Select x gt var thread ne
DataGridView 鼠标滚轮滚动停止工作

我的应用程序中有一个 DataGridView 但无法使用鼠标滚轮滚动它以前运行得很好我不确定我做了什么导致了这个问题因为我最近对代码进行了多次更改后才注意到它我没有发布任何代码因为有超过 2k 行而且我不确定错误可能出在哪里
如何阻止网站注册表中的一次性电子邮件地址？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想知道可能的阻止方法一次性电子邮件地址 http en wikipedia org wiki Dis
是否可以对包含 url 编码的 url 进行 urlencode？

我有一个网站使用 Facebook Twitter 美味分享链接它们包含您希望共享的网站的 url 编码 url 问题是我想通过 php 重定向页面发送 facebook twitter delicious url 在编码的 url 中
在 VBA 中导入 UTF-8 文件

我想在表中导入一个管道分隔文件但该文件采用 UTF 8 格式具有动态结构我曾尝试使用 TransfertText 和 FSO 但只有 ADODB Stream 似乎可以很好地处理这种编码但它只读取全文如何每行读取这样的文件行以在现
具有抽象方法的接口

我遇到了一些由同事编写的 PHP 代码它没有用于任何用途基本上它是一个包含抽象方法的接口然后我说这很愚蠢并展示了坐在我旁边的另一位同事我们笑了但随后开始互相询问这是否可能如果可能的话是否真的有用显然这是不可能的参见下面的示
module-info.java 不适用于 Java 9 中的 lombok

我在将项目迁移到Java 9 更新 Java 9 后我尝试运行项目但遇到编译器错误 Error 6 1 java package javax annotation is not visible package javax annotat
在 Windows 8 上安装 Docker 卷不起作用

Context 我想在 Windows 8 上运行 Docker Compose 应用程序我在 Ubuntu 16 04 下制作了它它运行得很好此 Docker Compose 运行 nginx php fpm 这两个容器使用卷 Fi
Git 预提交钩子配置

我正在关注办公室指导 https pre commit com创建钩子并将其添加到预提交检查过程我需要创建 3 个文件 pre commit config yaml pre commit hooks yaml theCheckFile s
ioexception：在java中写入文件时客户端不拥有所需的权限

我搜索了很多类似的问题但无法解决我的问题我试图在文件中写入一些内容这给了我错误 My code try File f new File file name f createNewFile System out println Hell
无法使用 Sigma.js 显示任何图表

我想在网络界面上可视化大型网络图经过几天的搜索我决定使用 Sigma js 因为它看起来很简单并且兼容 HTML5 问题是我无法显示 Sigma js 网页上的任何图形示例即使我使用作者在 Sigma js 主页上拥有的最少代码也是如
write 和 printf 哪个更快？

进行以下测试后 for i 0 i lt 3000000 i printf Test string n for i 0 i lt 3000000 i write STDOUT FILENO Test string n strlen Test
如何创建带空格的列名？

谁能告诉我如何创建带有全名这样的空格的列我已经尝试过类似以下的操作但它不起作用 CREATE TABLE info Full Names varchar 20 Physical Address varchar 20 Moviesre
GCMIntentService 的 onRegistered() 从未调用过

我正在尝试在 GCM 上注册我的应用程序但我不知道为什么我的应用程序从未注册 GCMRegistrar register this SENDER ID 被调用但我的 GCMIntentService 中的 onRegistered 从未
R 中的滚动连接 data.table

我试图更多地了解滚动连接的工作方式但有些困惑我希望有人能为我澄清这一点举一个具体的例子 dt1 lt data table id rep 1 5 10 t 1 50 val1 1 50 key id t dt2 lt data tab

R 中的滚动连接 data.table

R 中的滚动连接 data.table 的相关文章

随机推荐

热门标签