R 中的滚动连接 data.table

2024-01-12

我试图更多地了解滚动连接的工作方式,但有些困惑,我希望有人能为我澄清这一点。举一个具体的例子:

dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50, key="id,t")
dt2 <- data.table(id=rep(1:5, 2), t=1:10, val2=1:10, key="id,t")

我预计这会产生很长的data.table其中的值dt2被卷起:

dt1[dt2,roll=TRUE]

相反,正确的方法似乎是:

dt2[dt1,roll=TRUE]

有人可以向我解释一下如何加入吗data.table有效,因为我显然没有正确理解它。我以为dt1[dt2,roll=TRUE]对应于 sql 等价物select * from dt1 right join dt2 on (dt1.id = dt2.id and dt1.t = dt2.t),除了添加的功能 locf 之外。

另外,文档还说:

X[Y] is a join, looking up X's rows using Y (or Y's key if it has one) 
as an index.

这使得看起来只有 X 中的内容应该返回,并且正在进行的连接是内部连接,而不是外部连接。那么在这种情况下,当roll=T但那个特别的id不存在于dt1?再玩一会儿我就无法理解该列中放入了什么值。


文档中的引用似乎来自 FAQ 1.12X[Y] 和 merge(X,Y) 有什么区别。您是否在以下内容中找到了?data.table有帮助吗?

roll适用于最后一个连接列,通常是日期,但可以是任意 有序变量、不规则变量和包含间隙的变量。如果 roll=TRUE 并且 i 的 row 匹配除最后一个 x 连接列之外的所有列,及其值 最后我加入的列落在间隙中(包括在最后一个之后) 该组的 x 观测值),则 x 的主要值为 向前滚动。使用修改后的此操作特别快 二分查找。该操作也称为最后一次观察 向前(LOCF)。通常,x 的键中不应有重复项, 最后一个键列是日期(或时间,或日期时间)并且所有列 x 的键被连接到。一个常见的习惯用法是选择一个 跨一组标识符的同期常规时间序列 (dts) (ids): DT[CJ(ids,dts),roll=TRUE] 其中 DT 有一个 2 列键 (id,date) CJ 代表交叉连接。

rolltolast与滚动类似,但数据不会前滚到最后一个数据之后 由连接列定义的每个组内的观察。价值 i 必须落在 x 的间隙中,但不能在数据结束之后,对于 该组由除最后一个连接列之外的所有列定义。滚动和 rolltolast 可能不都是 TRUE。

就 SQL 连接的左/右类比而言,我更喜欢在 FAQ 2.14 的上下文中考虑这一点你能进一步解释一下为什么 data.table 受到 A[B] 语法的启发吗 在基地。这是一个很长的答案,所以我不会将其粘贴在这里。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 中的滚动连接 data.table 的相关文章

  • 在 R 中打印具有长字符串的数据帧

    让我们有一列包含长字符串的数据框 df lt data frame short rnorm 10 0 1 long replicate 10 paste rep sample letters runif 1 5 8 collapse 如何打
  • 使用 R 将我的 shapefile 数据投影到传单地图上

    我 在 Win7 上 试图获取我的 shapefile 数据 Here https www dropbox com s f3d46itleoozzjz shapefiles zip dl 0是数据文件 要使用显示leaflet包裹 但没有任
  • 以给定的纵横比保存绘图

    我正在使用非常棒的库 ggplot2 我想出了如何使用设置绘图的纵横比coord fixed 现在 我想将绘图保存为具有指定宽度 例如 10 厘米 的 PDF 并计算所需的高度 我不知道如何实现这一目标 这可能吗 您可以使用网格函数来计算
  • ggplot更改图例中的几何顺序[重复]

    这个问题在这里已经有答案了 我有两个堆积面积图 上面画了一条线 在这两种情况下 我的绘图顺序都是这样的 创建ggplot 添加堆叠区域 geom area 更改堆叠区域颜色 添加行 geom line 改变线条颜色 在我的第一张图中 堆叠区
  • 如何在R中得到一个大的稀疏矩阵? (> 2^31-1)

    我使用一些 C 代码从数据库中获取文本文件 并从该文件创建 dgcMatrix 类型稀疏矩阵Matrix包裹 我第一次尝试构建一个具有超过 2 31 1 个非稀疏成员的矩阵 这意味着稀疏矩阵对象中的索引向量也必须比该限制长 不幸的是 向量似
  • 在 Shiny 中设置一个绘图缩放以匹配另一个绘图缩放

    我正在尝试使用情节重排获取一个图的 x 轴缩放限制 并将它们应用到 Shiny 中的另一个图 到目前为止 我可以从 plot1 x轴限制 获取相关的plotly relayout数据 将其转换 从数字到日期 并在绘制 plot2 之前将其提
  • 将密度曲线拟合到 R 中的直方图

    R中有没有可以将曲线拟合到直方图的函数 假设您有以下直方图 hist c rep 65 times 5 rep 25 times 5 rep 35 times 10 rep 45 times 4 看上去很正常 但其实是歪曲的 我想拟合一条倾
  • 如何生成向量的所有组合[重复]

    这个问题在这里已经有答案了 假设我有 3 个绿球 2 个橙球和 8 个黄球 我想订购它们 鉴于所有相同颜色的球都是相同的 如何生成所有可能的序列 在 R 中 使用gregmisc 我可以 balls lt c orange orange g
  • 如何使用 r 中的 caret 包在最佳调整超参数的 10 倍交叉验证中获得每次折叠的预测?

    我试图使用 R 中的插入符包使用 10 倍交叉验证和 3 次重复来运行 SVM 模型 我想使用最佳调整的超参数获得每次折叠的预测结果 我正在使用以下代码 Load packages library mlbench library caret
  • R read_excel:libxls 错误:无法解析文件

    我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
  • 在绘图中的线间隙之间添加注释

    I have a graph like this 而不是在上面的日子symbol 我想知道是否有办法可以在行之间添加此注释 从一个点到另一个点 如果以防万一 这可能是重复的 我深表歉意 This is my expected output
  • R 中的 NA 替换函数

    我正在尝试替换矩阵中的 NA mat 零 我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时 效果很好 但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
  • 如何在 dataTable.js 中转置行和列

    我想在行而不是列中显示我的数据 转置 你可以在这里看到我的例子 var dataSet Tiger Nixon System Architect Edinburgh 5421 2011 04 25 320 800 Garrett Winte
  • 使用 R 的 flextable 包时,有没有办法将传递给 add_header_lines() 的字符串部分加粗

    我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格 但是 我在将表格标题中的部分文本加粗时遇到了一些麻烦 例如 我希望标题为 Table 1 我的表格标题的其余部分 而不是 表 1 我的表格标题的其余部分 I 找到这个
  • 将列表中的列转换为 R 中的数据框

    我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
  • 如何更新条件公式?

    让我直接进入示例 考虑以下等式 frml lt formula y a b x z 使用这样的公式规范 例如和AER ivreg 我想更新这个公式 使其显示为 frml2 lt y a b c x z w 但是 我不确定如何更新条件标志之前
  • 从 R 环境中删除对象

    我正在阅读 Hadley 的 Advanced R 在第 8 章中 他说我们可以使用以下方法从环境中删除对象 rm 但是 移除该物体后我仍然可以看到该物体 这是我的代码 e lt new env e a lt 1 e b lt 2 e a
  • 从 R 中的 HTTPS 连接逐行读取

    当创建连接时open r 它允许逐行读取 这对于批量处理大数据流非常有用 例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
  • 在另一个 Rmd 中运行选定的块

    我已经在源 Rmd 文件中运行了分析 并且希望仅使用few来自源的块 我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
  • 将 sf voronoi 多边形裁剪到边界框时出错

    我正在尝试将 voronoi polygons 使用 sf package 创建 剪辑 到边界框 但它引发了我无法定义的错误 我对 R 的空间世界不太有经验 感谢所有帮助 样本数据 stations lt structure list ST

随机推荐

  • ORM 排序与模型“元”排序 - Django 1.11

    小问题 订购商品的更好方式是什么 1 class Table models Model class Meta ordering user 2 Table objects all order by user 我认为第二个更好 因为第一个总是会
  • iOS - AudioOutputUnitStop 导致应用程序冻结并发出警告

    有时执行 AudioOutputUnitStop inputUnit 导致应用程序冻结约 10 15 秒并显示以下控制台消息 WARNING 0x3b58918c AURemoteIO cpp 1225 Stop AURemoteIO St
  • 如何使用nodeJS连接到隐式FTPS服务器?

    对于一个项目 我必须通过隐式连接连接到 FTPS 服务器 我尝试使用node ftp 因为这似乎是唯一支持隐式连接的库 我使用以下代码进行连接 var ftpC new FTPClient ftpC on ready function co
  • angular2 组件中的多个动画触发器

    我想在一个组件中定义多个动画触发器 这可能吗 例如 一种用于进入场景 另一种用于悬停 或者我是否需要为这种情况定义两个组件 父子组件 项目组件 ts removed the import and class part for better
  • Javascript / REGEX:删除字符串中以特定字母开头的特定文本(单词),单词之间以空格分隔

    我知道这可以通过正则表达式快速完成 我得到的字符串如下 Alpha OmegaS Sheol Gehena GSSaga Serekali 我想删除以 s 开头的单词 所以我应该 Alpha OmegaS Gehena GSSaga 我尝试
  • ThreadStateException:尝试加入线程时线程尚未启动

    就在最近我面试的时候遇到了这样一个问题 methid 计算 执行的输出是什么 public void Calculate var threads Enumerable Range 0 50 Select x gt var thread ne
  • DataGridView 鼠标滚轮滚动停止工作

    我的应用程序中有一个 DataGridView 但无法使用鼠标滚轮滚动它 以前运行得很好 我不确定我做了什么导致了这个问题 因为我最近对代码进行了多次更改后才注意到它 我没有发布任何代码 因为有超过 2k 行 而且我不确定错误可能出在哪里
  • 如何阻止网站注册表中的一次性电子邮件地址? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我想知道可能的阻止方法一次性电子邮件地址 http en wikipedia org wiki Dis
  • 是否可以对包含 url 编码的 url 进行 urlencode?

    我有一个网站 使用 Facebook Twitter 美味分享链接 它们包含您希望共享的网站的 url 编码 url 问题是我想通过 php 重定向页面发送 facebook twitter delicious url 在编码的 url 中
  • 在 VBA 中导入 UTF-8 文件

    我想在表中导入一个管道分隔文件 但该文件采用 UTF 8 格式 具有动态结构 我曾尝试使用 TransfertText 和 FSO 但只有 ADODB Stream 似乎可以很好地处理这种编码 但它只读取全文 如何每行读取这样的文件行以在现
  • 具有抽象方法的接口

    我遇到了一些由同事编写的 PHP 代码 它没有用于任何用途 基本上它是一个包含抽象方法的接口 然后我说这很愚蠢 并展示了坐在我旁边的另一位同事 我们笑了 但随后开始互相询问这是否可能 如果可能的话是否真的有用 显然这是不可能的 参见下面的示
  • module-info.java 不适用于 Java 9 中的 lombok

    我在将项目迁移到Java 9 更新 Java 9 后 我尝试运行项目 但遇到编译器错误 Error 6 1 java package javax annotation is not visible package javax annotat
  • 在 Windows 8 上安装 Docker 卷不起作用

    Context 我想在 Windows 8 上运行 Docker Compose 应用程序 我在 Ubuntu 16 04 下制作了它 它运行得很好 此 Docker Compose 运行 nginx php fpm 这两个容器使用卷 Fi
  • Git 预提交钩子配置

    我正在关注办公室指导 https pre commit com创建钩子并将其添加到预提交检查过程 我需要创建 3 个文件 pre commit config yaml pre commit hooks yaml theCheckFile s
  • ioexception:在java中写入文件时客户端不拥有所需的权限

    我搜索了很多类似的问题 但无法解决我的问题 我试图在文件中写入一些内容 这给了我错误 My code try File f new File file name f createNewFile System out println Hell
  • 无法使用 Sigma.js 显示任何图表

    我想在网络界面上可视化大型网络图 经过几天的搜索 我决定使用 Sigma js 因为它看起来很简单并且兼容 HTML5 问题是我无法显示 Sigma js 网页上的任何图形示例 即使我使用作者在 Sigma js 主页上拥有的最少代码也是如
  • write 和 printf 哪个更快?

    进行以下测试后 for i 0 i lt 3000000 i printf Test string n for i 0 i lt 3000000 i write STDOUT FILENO Test string n strlen Test
  • 如何创建带空格的列名?

    谁能告诉我如何创建带有 全名 这样的空格的列 我已经尝试过类似以下的操作 但它不起作用 CREATE TABLE info Full Names varchar 20 Physical Address varchar 20 Moviesre
  • GCMIntentService 的 onRegistered() 从未调用过

    我正在尝试在 GCM 上注册我的应用程序 但我不知道为什么我的应用程序从未注册 GCMRegistrar register this SENDER ID 被调用 但我的 GCMIntentService 中的 onRegistered 从未
  • R 中的滚动连接 data.table

    我试图更多地了解滚动连接的工作方式 但有些困惑 我希望有人能为我澄清这一点 举一个具体的例子 dt1 lt data table id rep 1 5 10 t 1 50 val1 1 50 key id t dt2 lt data tab