有人可以解释一下 mult 在连接中执行更新时如何在 data.table 中工作（使用 .EACHI 和 mult）

2023-12-07

我再次努力理解mult参数在执行连接更新时起作用。我想做的是实现中定义的左连接lj.

出于性能原因，我想更新左表

“不平凡”的部分是，当左表和右表有一个共同的列时（不考虑连接列），我想使用右表中的第一个值来覆盖左表。我想mult会帮助我处理这个多重匹配问题，但我无法正确处理

library(data.table)
X <- data.table(x = c("a", "a", "b", "c", "d"), y = c(0, 1, 1, 2, 2), t = 0:4)
X                 
#        x     y     t
#   <char> <num> <int>
#1:      a     0     0
#2:      a     1     1
#3:      b     1     2
#4:      c     2     3
#5:      d     2     4

Y <- data.table(xx = c("f", "b", "c", "c", "e", "a"), y = c(2, NA, 3, 4, 5, 6), u = 2:7)
Y                 
#       xx     y     u
#   <char> <num> <int>
#1:      f     2     2
#2:      b    NA     3
#3:      c     3     4
#4:      c     4     5
#5:      e     5     6
#6:      a     6     7

# Expected result
#        x     y     t                                                 
#   <char> <num> <int>                                                 
#1:      a     6     0    <= single match on xx == "a" so Y[xx == "a", y] is used                                                
#2:      a     6     1    <= single match on xx == "a" so Y[xx == "a", y] is used                                             
#3:      b    NA     2    <= single match on xx == "b" so Y[xx == "b", y] is used                                             
#4:      c     3     3    <= mult match on xx == "c" so Y[xx == "c", y[1L]] is used                                             
#5:      d     2     4    <= no xx == "d" in Y so nothing changes


copy(X)[Y, y := i.y, by = .EACHI, on = c(x = "xx"), mult = "first"][]
#        x     y     t                                                   
#   <char> <num> <int>                                                   
#1:      a     6     0                                                   
#2:      a     1     1   <= a should always have the same value ie 6                                                
#3:      b    NA     2                                                   
#4:      c     4     3   <= y == 4 is not the first value of y in the Y table                                                
#5:      d     2     4                                                   
    
# Using mult = "all" is the closest I get from the right result
copy(X)[Y, y := i.y, by = .EACHI, on = c(x = "xx"), mult = "all"][]
#        x     y     t                                                 
#   <char> <num> <int>                                                 
#1:      a     6     0                                                 
#2:      a     6     1                                                 
#3:      b    NA     2                                                 
#4:      c     4     3    <= y == 4 is not the first value of y in the Y table                                             
#5:      d     2     4

有人可以向我解释上面有什么问题吗？

我想我可以用Y[X, ...]为了达到我想要的效果，问题是 X 非常大，并且使用时我得到的性能要差得多Y[X, ...]

我想使用右表中的第一个值来覆盖左表中的值

选择第一个值并单独更新它们：

X[unique(Y, by="xx", fromLast=FALSE), on=.(x=xx), y := i.y]

   x  y t
1: a  6 0
2: a  6 1
3: b NA 2
4: c  3 3
5: d  2 4

fromLast=删除重复项时可以选择第一行或最后一行。

如何处理多个匹配：

In x[i, mult=]，如果一行i有多个匹配项，mult确定哪些匹配行x被选中。这解释了 OP 中显示的结果。

In x[i, v := i.v]，如果多行i匹配到同一行x, all相关 i 行的顺序写入 x 行，因此最后一个 i 行获得最终写入。打开详细输出以查看更新中进行了多少次编辑 - 在本例中它将超过 x 行数（因为行被重复编辑）：

options(datatable.verbose=TRUE)
data.table(a=1,b=2)[.(a=1, b=3:4), on=.(a), b := i.b][]
# Assigning to 2 row subset of 1 rows
   a b
1: 1 4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

join

dataTable

leftjoin

有人可以解释一下 mult 在连接中执行更新时如何在 data.table 中工作（使用 .EACHI 和 mult）的相关文章

如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
在 R 中向散点图添加线条

如何向图表添加线条我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
使用 purrr 迭代替换数据帧列中的字符串

我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
选择 R 中的数据表中隐藏时（在绿色加号下方）列的显示顺序

Context 使用 DataTables 库制作交互式表格时当屏幕宽度对于列的数量和宽度来说太窄时列将隐藏在绿色号下我有一个非常宽的表格有 20 多列其中一些内容非常冗长因此某些列在所有屏幕宽度下总是隐藏的每次隐藏新列时
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
在 R 中使用 lapply 绘制多个数据帧

我正在尝试使用 lapply 函数绘制多个数据帧每个数据帧一个图但是尽管有关此主题的所有帖子我都找不到答案因为我不断收到错误图的输出列表为空我的数据结构如下 df1 lt mtcars gt group by cyl gt tal
ggplot2 geom_密度和geom_histogram在一个图中

如何制作一个所有条形加起来为 1 的直方图并在适合的上方添加一个密度层 set seed 1234 df lt data frame sex factor rep c F M each 200 weight round c rnorm 2
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集
如何在 R 中匹配多个 ggplot2 图中的调色板？

自从被问到这个问题以来已经有一段时间了但我知道一个事实我很快就会提取新数据我想弄清楚如何用这种技术来绘制它看起来评论和答案中的人知道如何做到这一点但我无法完全弄清楚所给我的内容还有人想尝试一下吗我正在尝试使用具有多个级别的因子
所有 x 轴标签未以 45 度显示

I m having the code as like below But I m not getting all the x axis labels and it is not displaying in 45 degree when I
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
条件字体颜色 R Markdown

我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
Shiny：动态数据框构建； renderUI、观察、reactiveValues

我认为如何使用 Shiny 的 renderUI 功能动态子集数据的问题经常出现但我很难理解何时使用 renderUI 带有 uiOutput 而不是其他功能包括观察反应反应值甚至条件面板我想构建一个完全交互式的数据框架其中每个
如何修复 R 中 Kaplan Meier 图的风险表计算错误

以下是一个数据帧其中 6 个参与者中的每一个都有唯一的 record ID 我想绘制一个生存分析图其中包含感兴趣事件的复发以及在时间间隔 tstart 到 tstop 内暴露药物剂量数值变量的时间依赖性协变量每个参与者的最大

随机推荐

Javascript：如何避免在函数中添加新属性？

我是一个JS新手正在看书JavaScript 模式为了理解我可以看到的代码片段之一 var myFunc function param myFunc cache 这表明函数体之外的任何人都可以添加新属性这不会破坏封装吗如果程序的其他
Delphi Firemonkey 跨平台 - 传递 Windows 句柄的通用方法

我正沉浸在我的第二个适用于 Windows 和 OSX 的 Firemonkey 应用程序中并慢慢地转换我的函数库以处理跨平台问题我正在尝试创建一个通用的 SelectDirectory 函数它将运行 Windows 或 OSX 平台
如何告诉数据注释验证器也验证复杂的子属性？

我可以在验证父对象时自动验证复杂的子对象并将结果包含在填充的结果中吗ICollection
斯特林格的行为令人费解？

Go 新手请耐心等待我一直在浏览 Tour of Go 页面无意中发现了一些关于 Stringers 的令人费解的事情考虑以下练习 https tour golang org methods 18 我最初的答案是实施 func th
使用 React 更新 HTML5 视频上的源 URL

我想更新 HTML5 视频元素中的源标签以便当我单击按钮时正在播放的任何内容都会切换到新视频我有一个 Clip 组件它返回一个 HTML5 视频元素并通过 props 提供源 URL function Clip props ret
使用jquery在密码字段中进行密码屏蔽

如何在 Android 手机中进行密码屏蔽例如当我们输入一个键时它会显示一个键几秒钟并将其更改为我尝试了中提到的插件使用js在手机中进行密码屏蔽这不是最佳的还有 jsfiddlehttp jsfiddle net medopal X
如何使用 RSpec 测试 STDIN

好的需要帮助进行测试我想测试这个类是否收到字母 O 并且当调用 move computer 方法时会返回用户在 cli 上输入的内容我的心理子处理器告诉我这是一个简单的分配变量来保存 STDIN 上的随机人类输入只是现在不明白
SQL Server 2012 中具有列和行总计的动态数据透视表

我有表 RPT DailySalesSummary 其中包含 CalDate OrderID SalesAmount LocRecID 列 CalDate OrderID SalesAmount LocRecID 2016 12 01 R1
在视图控制器segue之间传递数据[重复]

这个问题在这里已经有答案了我的第一个视图控制器 AllAthletes 是我所有核心数据实体的 uitableview 它在字幕样式表格单元格中显示实体运动员及其属性例如名字等当您单击视图单元格时我希望此视图控制器传递所选实体的
使整个应用程序可以访问数据（可能在运行时发生变化）的最佳方法是什么？

在整个应用程序中访问数据的最佳方式是什么在我的具体示例中我将应用程序的设置从 XML 文件加载到 Settings Object 的实例中并且我不想将这些设置为绝对常量因为用户应该能够更改这些设置并查看效果无需重新启动程序现在
如何在 Javascript 中检索基数 trie 中的所有数据/单词

我已经能够用 JavaScript 编写一个基数树示例未优化所以不要评判到目前为止我已经能够Add Transverse and Find nodes 我在编写一个可以的函数时遇到问题retrieve所有节点这是我需要帮助的地方预
Appcelerator 找不到方法 android.app.Activity.checkSelfPermission

我似乎无法在 Android 上使用地理位置只是出现以下错误 INFO dalvikvm Could not find method android app Activity checkSelfPermission referenced
Eval() 如果为 null，则显示自定义值

td td
Mongoose 预保存钩子正在触发，但不保存附加字段（不使用 model.update）

我正在尝试在我的架构中实现一个计数器来获取下一个问题编号我已将其实现为 Mongoose 中的钩子预保存钩子一切看起来都很好除了实际的数字字段没有更新我可以很容易地通过控制台记录的内容判断钩子正在触发甚至该字段似乎已被分配但
如何在 Visual Studio 2022 中使用日期/时间更改 AssemblyInfo.cs AssemblyVersion 并每天将修订版本递增 1

经过挖掘和搜寻我发现AssemblyVersion只接受System Int16这意味着它不能超过 65 535 值我需要的输出 DLL 程序集版本样式 YYYY M D HHMMSS 2022 02 20 060920 实际上第二部分
JFreeChart：缩放图表时添加并同步滚动条（Eclipse 插件/SWT）

我正在使用 JFreeChart 库在 Eclipse 视图中绘制某些内容目前我的视图初始化代码如下所示 Override public void createPartControl Composite parent JFreeChart
字符串中分隔的空格分隔的单词[重复]

这个问题在这里已经有答案了我有一个以下格式的文本字符串 str word1 word2 word3 word4 所以我想将每个单词从字符串中分离出来两个单词之间用空格分隔我怎么做有没有内置函数可以做到这一点最简单的是使用explo
filedialog、tkinter 和打开文件

我第一次使用 Python3 为程序编写浏览按钮我一直在搜索互联网和这个网站甚至 python 标准库我找到了示例代码和非常肤浅的解释但我找不到任何可以直接解决我遇到的问题的内容也找不到足够好的解释以便我可以根据自己的需要自定义
扩展后删除不需要的字符

我有一些页面是通过从 cgi 串起的查询来调用的 xyz cgi page abc html 我遇到的问题是我收到了对确实存在的页面的机器人请求但该请求在 html结果是 404 有办法进去吗 htaccess剥离之后的一切 html扩
有人可以解释一下 mult 在连接中执行更新时如何在 data.table 中工作（使用 .EACHI 和 mult）

我再次努力理解mult参数在执行连接更新时起作用我想做的是实现中定义的左连接lj 出于性能原因我想更新左表不平凡的部分是当左表和右表有一个共同的列时不考虑连接列我想使用右表中的第一个值来覆盖左表我想mult会帮助我处理这个多

有人可以解释一下 mult 在连接中执行更新时如何在 data.table 中工作（使用 .EACHI 和 mult）

有人可以解释一下 mult 在连接中执行更新时如何在 data.table 中工作（使用 .EACHI 和 mult） 的相关文章

随机推荐

热门标签

有人可以解释一下 mult 在连接中执行更新时如何在 data.table 中工作（使用 .EACHI 和 mult）的相关文章