在 data.table 中多次使用 :=

2024-02-18

我经常发现自己使用以下方法进行一长串链式计算:=在同一个数据表上。例如,像这样的东西

test = data.table(1:10, 1:10, 1:10, 1:10)

test[, V1 := V1^2]
test[, V2 := V1*V2]
test[, V3 := V2/V3]
test[, V4 := sqrt(V3)]
test[, new := letters[V4]]

不得不写test[, ...]每行1)需要更长的时间来输入(这不是一个大问题,我可以应对)。但更重要的是,它也会在视觉上分散人们对计算流程和内容的注意力。我更愿意写一些类似的东西

test[, {
  V1 := V1^2
  V2 := V1*V2
  V3 := V2/V3
  V4 := sqrt(V3)
  new := letters[V4]
}]

但这会引发一个错误You have wrapped := with {} which is ok but then := must be the only thing inside {}.

我知道我可以写

within(test, {
  V1 = V1^2
  V2 = V1*V2
  V3 = V2/V3
  V4 = sqrt(V3)
  new = letters[V4]
  })

但这就损失了使用效率:=

我尝试编写一个函数来提供这种能力

with.dt = function(dt, expressions){
  e = strsplit(expressions,'\n')
  for (i in 1:length(e)){    
    dt[, eval(parse(text = e[i]))]
  }
  dt
  }

with.dt(test, "
  V1 := V1^2;
  V2 := V1*V2;
  V3 := V2/V3;
  V4 := sqrt(V3);
  new := letters[V4];
  ")

但这并不会改变data.table的内容

是否有任何语法可以使外观整洁within版本,同时保留按引用分配属性:=?


有几种不同的方法可以做到这一点。

这里使用的原始测试矩阵:

   v1 v2
1:  1  3
2:  2  4

首先,我们可以这样做:

test[,`:=`(v1 = v1^2,
          v2 = v1*v2)

Output:

v1 v2
 1  3
 4  8

或者,如果我们希望按顺序完成,我们可以使用 Frank 的 hack。

test[, `:=`(v1 = v1 <- v1^2, v2 = v2 * v1)]

Output:

v1 v2
 1  3
 4 16  

或者,类似地我们可以运行这个:

test[,c("v1","v2") := list(v1^2,v1^2*v2)]

Output:

v1 v2
 1  3
 4 16
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 data.table 中多次使用 := 的相关文章

  • 将密度曲线拟合到 R 中的直方图

    R中有没有可以将曲线拟合到直方图的函数 假设您有以下直方图 hist c rep 65 times 5 rep 25 times 5 rep 35 times 10 rep 45 times 4 看上去很正常 但其实是歪曲的 我想拟合一条倾
  • 如果“testthat”测试在“R”中失败,则打印自定义诊断信息

    I use a testthat单元测试来检查是否data frame函数返回的结果与我期望它返回的结果相同 如果测试失败 testthat打印一些诊断信息 例如 MyFunction df orig is not identical to
  • R read_excel:libxls 错误:无法解析文件

    我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
  • 使用 ggplot2 修改点子集的形状

    我正在尝试绘制一个沿大量维度变化的大型散点图 这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集 我只是
  • 将 JSON URL 转换为 R 数据帧

    我在将 JSON 文件 从 API 转换为 R 中的数据帧时遇到问题 例如 URL 我尝试了 S O 的一些不同建议 包括将json数据转换为R中的数据框 https stackoverflow com questions 28683769
  • 使用底格里斯河从纬度/经度获取人口普查区

    我有相对较多的坐标 我想获取其人口普查区 除了 FIPS 代码 我知道我可以使用以下命令查找各个纬度 经度对call geolocator latlon 已完成here https stackoverflow com questions 5
  • 限制数据框中所有单元格的字符串长度?

    您好 有没有一种方法可以限制 data frame 中所有列的字符串文本大小 而不必循环遍历每一列并一次使用 str trunc 之类的东西 例如下面的数据框 我可以将所有文本大小限制为仅 5 个字符 而不必一次只执行一列吗 如果有 50
  • 如何获得属于五分位数的x?

    我正在大学学习使用 R 进行计量经济学项目 所以请原谅我的笨拙 基本上 使用并给出 一个矩阵 股票价格 行 天 列 公司股票价格 另一个矩阵 市值 行 天 列 公司市值 我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格 然后
  • 在 R 中绘制对数正态概率密度

    我正在尝试在 R 中生成对数正态概率密度图 其中包含 3 个不同的均值对数和标准差对数 我尝试了以下方法 但我的图表太丑了 看起来一点也不好看 x lt seq 0 10 length 100 a lt dlnorm x meanlog 0
  • R.matlab/readMat:readTag(this) 中出错

    我正在尝试使用 R matlab 将 matlab 文件读入 R 但遇到此错误 require R matlab r lt readMat file mat verbose T Trying to read MAT v5 file stre
  • 当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时,如何将文本文件读入 R

    如何读取文本文件 其中每条记录都是一个段落 每个换行符表示单独的字段 复杂的是 有些记录有 4 行 有些记录有 6 行 当字段数量的差异为 1 时 DWin 解决了我的问题 但当字段数量差异为 2 时 一切都崩溃了 你可以有一个在这里看看他
  • 从 R 中的 HTTPS 连接逐行读取

    当创建连接时open r 它允许逐行读取 这对于批量处理大数据流非常有用 例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
  • R 编程:如何计算数据框中两个单元格之间的差异并将它们保存在新列中

    尝试学习 R 并陷入自相关示例中 我想将 x 的差异与 y 的差异进行回归 我在数据框中有 x 和 y 并且希望将 x2 x1 的差值保存在新列 例如 dx 中 我不知道该怎么做 我拥有的 data1 x y 5 3 8 9 3 1 1 5
  • 将 sf voronoi 多边形裁剪到边界框时出错

    我正在尝试将 voronoi polygons 使用 sf package 创建 剪辑 到边界框 但它引发了我无法定义的错误 我对 R 的空间世界不太有经验 感谢所有帮助 样本数据 stations lt structure list ST
  • 逻辑回归/二项式的 glmnet 误差

    当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时 出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
  • 为什么这些数字不相等?

    下面的代码显然是错误的 有什么问题 i lt 0 1 i lt i 0 05 i 1 0 15 if i 0 15 cat i equals 0 15 else cat i does not equal 0 15 i does not eq
  • ggplot散点图中的图例问题

    我想使用 ggplot 创建显示方法比较数据的散点图 绘图应包含原始数据 理想线和带误差的拟合线 图例应显示理想线和拟合线的线型 线宽 线颜色 我可以获得大部分我想要的东西 但是图例存在以下问题 图例显示每种线型有 2 条线 为什么 如何解
  • 使用 dplyr::filter 的整洁方式是什么?

    使用下面的函数调用foo c b 输出以内联方式显示 正确的写作方式是什么df gt filter x gt x 我已经包含了一个使用的示例mutate以整洁的风格与之对比filter foo lt function variables x
  • 16 位以上整数的计算

    我有两个大整数 两者都超过 16 位 确切地说是 20 位 而且我知道由于双精度浮点运算 我在使用这些数字进行计算甚至将它们存储在变量中 独立于编程语言 时受到限制 不过 我想也许gmp图书馆应该处理它们 但不幸的是它没有 可以计算更大的整
  • GGPLOT2:如何在 ggplot() 脚本中绘制特定选择

    这是一个名为的大型数据集的峰值P 其中有 10 个优惠 CS 有不同的商店 SHP 具有多个数值 数据集列出了按周排序的它们 WK 2 tm 52 它创建一个大文件 仅前 6 行出现峰值 WK MND CS SHP RevCY RevLY

随机推荐

  • 当实际身份验证在 ZUUL 网关中完成时,访问微服务中的 Spring Security 主体

    在我们的项目中JWT token验证及其他authorization相关逻辑在ZUUL网关中完成 如果zuul成功验证令牌后 它将继续向相应的微服务发送请求 在这种情况下 我该如何发送Principal到其他微服务 当JWT authori
  • 两个不同商店上的嵌套游标

    我有以下代码 Transaction xodusTransaction xodusEnvironment beginReadonlyTransaction Store leftStore xodusEnvironment openStore
  • WHERE IN (SELECT NonExistingColumnName) 导致意外行为

    我最近遇到一种情况 我需要从表中删除一些行并拼写错误的列名 没有抛出任何错误 并且所有行都已从表中删除 这是重现该问题的脚本 有一个 Order 表 其中包含四个带有 OrderID 的订单 有一个包含一个 ItemID 的 LIST TO
  • 在Configure()之后启动IHostedService

    我有一个 NET Core 3 1 应用程序 它提供一个描述应用程序运行状况的端点 以及一个处理数据库中数据的 IHostedService 但有一个问题 HostedService 的工作函数开始处理很长时间 结果Configure 未调
  • WPF ListView 绑定到列标题

    我正在尝试创建一个动态绑定到一组日期的列表视图 因此 用户将能够选择一个日期范围 所选日期的结果将与列标题中的日期一起显示 我已经解决了所有问题 只有一个问题 日期没有显示在标题中 我有以下内容 我看不出它不起作用的任何原因 public
  • 如何在yii2中过滤日期字段

    我想过滤日期列 例如 3 个月前 6 个月前 1 年前 我在 gridview 的搜索字段中创建了一个下拉菜单 如下所示 attribute gt modified value gt name filter gt array ID1 gt
  • 通过 pip 安装 mysqlclient 时遇到问题

    我正在开发一个 Django 1 9 2 项目 需要连接到 MySQl 数据库 并且我正在尝试使用推荐的 mysqlclient 库 但是 当我尝试通过安装pip install mysqlclient我收到以下错误 Complete ou
  • 最佳圆拟合算法

    I need a very precise algorithm for fitting a circle to the set of data points actually I need to determine the center T
  • 使用 XML 代替 HTML 创建网页有哪些优点?

    有时 我会看到内容仅用 XML 而不是 HTML 或 XHTML 编写的网页 这些页面通常附加一些样式表 XSLT 或 CSS 这使得它们看起来像任何其他普通网页 我的问题是 这种方法有什么优点 如果有的话 为什么有人会选择这种方式 EDI
  • 如何使用 mysqldump 保存 UTF8mb4 数据?

    我正在使用 mysqldump 转储包含带有 UTF8MB4 数据的 UTF8MB4 列的数据库 当我导入这个 sql文件导入到支持 UTF8MB4 的新数据库中 所有 UTF8MB4 字符都会转换为 有人知道如何使 MySQL 和导入与
  • 如何使用 ffmpeg 从 YUV 视频中提取帧(或特定帧)

    这是从a中提取帧的代码MP4视频 ffmpeg i above marathon 250 mp4 images 03d bmp但相同的代码不适用于YUV格式化视频 有谁知道如何从中提取帧YUV格式化视频 它不起作用 因为 yuv 文件没有标
  • SVG矢量图形可以转换为PNG文件格式以便在Fireworks中使用吗?

    众所周知 有很多网站出售免版税图形 有些网站出售矢量图形 svg 或为您提供下载矢量图形的选项 我没有支持 SVG 的图形编辑器 目前 我正在使用旧版本的 Fireworks 我无法打开 SVG 文件类型 我也买不起 PhotoShop 或
  • 使用 WebClient 和 WebRequest 之间的编码差异?

    在获取一些随机的西班牙报纸索引时 我没有使用 WebRequest 正确获取变音符号 它们产生了这个奇怪的字符 同时使用 a 从同一个 uri 下载响应WebClient我得到了适当的回应 为什么会出现这种差异化呢 var client n
  • 通过调整浏览器大小来缩放 KineticJS Stage?

    最近发现了 KineticJS 因为我一直在尝试将我的 Flash 技能转换为 HTML Canvas 这是一个非常令人印象深刻的工具 问题 如果我使用像 Bootstrap 这样的前端 并且我有一个页面 其中包含几个包含 KineticJ
  • 在排序函数中处理 nils

    我不知道如何处理nils我的排序函数得到了 当我检查这个时 table sort一些电话后崩溃 if a nil then return false elseif b nil then return true end 出现此错误 用于排序的
  • SailsJS 中的 API 版本控制

    基于这个问题 我已经禁用了嵌套控制器和蓝图 我的问题是这样的 API 控制器 v1 UserController js 路线 js POST v1 user register v1 UserController createUser 策略
  • 在 Javascript for 循环声明中声明 var

    我确定我已经阅读过有关此问题的讨论 但找不到 简而言之 在循环声明内声明 for 循环的增量是否有缺点 这有什么区别 function foo for var i 0 i lt 7 i code 和这个 function foo var i
  • 如何模拟图像上传到Google App Engine Blobstore

    我正在使用 create upload url 将图像上传到 GAE blobstore uploadURL blobstore create upload url upload 为了对gae代码进行单元测试 您可以模拟图像上传吗 或者我应
  • Ehcache 与静态地图缓存实现

    我有几个表 其中的条目很少 并且它们永远不会动态更改 所以我想将整个表缓存在内存中以减少数据库的负载 我可以通过静态地图并将地图填充到静态块中轻松实现这一点 我想知道 Ehcache hibernate 是否可以以更有效的方式实现同 样的功
  • 在 data.table 中多次使用 :=

    我经常发现自己使用以下方法进行一长串链式计算 在同一个数据表上 例如 像这样的东西 test data table 1 10 1 10 1 10 1 10 test V1 V1 2 test V2 V1 V2 test V3 V2 V3 t