在 R 中的 data.table 中执行 := by group 时如何更改目标列的类型？

2024-01-13

我正在尝试对“整数”类型的现有列执行 := by group 操作，其中新值的类型为“double”，但失败了。

我的场景是根据其他列中的值将表示时间的列转变为 POSIXct。我可以修改 data.table 的创建作为解决方法，但我仍然对如何实际更改列的类型感兴趣，正如错误消息中所建议的那样。

这是我的问题的一个简单的玩具示例：

db = data.table(id=rep(1:2, each=5), x=1:10, y=runif(10))
db
id  x          y
 1:  1  1 0.47154470
 2:  1  2 0.03325867
 3:  1  3 0.56784494
 4:  1  4 0.47936031
 5:  1  5 0.96318208
 6:  2  6 0.83257416
 7:  2  7 0.10659533
 8:  2  8 0.23103810
 9:  2  9 0.02900567
10:  2 10 0.38346531

db[, x:=mean(y), by=id]   

Error in `[.data.table`(db, , `:=`(x, mean(y)), by = id) : 
Type of RHS ('double') must match LHS ('integer'). To check and coerce would impact performance too much for the fastest cases. Either change the type of the target column, or coerce the RHS of := yourself (e.g. by using 1L instead of 1)

我们可以在将“mean(y)”分配给“x”之前将“x”列的类别转换为“数字”，因为“x”的类别是“整数”。如果我们将 'x' 替换为mean任何其他数值变量（包括“x”）。

db[, x:= as.numeric(x)][, x:= mean(y), by=id][]

或者分配到一个新列，然后更改列名称

setnames(db[, x1:= mean(y),by=id][,x:=NULL],'x1', 'x')

或者我们可以将“x”分配给“NULL”，然后创建“x”作为mean'y'（@David Arenburg 的建议）

db[, x:=NULL][, x:= mean(y), by= id][]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

types

dataTable

在 R 中的 data.table 中执行 := by group 时如何更改目标列的类型？的相关文章

分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
在 mac (iMac OSX ) 终端中远程运行脚本（r 脚本）到其他计算机

我有一个小示例脚本 script p r 如下所示打算在终端中运行 usr bin Rscript sink output capture txt mn lt mean 1 10 and so on much longer list of
如何定义与更高类型类型（类型构造函数）绑定的上下文

我尝试过以下方法 def test Option T Ordering value1 Option T value2 Option T val e implicitly Ordering Option T compare value1 va
Haskell 中的多态函数作为参数

我有一个带有两个构造函数的 ADT 一个包裹着一个Double和一个包裹着Integer 我想创建一个函数它采用一元函数Numtypeclass 并返回一个函数该函数将该一元函数应用于我的 ADT 的内容我试过这个 data X Y
如何使用 R 中带引号的字符值内的序列读取 CSV？

这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来并且有一个顺序在值之一内转义引号加分隔符我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
C# 优化：向数据库插入 2 亿行

我有以下简化的代码我想优化速度 long inputLen 50000000 50 million DataTable dataTable new DataTable DataRow dataRow object objectRow
F# 查询，按单列对多个值进行分组

我有一个 F sql 查询需要对每组中的两列求和 let financials query for data in dbData do groupValBy data earning data losses data store into
ggplot 中的错误问题：“grid.Call(”L_textBounds“, as.graphicsAnnot(x$label), x$x, x$y, … 中的错误”[重复]

这个问题在这里已经有答案了我试图在 ggplot 中制作一个条形图其中我通过强制其中一些标签为长度为零的字符串即来指定要显示的标签但是我收到错误 Error in grid Call L textBounds as graphi
如何更新条件公式？

让我直接进入示例考虑以下等式 frml lt formula y a b x z 使用这样的公式规范例如和AER ivreg 我想更新这个公式使其显示为 frml2 lt y a b c x z w 但是我不确定如何更新条件标志之前
R 中的发散积分可在 Wolfram 中求解

我知道我以前问过同样的问题但由于我是新来的这个问题问得不好而且不可重现因此我在这里尝试做得更好如果我只编辑旧的可能没有人会读它我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
R：将 readRDS 应用于 .Rds 文件名的列表对象

我有几个包含数据帧对象的 Rds 文件我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中但是当我尝试从文件名列表中读取多个 Rds 文件时我收到错误 FUN X i 中的错误从连接读取时出错 readRDS 不适用于列表吗 R
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
R 编程：如何计算数据框中两个单元格之间的差异并将它们保存在新列中

尝试学习 R 并陷入自相关示例中我想将 x 的差异与 y 的差异进行回归我在数据框中有 x 和 y 并且希望将 x2 x1 的差值保存在新列例如 dx 中我不知道该怎么做我拥有的 data1 x y 5 3 8 9 3 1 1 5
到底什么是单例类型？

什么是单例类型有什么应用和影响我们非常欢迎示例更欢迎外行术语如果将类型视为一组值则值的单例类型x是仅包含该值的类型 x 用法示例模式匹配 case Foo type检查匹配的对象是否与Foo using eq where cas
MySQL/PDO::quote() 尽管使用 PDO::PARAM_INT 参数，但仍在整数周围加上引号

无论我传递给什么值数据类型对它都会出现 pdo gt quote value type 它总是将其引用为字符串 echo pdo gt quote foo PDO PARAM STR foo as expected echo pdo g
fread 将空导入为 NA

我正在尝试导入带有空白的 csv 读取为不幸的是他们都读作 NA now 为了更好地演示问题我还展示了如何NA NA and 都映射到同一事物除了最底部的示例这将妨碍简单的解决方法dt is na dt lt gt write cs
为什么这些数字不相等？

下面的代码显然是错误的有什么问题 i lt 0 1 i lt i 0 05 i 1 0 15 if i 0 15 cat i equals 0 15 else cat i does not equal 0 15 i does not eq
有没有一种简单的方法来判断存储在一个列表中的许多数据帧是否包含相同的列？

我有一个包含许多数据框的列表 df1 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df2 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df3 lt data frame

随机推荐

如何使用 keycloak 和 spring 读取所有用户？

我在用着keycloak 3 4 and spring boot开发一个网络应用程序我使用 Active Directory 作为用户联合来检索所有用户信息但要在我的网络应用程序中使用这些信息我想我必须将它们保存在 local web
多级页表——分层分页

过去操作系统期末考试的示例问题我如何计算此类问题计算机有 64 位虚拟地址空间和 2048 字节页面一个页表项占用 4 个字节使用多级页表是因为每个表必须包含在一个页内需要多少级我该如何计算这个由于页表必须适合一个页面因此页
更改分割线突出显示/调整线条大小

我注意到当我在 Visual Studio 中调整元素大小时分割线会被涂成纯透明的黑色如下所示然而在我自己的 Winforms 应用程序中我得到了以下调整大小行我想知道如何改变这条调整线的绘画如果你看一下分离器源代码 htt
Firebase 身份验证 FirebaseNetworkException：发生网络错误（例如超时、连接中断或无法访问主机）

我正在为我的 Android 应用程序创建身份验证工作流程我允许用户使用用户名密码和各种 OAuth 提供商登录我正在验证电子邮件和密码以便我知道传递给 Firebase 的信息是有效的我在用着com google firebas
获取 boto.cfg 中的 Python 凭据文件

我是第一次使用 AWS 刚刚安装了 python 的 boto 我陷入了它建议的步骤您可以将此文件放置在 etc boto cfg 中供系统范围使用也可以放置在执行命令的用户的主目录中 boto 老实说我不知道该怎么办首先我找不到
使用 newID() 创建函数

我不断收到此错误有什么想法吗在函数内的 newid 中无效使用副作用或时间相关运算符我正在与MS SQL Server 2005 这里是T SQL陈述 Create Function dbo GetNewNumber RETURNS
触发多事件

我可以在trigger 中触发多个事件或在JQuery 中链接它们吗例如 element trigger event1 event2 event3 or element trigger event1 trigger event2 or e
=~ 在 Perl 中做什么？

我猜标签是一个变量它正在检查9eaf 但这在 Perl 中存在吗这里的符号是做什么的前后的字符是什么9eaf doing if tag 9eaf Do something 是测试正则表达式匹配的运算符表达方式 9eaf 是一个正
什么都没有，WithEvents 字段和内存泄漏

是否需要设置为Nothing 在 Dispose 中所有WithEvents fields 显然Handles关键字将处理程序添加到此类字段但不会将其删除直到该字段不再存在为止 Nothing 这会产生内存泄漏这对于像这样的情况应该
fork() 后处理子进程中 std::thread 终止的正确方法

你想皱多少皱眉就皱多少无论如何我都会这么做我的问题是在下面的代码中处理终止的正确方法是什么std thread在生成的子进程中fork std thread detach or std thread join include
如何在 Rails 1.2.3 中使复选框默认为“选中”？

如何使复选框在最初显示时默认为选中我还没有找到一种 Rails 方法来做到这一点有效所以我用 JavaScript 做到了 Rails 有没有正确的方法来做到这一点我正在使用 Rails 1 2 3 导轨 3 x form for
在 Android 上刷新地图活动中的覆盖对象

我必须构建一个地图活动最重要的是我需要显示一些位置点这些位置是从另一个类的哈希表中检索的该哈希表的内容始终会发生变化因此我希望看到地图活动上的这些位置点随着哈希表的修改而移动代码如下所示 Override public voi
动态数据表到实体*无需*提前进行硬编码...？

问题问为什么不能如何动态使用 DataTable 中的数据在使用反射的函数中创建 LINQ EF 以根据可用内容创建实体实例我看到了很多很多的问题和关于硬编码但没有人这样做动态地我正在寻找一种替代方法不必为我的所有实体维护硬
Angular 2+：IE11 严格模式下不允许对属性进行多重定义

我安装了 pollyfills 但在 main bundle js 中的 Internet Explorer 11 中收到此错误它位于第 9692 行但是查看编译后的代码我无法理解它这里是 styles nng select cus
计算每个组的 data.table 窗口中的值数量

我正在尝试添加新列data table 其中行中的值取决于行中值的相对关系更准确地说如果一行中有一个值 X 我想知道同一列和组中有多少个其他值在 X 30 范围内也就是说考虑到 DT lt data table X c 1 2
在 PyQt 中播放声音文件

我在 PyQt 中开发了一个播放声音的软件我使用 Phonon Library 来播放声音但它有一些滞后那么如何在不使用 Phonon Library 的情况下在 PyQt 中播放声音文件这就是我目前使用 Phonon 的方式 de
尝试使用 Powershell 从 csv 导入信息，但不幸的是某些结果出现错误

AuditSuccess Import Csv Path G LabLog csv Where Object Keywords like Audit Success Measure Object Select Object count Au
Node.js 和使用 Q 进行异步编程

以下是正确的处理方式吗这是一个注册控制器操作我正在创建一个用户和一个组以将用户添加到其中请注意我有称为用户和组的方法级别变量其余代码使用 Q 模块进行异步是否可以使用方法级别变量或者它们会被同时注册的其他人覆盖吗 export
setup.py 不遵守 PIP_INDEX_URL

我正在运行本地pypi服务器 https pypi python org pypi pypiserver 我可以通过使用以下命令指定它来从该服务器安装软件包 i的选项pip命令或通过设置PIP INDEX URL环境变量当我安装具有先决条
在 R 中的 data.table 中执行 := by group 时如何更改目标列的类型？

我正在尝试对整数类型的现有列执行 by group 操作其中新值的类型为 double 但失败了我的场景是根据其他列中的值将表示时间的列转变为 POSIXct 我可以修改 data table 的创建作为解决方法但我仍然对如何实际

在 R 中的 data.table 中执行 := by group 时如何更改目标列的类型？

在 R 中的 data.table 中执行 := by group 时如何更改目标列的类型？ 的相关文章

随机推荐

热门标签

在 R 中的 data.table 中执行 := by group 时如何更改目标列的类型？的相关文章