如何使用 dplyr 在 R 中的数据库上动态创建新变量/列？

2023-11-29

我是 Stackoverflow 的新手，也是 R 的新手。我非常感谢您的帮助。

我在用dplyr's mutate()函数基于一个初始列创建一组新列。对于要创建的先验已知数量的列，一切正常。

但是，在我的应用程序中，要创建的新列的数量是未知的（或者在运行代码之前确定为输入参数）。

为了便于说明，请考虑以下最小工作示例：

library(RSQLite)
library(dplyr)
library(dbplyr)
library(DBI)

con <- DBI::dbConnect(RSQLite::SQLite(), path = ":memory:")

copy_to(con, mtcars, "mtcars", temporary = FALSE)

db <- tbl(con, "mtcars") %>%
    select(carb) %>%
    distinct(carb) %>%
    arrange(carb) %>%
    mutate(carb1 = carb + 1) %>%
    mutate(carb2 = carb + 2) %>%
    mutate(carb3 = carb + 3) %>%
    show_query() %>%
    collect()

在此示例中，我创建了三个新变量。但是，我希望程序能够处理动态数量的变量（例如，五个或十个新变量）。我也想在之前完成所有计算collect()，因为我想尽可能晚地将数据复制到内存中。

我的现实生活应用程序的一些背景：我想使用DB2 的函数 ADD_MONTHS()。所以我需要dplyr/dbplyr将该函数直接刷新到 SQL 命令中。因此，我需要一个实际上不使用数据框逻辑的解决方案 - 我需要该解决方案位于dplyr.

从不同的角度来看：在 SAS 中，我会使用宏处理器来动态构建 proc sql 语句。 R 中有等效的吗？

我们可以用map

library(dplyr)
library(purrr)
library(stringr)
map_dfc(1:3, ~ df %>%
                  transmute(!! str_c('x', .x) := x + .x)) %>%
    bind_cols(df, .)
#  x x1 x2 x3
#1 1  2  3  4
#2 2  3  4  5
#3 3  4  5  6

对于数据库，执行以下操作collect添加列之前

dat <- tbl(con, "mtcars") %>%
        select(carb) %>%
        distinct(carb) %>%
        arrange(carb) %>%
        collect()
map_dfc(dat$carb, ~ dat %>%
                      transmute(!! str_c('carb', .x) := carb + .x)) %>%
    bind_cols(dat, .)
# A tibble: 6 x 7
#   carb carb1 carb2 carb3 carb4 carb6 carb8
#  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#1     1     2     3     4     5     7     9
#2     2     3     4     5     6     8    10
#3     3     4     5     6     7     9    11
#4     4     5     6     7     8    10    12
#5     6     7     8     9    10    12    14
#6     8     9    10    11    12    14    16

或者如果我们想之前这样做的话还有另一个选择collecting 是传递一个表达式mutate

tbl(con, "mtcars") %>%
   select(carb) %>%
   distinct(carb) %>%
   arrange(carb) %>%
   mutate(!!! rlang::parse_exprs(str_c('carb', 1:3, sep="+", collapse=";"))) %>%
   rename_at(-1, ~ str_c('carb', 1:3)) %>%
   show_query() %>%
   collect()
#<SQL>
#SELECT `carb`, `carb` + 1.0 AS `carb1`, `carb` + 2.0 AS `carb2`, `carb` + 3.0 AS #`carb3`
#FROM (SELECT *
#FROM (SELECT DISTINCT *
#FROM (SELECT `carb`
#FROM `mtcars`))
#ORDER BY `carb`)
# A tibble: 6 x 4
#   carb carb1 carb2 carb3
#  <dbl> <dbl> <dbl> <dbl>
#1     1     2     3     4
#2     2     3     4     5
#3     3     4     5     6
#4     4     5     6     7
#5     6     7     8     9
#6     8     9    10    11

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

如何使用 dplyr 在 R 中的数据库上动态创建新变量/列？的相关文章

如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
在 R 中向散点图添加线条

如何向图表添加线条我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
从命令行运行 R 代码 (Windows)

我在名为 analysis r 的文件中有一些 R 代码我希望能够从命令行 CMD 运行该文件中的代码而无需通过 R 终端并且我还希望能够传递参数并在我的代码中使用这些参数例如就像下面的伪代码 C gt execute r scri
使用 Shiny 发布平行坐标图表时出现“错误：路径[1]="”：没有这样的文件或目录”

我有一个似乎很常见但我还没有找到解决方案的问题当尝试使用 rCharts Parcoords 发布 Web 应用程序时出现以下错误错误路径 1 没有这样的文件或目录奇怪的是该应用程序在我的笔记本电脑上运行得很好下面是我正在使用
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这
如何在 R 或 Python 中制作旭日图？

到目前为止我一直无法找到一个可以创建旭日图的 R 库约翰斯塔斯科 http www cc gatech edu gvu ii sunburst 有人知道如何在 R 或 Python 中实现这一点吗在极坐标投影中使用 matplotli
如何从 R 中的 txt 文件读取矩阵？

我有一个带有矩阵的txt文件 Matrix txt 重要数字之间没有空格 0100 1001 1100 我想在 R 中将其作为矩阵读取我该怎么做我尝试使用 as matrix read table Matrix txt sep 但失败
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
SPSS 中的标准化残差与 R rstandard(lm()) 不匹配

在寻找 R 相关解决方案时我发现 R 和 SPSS 版本 24 在计算简单线性模型中的标准化残差方面存在一些不一致看来SPSS所谓的标准化残差匹配 R学生化残差我完全不认为某处存在软件错误但显然这两个程序之间存在差异看看这个例子
条件字体颜色 R Markdown

我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
闭包作为数据合并习惯的解决方案

我正在尝试解决闭包问题而且我think我发现了一个案例他们可能会有所帮助我有以下几部分需要处理一组正则表达式旨在清理状态名称位于函数中具有州名称上述函数创建的标准化形式和州 ID 代码的 data frame 用于链接两者
如何修复 R 中 Kaplan Meier 图的风险表计算错误

以下是一个数据帧其中 6 个参与者中的每一个都有唯一的 record ID 我想绘制一个生存分析图其中包含感兴趣事件的复发以及在时间间隔 tstart 到 tstop 内暴露药物剂量数值变量的时间依赖性协变量每个参与者的最大
麦当劳 omega：R 中的警告

我正在计算几种不同尺度的欧米茄并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全当我使用从 alpha 到 omega 内部一致性估计普遍问题的
如何使用 dplyr 独立过滤每列的行

我有以下内容 library tidyverse df lt tibble tribble gene colB colC a 1 2 b 2 3 c 3 4 d 1 1 df gt A tibble 4 x 3 gt gene colB c

随机推荐

我可以找出用户在 WP7 上按下后退按钮时来自哪个页面吗？

我没有太多运气通过谷歌搜索找到答案但是有可能知道用户来自哪个页面吗或者在按下后退按钮时发送一个查询字符串以便我可以知道基本上我不希望用户通过按后退按钮来访问一个页面他们到达该页面的唯一方法是从一开始就遵循该流程我想要做的一个
grails - 在 Heroku 上测试 spring-security-core 安全通道的简单应用程序

因为设置端口在这个问题中没有解决重定向循环问题我创建了一个简单的测试应用程序 grails 2 0 最新的 spring security core 1 2 7 1 因此重定向循环问题很容易重现希望解决以下是步骤 1 创建了名为 te
如何确定是否处于汽车模式（Android）？

实际上是否可以通过意图或其他方式找出设备当前是否处于汽车模式我尝试使用具有全局变量的接收器来执行此操作但是我猜想该变量在经历 onReceive 后不会继续存在那么还有别的办法吗 Thanks 我在谷歌搜索后得到了这个链接配置U
javascript中如何释放闭包的内存？

一个闭包 function test var count 0 return function count 众所周知 count之后不会释放test 被调用现在如果闭包对我来说没有用我怎么能释放它的内存呢 javascript 中的所有对
Spring Boot 带有单页 Angular2 重定向

我有一个带有 Spring Boot 的单页 Angular 应用程序它看起来像下面这样 src main java controller HomeController CustomerController OtherController
如何在 laravel 8 中将 public 文件夹更改为 public_html ？ [复制]

这个问题在这里已经有答案了我想将我的应用程序部署在 Cpanel 上的共享托管上其中主文档根目录有public html但是 Laravel 项目public 您必须按照 2 个步骤将应用程序的公共文件夹更改为 public html
此委托调用在这行代码 (C#) 中执行什么操作？

这是来自 agsXMPP Net 程序集随附的示例我已经阅读了有关代表的内容但不确定它如何适合这行代码等待登录发生然后发送消息我想我正在寻找的是理解为什么delegate 0 以我能理解的简单术语实现了这一点 xmpp OnLog
PHP 在全局命名空间中使用类

我有一个使用 PDO 的数据库包装类并在构造函数中创建一个 PDO 对象包装类位于我们的命名空间中我们正在使用自动加载器问题是在我们的命名空间中找不到 PDO 类因此我尝试使用描述的全局命名空间here Class file na
如何在asp.net mvc中选择一个选择列表项？

我有以下代码但它从未选择我想要的值 List
在线程“main”java.lang.NullPointerException 中获取错误异常

当我在 selenium 中运行以下类文件时浏览器将启动并打开 URL 但之后会出现错误 exception in thread main java lang NullPointerException at guru99project g
-> 仅显示字符串的第一个单词作为值？ [复制]' aria-label=' -> 仅显示字符串的第一个单词作为值？ [复制]'> -> 仅显示字符串的第一个单词作为值？ [复制]

这个问题在这里已经有答案了你能告诉我我做错了什么吗我有一个非常简单的 PHP 代码当我将一些字符串发送到
getPreferenceManager 已弃用

我正在为 Android 制作动态壁纸我的壁纸部分正在工作并正在尝试向其添加设置在 LiveWallpaperSettings 我有这个 Override protected void onCreate Bundle icicle s
MySQL触发器获取导致触发器触发的当前查询

在过去的 4 个小时里我在网上搜索了解决方案但我所能找到的是你不能不可能的不会发生我不喜欢这种做法我的理论是如果它在 information schema processlist 中的某个时刻存储那么就必须有某种方式来获取
Android SimpleCursorAdapter - 添加条件图像

因此我使用 SimpleCursorAdapter 将数据从 SQLite 调整到 ListView 中我们将此数据库称为 testData 我在 testData 中的一列记录 true 或 false 值为 0 或 1 我可以让列表
我们正在实现Agora屏幕共享并收到错误DYNAMIC_USE_STATIC_KEY

我无法理解当前使用演示代码的错误含义我用来共享屏幕的示例代码我还安装了共享屏幕所需的 chrome 扩展 screensharing data AgoraRTC Logger setLogLevel AgoraRTC Logger IN
jQuery 移动多页提交

我正在使用 PhoneGap 和 jQuery Mobile 编写一个移动应用程序为了简化导航我想使用以下方法将单个表单分布在多个页面上div 数据角色页面其想法是为用户提供类似向导的填写大型表单的体验完成后我需要能够在本地
网络推送消息是如何传递的？

我尝试为网页设置推送消息虽然我了解前端部分 Push API 并且有一个工作的本地主机演示应用程序但我只是不明白服务器如何将消息推送到浏览器推送服务中的包如何路由到客户端客户端没有域名通常也没有固定的IP地址那怎么可能呢我读了
无法为 kotlin 和 JpaRepository 中的嵌套列表对象找到适当的构造函数错误

当 JPA 尝试将查询结果映射到结果存储库方法 DTO 时我遇到以下错误 org hibernate hql internal ast QuerySyntaxException Unable to locate appropriate c
Highcharts 多个图例

我创建了一个 Highcharts 图表它有多个 Y 轴和一个 X 轴 Y 轴位于不同的级别 xAxis type datetime yAxis height 230 top 70 height 230 top 394 这样我就有了多个图
如何使用 dplyr 在 R 中的数据库上动态创建新变量/列？

我是 Stackoverflow 的新手也是 R 的新手我非常感谢您的帮助我在用dplyr s mutate 函数基于一个初始列创建一组新列对于要创建的先验已知数量的列一切正常但是在我的应用程序中要创建的新列的数量是未知的

如何使用 dplyr 在 R 中的数据库上动态创建新变量/列？

如何使用 dplyr 在 R 中的数据库上动态创建新变量/列？ 的相关文章

随机推荐

热门标签

如何使用 dplyr 在 R 中的数据库上动态创建新变量/列？的相关文章