使用 for 循环对多列进行 mutate 来重新编码值

2023-12-30

我需要根据另一个表对数据帧的多列上的值进行重新编码。

我必须使用侧表重新编码数据表的多个列的值。这些值对应于我必须用地名替换的地理标识符。所以我决定做一个循环，但是循环之外有效的方法不再有效。我无法在 for 循环中使用 mutate 。

我的真实数据包含 274 列，其中 38 列需要重新编码。该列有许多不同的名称（它们不是调用位置”）

我的主要数据集：

 id <- c(1, 2, 3)
 departure <- c(1, 2, NA)
 arrival <- c(3, 1, 2)
 transit <- c(NA,NA,1)
dataset <- data.frame(id, departure, arrival, transit)

另一张表：

geo_id <- c(1, 2, 3)
place_name <- c("Paris", "Nantes", "London")
geocode <- data.frame(geo_id, place_name)

我的循环：

var <- c("departure", "arrival", "transit") #the columns that should by recode (must be a vector with my  real data)

for (i in var) {
  print(i)
  dataset <- dataset %>% 
  mutate(i = geocode$place_name[match(i, geocode$geo_id)])

}

mutate 创建一个新的列调用i！如何避免这种情况？

With dplyr，你可以做：

dataset %>%
 mutate_at(vars(one_of(var)), ~ geocode$place_name[match(., geocode$geo_id)])

  id place1 place2 place3
1  1  Paris London   <NA>
2  2 Nantes  Paris   <NA>
3  3   <NA> Nantes  Paris

或者添加tidyr:

dataset %>%
 pivot_longer(one_of(var)) %>%
 left_join(geocode, by = c("value" = "geo_id")) %>%
 select(-value) %>%
 pivot_wider(names_from = name, values_from = place_name)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

tidyverse

使用 for 循环对多列进行 mutate 来重新编码值的相关文章

从 R 中的向量中选择所有可能的元组

我正在尝试用 R 编写一个程序当给定一个向量时将返回所有可能的tuples http en wikipedia org wiki Tuples该向量中的元素例如元组 c a b c c a b c 出租车 c a c c b c c
返回数据帧 R 中的下一行

我有一个看起来像这样的数据框 kind datetime book 2016 04 23 04 23 00 pen 2016 04 23 04 30 00 toy 2016 04 23 06 45 00 我想为数据集中的每一行返回下一行的日
R 中具有稳健回归的异常值

我正在使用lmrobR 中的函数使用robustbase用于稳健回归的库我会把它用作 rob reg lt lmrob y 0 dat method MM control a1 当我想返回我使用的摘要时summary rob reg 稳健
如何在for循环中引用变量？

我正在循环访问不同的 data tables 和 data table 中的变量但我在引用内部变量时遇到问题for loop dt1 lt data table a1 c 1 2 3 a2 c 4 5 2 dt2 lt data tabl
删除ggplot2中的负图区域[重复]

这个问题在这里已经有答案了如何删除 ggplot2 中 x 轴和 y 轴下方的绘图区域请参见下面的示例我尝试了几个主题元素 panel border panel margin plot margin 但没有任何运气 p lt ggpl
R - Plm 和 lm - 固定效应

我有一个平衡面板数据集 df 本质上由三个变量组成 A B and Y 对于一堆独特识别的区域来说它会随着时间的推移而变化我想运行一个回归其中包括区域下面等式中的区域和时间年份固定效应如果我没记错的话我可以通过不同的方式来
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
尝试读取 CSV 文件时出现“无法识别的字符串转义”

我正在尝试导入一个 csv文件以便我可以观看此视频 R ggplot2 图形直方图 http www youtube com watch v 47kWynt3b6M 我安装了所有正确的软件包包括ggplot以及相关的包视频中的第一个说
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
pyomo + 网状错误 6 句柄无效

我正在尝试运行pyomo优化我收到错误消息 Error 6 The handle is invalid 不知道如何解释它环顾四周似乎与特权有关但我不太明白在下面找到完整的错误跟踪以及重现它的玩具示例完整的错误跟踪 py run f
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
在 R 格子包中微调点图

我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域我有三个变量方案指定所使用的算法数据集是正在测试算法的数据集以及 Area under ROC 我正在 R 中使用lattice库命令如下点图方案 Area und
使用 R 选择第一个非 NA 值

df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量它是每个单独 ID 测试的第一个非 NA 值对于只有NA的个体
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
使用 Shiny 发布平行坐标图表时出现“错误：路径[1]="”：没有这样的文件或目录”

我有一个似乎很常见但我还没有找到解决方案的问题当尝试使用 rCharts Parcoords 发布 Web 应用程序时出现以下错误错误路径 1 没有这样的文件或目录奇怪的是该应用程序在我的笔记本电脑上运行得很好下面是我正在使用
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这

随机推荐

错误：找不到符号文件。风数据库

我从下载了符号http www microsoft com whdc devtools debugging symbolpkg mspx http www microsoft com whdc devtools debugging symb
在给定时间段后关闭或放弃 MFC 对话框

如何在 10 秒后自动关闭或放弃 MFC 对话框为你的计时器声明一个 ID 即在你的CMyDialog h某处 static const UINT ID MY TIMER 1000 在你的中创建一个计时器OnInitDialog功能 Se
“Expo 开发人员工具已与 Expo CLI 断开连接。”当尝试运行 React Native 项目时

一旦我击中expo startexpo 运行了几秒钟但随后出现以下错误 Error EMFILE too many open files watch at FSEvent FSWatcher handle onchange interna
CckEditor 和 Angular Material 2 个选项卡

我使用 Angular cli Angular Material 2 并尝试使用 CKEditor ng2 ckeditor 当我将 CkEditor 直接插入 HTML 在一个 div 内时一切正常但是当我将 CkEditor 代码
更新 Android 中 App Widget 的多个实例

尝试创建应用程序小部件的多个实例并分别更新每个实例但找不到它无法正常工作的原因这是代码收集自here http javatechig com android app widgets example in android 并进行了一些修
如何禁用 BottomNavigationView 移动模式？

BottomNavigationView 不显示非活动菜单的标题如何在bottomNavigationBar中显示所有菜单元素的标题问题是在我的例子中仅显示了单击的元素的标题实施BottomNavigationView有条件当有超过
错误：java.lang.IllegalArgumentException：选项“basePath”必须是目录

基于可用的书籍https github com jaceklaskowski spark structured streaming book blob master spark structured streaming adoc https
如何让 twilio 在 java 中使用代理

我们的应用程序是基于 Java 的 Web 应用程序在这种情况下我们无法直接访问第三方apihttps api twilio com https api twilio com这必须通过代理来完成谁能告诉我如何为 TwilioRestCl
适用于 DirectShow 实时视频压缩的编解码器

有人可以推荐一个好的实时视频压缩编解码器吗以下是关键要求列表必须表示为 DirectShow 视频压缩过滤器免版税在相对较低的分辨率最大 640x480 下良好的质量比特率输出可与 DivX 相媲美快速且资源高效的实时压缩
如何检查给定的 Python 字符串是否是另一个字符串的子字符串？ [复制]

这个问题在这里已经有答案了我有两个字符串我想检查第一个字符串是否是另一个字符串的子字符串 Python 有这样的内置功能吗尝试使用in像这样 gt gt gt x hello gt gt gt y ll gt gt gt y in x
在 Linux 中等待任意进程并获取其退出代码

如果我不是启动进程的人有没有办法等到进程完成例如如果我运行 ps ef 并选择任何 PID 假设我有权访问进程信息有没有办法可以等到 PID 完成并获取其退出代码你可以使用strace 它跟踪信号和系统调用以下命令等待程序完成然
为什么 style-loader 被用作 Webpack 的 ExtractSass 插件的后备？

在下面的例子中发现here https github com webpack contrib sass loader in production style loader被用作开发模式的后备为什么 const ExtractTextPl
如何执行地址验证？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否可以执行地址物理地址而不是电子邮件验证似乎地址格式的数量之多即使仅在美国也会使这成为一项
我的 IFrame 有问题

hai 我有一个 iFrame 用于在我的页面中显示动态页面在后面的代码中我使用一行代码将 src 属性添加到 iframe divIFrame Attributes src Pages Company aspx 它可以在 IE a 和
重新创建 minitab 正态概率图

我正在尝试使用 R 重新创建以下图 Minitab 将其描述为正态概率图 The probplot http rss acs unt edu Rdoc library e1071 html probplot html帮助您顺利完成大部分任务
自定义 MKOverlayView/未修改的 MKPolygonView 在某些缩放级别被剪裁

当地图上添加了多个叠加层时我遇到了自定义 MKOverlayView 和标准 MKPolygonView 在某些缩放级别上被裁剪的问题阿尔及利亚在两次双击缩放级别上的叠加 https oneironautics org images m
Chrome 版本 35.0.1916.114 m 中已弃用 webkitnotifications？

我只看到那个window webkitnotifications不再可用Chrome版本35 0 1916 114 m 你也是这样的情况吗我为通知 API 编写了一些后备程序我应该进一步修复它 https github com wond
在部署过程中，如何将现有应用程序数据放入由公共 Helm Chart 为 LAMP 堆栈创建的应用程序中？

以 bitnami wordpress 或 bitnami drupal 为例有数百万篇文章介绍如何运行两行代码 helm get repo helm install my release Chart 并在 30 秒内获得完全可用的应用程
如何以编程方式从维基数据实体获取所有可用信息？

我对维基数据真的很陌生我只是认为维基数据使用了大量的具体化假设我们想要获取奥巴马可用的所有信息如果我们要从 DBpedia 执行此操作我们只需使用一个简单的查询 select where
使用 for 循环对多列进行 mutate 来重新编码值

我需要根据另一个表对数据帧的多列上的值进行重新编码我必须使用侧表重新编码数据表的多个列的值这些值对应于我必须用地名替换的地理标识符所以我决定做一个循环但是循环之外有效的方法不再有效我无法在 for 循环中使用 mutate 我的真

使用 for 循环对多列进行 mutate 来重新编码值

使用 for 循环对多列进行 mutate 来重新编码值 的相关文章

随机推荐

热门标签

使用 for 循环对多列进行 mutate 来重新编码值的相关文章