R 用字典表替换列中的值而不使用合并或连接

2023-12-14

假设我有一个字典表,例如:

id value
1 168833
2 367656
3 539218
4 892211
......(millions of lines)

和一个原始数据框,例如:

name code 
Abo   1
Cm3   2
LL2   6
JJ    15

如何在不使用join或merge的情况下用字典表替换原表中的代码列?


我们可以用match from base R

df1$value[match(df2$code, df1$id)]

或者另一个选择是hashmap

library(hashmap)
hp <- hashmap(df1$id, df1$value)
hp[[df2$code]]

基于中的示例?hashmap,它工作得更快

microbenchmark::microbenchmark(
     "R" = y[match(z, x)],
     "H" = H[[z]],
     times = 500L
 )
#Unit: microseconds
# expr     min       lq     mean   median       uq      max neval
#    R 154.197 202.1625 240.5838 229.1625 245.1735 6853.756   500
#    H  15.861  19.0235  22.7721  22.4490  24.9670   62.230   500
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 用字典表替换列中的值而不使用合并或连接 的相关文章

  • 如何在不循环的情况下添加组ID?

    我有数据框 例如 productid ordernum p1 10 p2 20 p3 30 p4 5 p5 20 p6 8 我想添加另一列 称为 groupid 它将产品按顺序分组在一起 一旦 sum ordernum 达到 30 分配一个
  • 如何使用 R 中带引号的字符值内的序列读取 CSV?

    这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来 并且有一个顺序 在值之一内 转义引号加分隔符 我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
  • R:将 readRDS 应用于 .Rds 文件名的列表对象

    我有几个包含数据帧对象的 Rds 文件 我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中 但是 当我尝试从文件名列表中读取多个 Rds 文件时 我收到错误 FUN X i 中的错误 从连接读取时出错 readRDS 不适用于列表吗 R
  • 逻辑回归/二项式的 glmnet 误差

    当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时 出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
  • 如何按 data.table 中的十分位数组计算统计数据

    我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
  • 如何将此“for”循环转换为向量解

    这个问题与 将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
  • r 中的 5 维图

    我正在尝试在 R 中绘制 5 维图 我目前正在使用rgl包以 4 个维度绘制数据 使用 3 个变量作为 x y z 坐标 另一个变量作为颜色 我想知道是否可以使用这个包添加第五个变量 例如空间中点的大小或形状 这是我的数据和当前代码的示例
  • 如何在R中同时对三个字段进行网络分析

    如何在 R 中同时对三个字段进行网络分析 下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
  • ggplot2、R 中的单条形条形图

    我有以下数据和代码 gt ddf var1 var2 1 aa 73 2 bb 18 3 cc 9 gt gt dput ddf structure list var1 c aa bb cc var2 c 73L 18L 9L Names
  • 如何将 ggrough 图表另存为 .png

    说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码 取自该网页 library ggplot2 library ggroug
  • 非闪亮上下文中的反应式对象绑定

    实际问题 你怎样才能近似反应性环境 行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数 或者甚至可能在一个函数中使用这些函数无光泽上下文以
  • 如何根据两个数据框中最近的日期进行匹配?

    假设我有两个数据框 例如 set seed 123 df1 lt data frame bmi rnorm 20 25 5 date1 sample seq Date as Date 2014 01 01 as Date 2014 02 2
  • 从数据框创建稀疏矩阵

    我正在做一项作业 尝试为 Netflix 奖项数据构建协作过滤模型 我使用的数据位于 CSV 文件中 我可以轻松地将其导入到数据框中 现在我需要做的是创建一个稀疏矩阵 其中用户作为行 电影作为列 每个单元格都由相应的评级值填充 当我尝试绘制
  • 如何从R arrow中的feather文件中读取列名和元数据?

    现已取代 独立R 的羽毛库 https github com wesm feather有一个函数叫做feather metadata 允许从磁盘上的羽毛文件中读取列名称和类型 而无需打开它们 当在 R 中加载羽毛文件时 这对于仅选择特定列很
  • 捕获段错误、内存未映射错误

    我试图在 R 中找到 1347 x 209974 矩阵的列的相关性 每次我这样做 使用一个简单的命令cor matrix 我收到消息 caught segfault address 0xffffffffd058abf8 cause memo
  • 如何在我自己的网络服务器上导出并托管 ggvis 图表?

    据我了解 ggvis 运行在闪亮的之上 但我不知道如何在没有 R shiny 的情况下导出在网络服务器上运行单个 ggvis 图表所需的所有文件 这对于交互式绘图来说是不可能的 因为 每个交互式 ggvis 图都必须连接到正在运行的 R 会
  • 如何匹配R中列之间的多个对应值

    我有一个结构如下的数据框 ID Value1 Value2 1 a d g f 12 14 15 9 2 b c e 5 18 20 3 h i j 6 7 25 所以我有一个 ID 和两个值 对于值 1 有多个对应于值 2 的选项 我想最
  • ggplot2 可视化/显示中的地图错误?

    正如您在下面看到的 我使用 ggplots 制作的地图上存在一个奇怪的显示问题 任何投影似乎都会发生同样的问题 这是代码 仅包maps and ggplot2需要 mapWorld lt borders world colour gray5
  • R 包与 Rcpp 的链接错误:“未定义符号:LAPACKE_dgels”

    我正在创建一个 R 包 lapacker 以使用 R API 头文件 R ext Lapack h 为 R 提供和使用的内部 LAPACK 库 仅具有双精度和双复数 提供 C 接口 源代码 https github com ypan1988
  • 基于条件反应逻辑闪亮的 Flexdashboard

    我正在尝试有条件地进行一种类型的渲染 renderPlot 或其他 renderText 基于一些输入 这是我尝试过的 title Citation Extraction output flexdashboard flex dashboar

随机推荐

  • JAXB - xsd:all 内具有无限 maxOccurs 的元素

    假设我有以下 java 类 该类映射到 REST 服务的请求主体以搜索用户 XmlRootElement name SearchParams XmlType propOrder public class SearchParams priva
  • 实体框架和自我跟踪实体与 POCO

    如果我想使用实体框架 4 作为我的数据层 并希望将我的实体发送到另一层 无论是通过 WCF 还是其他机制 然后希望能够更新实体并将它们发回以进行更新 删除 插入最好使用自跟踪实体还是 poco 对象 如果可能的话 我宁愿使用 POCO 对象
  • 在 ggplot 中绘制多个时间序列

    我有一个由 10 个变量组成的时间序列数据集 我想创建一个时间序列图 其中每个 10 个变量随着时间的推移以不同的颜色绘制在同一个图表上 值应位于 Y 轴上 日期应位于 X 轴上 点击这里对于数据集 csv 这是我一直在使用的 可能是错误的
  • 如何阅读这个 LESS css?

    我正在尝试找出 Joni Korpi 的 Frameless CSS 无框架网格 http framelessgrid com 并且我很难阅读他拥有的 less 文件 我对 LESS 使用变量有一个基本的了解 所以我知道 column 48
  • 安装 Windows 10 周年更新后无法启动 Android 模拟器

    我刚刚安装了 Windows 10 周年更新 现在无法启动 Android 模拟器 Android Studio 显示以下消息 Android Emulator is incompatible with Hyper V 但如下图所示 Hyp
  • 如何获取大型调查数据集的 svydb R 包以返回标准错误

    很高兴看到 Charco Hui 将 Thomas Lumley 的实验性 sqlsurvey 包复活为 svydb 在 R 中处理大型调查数据集可能是一个很好的工具 不过 在 svydb 计算标准误差时遇到了一些问题 这个问题与我在 sq
  • 尝试找到 4 个点的贝塞尔曲线的长度

    我找到了这个问题的大约 1000 个答案 但没有一个是我可以使用的 因为我在曲线中使用了 4 个控制点 也就是说 我偶然发现了这个人here double BezierArcLength point2d p1 point2d p2 poin
  • 播放案例类的json读取和默认参数?

    我对默认参数和使用 Play Json Read 有问题 这是我的代码 case class Test action String storeResult Option Boolean Some true returndata Option
  • 为 python 函数提供可变数量的参数

    我有一个脚本 它从输入文件中读取可变数量的字段并将它们作为参数传递给函数 例如 文件 1 包含字段 A B 和 C gt function A B C 文件 N 包含字段 A B C 和 D gt function A B C D 我的问题
  • 如何在 django 中使用 @ 提及用户

    我一直在 django 上开发一个项目 它与 instagram 和 twitter 非常相似 它需要具有的功能之一是在文本字段中使用 提及用户 我已经调查了一段时间 关于如何在 django 中做到这一点 除了一些像 django men
  • 如何在 tkinter Entry 小部件中仅插入一些指定的字符

    我有一个包含 n 个 Entry 小部件的列表 用户应该只能键入以下字符 V F 如果用户键入这些字符之一 则焦点应从 Entry x 传递到 Entry x 1 否则焦点应保留在原来的位置 在 Entry x 上 并且应丢弃输入 我无法丢
  • 如何在Java中递归解压文件?

    我有 zip 文件 其中包含一些其他 zip 文件 例如 邮件文件是abc zip它包含xyz zip class1 java class2 java And xyz zip包含文件class3 java and class4 java 所
  • 为第三方 Webflow 重定向 ionic 时要使用什么重定向 URL

    我正在开发一个离子移动应用程序 我想在其中重定向到第三方网络流 该网络流请求用户同意并重定向到回调 URL 我应该指定该回调 URL 以获取令牌作为权限令牌以进行进一步的 API 调用 由于 ionic 本身是一个 html5 移动应用程序
  • 为什么存在NotImplementedException?

    Locked 这个问题及其答案是locked因为这个问题是题外话 但却具有历史意义 目前不接受新的答案或互动 这真的非常让我感到不安 所以我希望有人能给我一个合理的理由来解释为什么事情是这样的 NotImplementedException
  • Jackson 单参数构造函数因 ParameterNameModule 失败

    我正在使用 Jackson 2 8 5 和 Java 8 的 ParameterNamesModule https github com FasterXML jackson modules java8 当我想使用单个参数对具有单个构造函数的
  • 如何使中心圆居中?

    如何使中心圆居中 仅限 CSS 假设最新的 CSS3 浏览器支持 当父 w h 动态变化时 必须保持 v h 居中 实验性 CSS 盒模型规范在这里有帮助吗 Thanks http jsfiddle net dragontheory VdJ
  • 在 MS *Word* VBA 中循环选择不连续的部分

    我在 MS Word 2013 VBA 中有一个宏 notExcel 切换所选文本的突出显示颜色 代码看起来像 这 If Selection Range HighlightColorIndex WhtColor Then Selection
  • 使用新版本的应用程序更新和更改设置 plist 文件

    我的应用程序的资源文件夹中有一个默认设置 plist 文件 并且在第一次启动时该文件被复制到文档文件夹中 在应用程序的后续版本中 如何将文档中的 plist 设置与自上一版本以来添加的任何新键和值 可能是嵌套的 合并 我见过一种模式 其中属
  • PowerShell New-CommandWrapper :为以下参数提供值

    我的意思是对输出进行着色ls 我检查了Powershell 一劳永逸地正确着色 Get Childitem 输出 这两个选项似乎是 Use New CommandWrapper 正如 OP 和 Jon Z 的回答中所提倡的那样 使用模块PS
  • R 用字典表替换列中的值而不使用合并或连接

    假设我有一个字典表 例如 id value 1 168833 2 367656 3 539218 4 892211 millions of lines 和一个原始数据框 例如 name code Abo 1 Cm3 2 LL2 6 JJ 1