R：在函数内使用 dplyr。 eval(expr, envir, enclos) 中的异常：未知列

2023-11-23

我在 R 中创建了一个函数友善的帮助@Jim M.

当我运行该函数时，我收到错误：错误：未知列“原始数据”当查看调试器时，我收到消息：Rcpp::eval(expr, envir, enclos) 中的异常：未知列“rawdata”

然而，当我查看环境窗口时，我可以看到已传递给函数的 2 个变量，它们包含具有 7 个级别因子的原始数据信息和具有 28 个级别的参考数据

function (refdata, rawdata)
{
  wordlist <- expand.grid(rawdata = rawdata, refdata = refdata,     stringsAsFactors = FALSE)
  wordlist %>% group_by(rawdata) %>% mutate(match_score =     jarowinkler(rawdata, refdata)) %>%
summarise(match = match_score[which.max(match_score)], matched_to = ref[which.max(match_score)])
}

这是使用 NSE（非标准评估）的函数的问题。使用 NSE 的函数在交互式编程中非常有用，但会在开发中引起许多问题，即当您尝试在其他函数中使用这些函数时。由于表达式没有被直接求值，R 无法在它所查找的环境中找到对象。我建议您阅读here最好是范围问题章节以获取更多信息。

首先你需要知道所有的标准dplyr函数使用 NSE。让我们看一下您的问题的一个大概示例：

Data:

df <- data.frame(col1 = rep(c('a','b'), each=5), col2 = runif(10))


> df
   col1       col2
1     a 0.03366446
2     a 0.46698763
3     a 0.34114682
4     a 0.92125387
5     a 0.94511394
6     b 0.67241460
7     b 0.38168131
8     b 0.91107090
9     b 0.15342089
10    b 0.60751868

让我们看看 NSE 如何解决我们的简单问题：

首先，简单的交互式案例有效：

df %>% group_by(col1) %>% summarise(count = n())

Source: local data frame [2 x 2]

  col1 count
1    a     5
2    b     5

让我们看看如果我把它放在一个函数中会发生什么：

lets_group <- function(column) {
  df %>% group_by(column) %>% summarise(count = n())
}

>lets_group(col1)
Error: index out of bounds

和你的错误不一样，但它是由 NSE 引起的。完全相同的代码行在函数之外工作。

幸运的是，有一个解决方案可以解决您的问题，那就是标准评估。 Hadley 还制作了所有函数的版本dplyr使用标准评估。它们只是普通功能加上_末尾加下划线。

现在看看这是如何工作的：

#notice the formula operator (~) at the function at summarise_
lets_group2 <- function(column) {
  df %>% group_by_(column) %>% summarise_(count = ~n())
}

这会产生以下结果：

#also notice the quotes around col1
> lets_group2('col1')
Source: local data frame [2 x 2]

  col1 count
1    a     5
2    b     5

我无法测试你的问题，但使用 SE 而不是 NSE 会给你你想要的结果。欲了解更多信息，您还可以阅读here

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

function

dplyr

R：在函数内使用 dplyr。 eval(expr, envir, enclos) 中的异常：未知列的相关文章

R read_excel：libxls 错误：无法解析文件

我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
用于清除工作空间和转储存储的 R 全局函数

我希望创建一个全局函数来清除我的工作区并转储我的内存我将我的函数称为 cleaner 并希望它执行以下代码 remove list ls gc 我尝试在全局环境中创建该函数但是当我运行它时控制台仅打印该函数的文本在我要获取的函数文件
将值替换为其各自列的名称

我有一个数据框 Code 401k CVS 101A true 231N true FD54 true 99JB 85F4 true 我试图用相应的列名称例如 401k 替换 true 字符值这是我想要的输出 Code 401k CVS
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
在 GCC 和 Clang 下，使用 lambda 的简单 RAII 包装器的复制初始化意外失败

我在创建一个简单的 RAII 包装器时遇到了一个意想不到的问题更不用说下面代码的逻辑不完整性了复制构造函数和赋值运算符未删除等这意味着是一个SSCCE 令我印象深刻的是复制初始化我的包装器与临时 lambda 的结果会导致编译错误而
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
仅保留百分比的尾随零

给出以下示例 library pander tableAbs lt Titanic 1 1 tablePct lt round prop table tableAbs 100 2 table lt cbind tableAbs tableP
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
为什么 geom_boxplot 比基本箱线图识别更多异常值？

这是一个可重复的示例与基本箱线图相比最后一个治疗组又发现了一个异常值 dta lt structure list Treatment c A A A A A A A A A A A A A A A A B B B B B B B B B
不接受任何内容也不返回任何内容的函数接口[重复]

这个问题在这里已经有答案了 JDK中是否有一个标准的函数式接口不接受也不返回任何内容我找不到一个像下面这样 FunctionalInterface interface Action void execute 可运行怎么样 Functi
ggplot2、R 中的单条形条形图

我有以下数据和代码 gt ddf var1 var2 1 aa 73 2 bb 18 3 cc 9 gt gt dput ddf structure list var1 c aa bb cc var2 c 73L 18L 9L Names
具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

全部我想使用以下方法从相关矩阵中获取 p 值dplyr 和或扫帚包并同时测试多个变量我知道其他方法但 dplyr 对我来说似乎更简单更直观此外 dplyr 需要关联每个变量以获得特定的 p 值这使得该过程更容易更快我检查
替换字符串/文本中“从第 n 次到最后一次”出现的单词

这个问题以前曾被问过但尚未得到令提问者满意的答案 https stackoverflow com questions 36368712 how to use stringrs replace all function to replace
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug
单击 R 中的 Sankey Chart 线时添加额外的标签值

以下 R 闪亮脚本创建一个桑基图如下面的快照所示我的要求是当我单击左右节点之间的任何链接即 a1 和 a2 时我希望相应的 a3 的总和出现在标签中例如 a1 中的 A 和 a2 中的 E 总共具有值 50 和 32 因此我想

随机推荐

如何更改log4j中的htmllayout

我想更改Java中log4j的htmllayout 5列时间线程级别类别消息我的 log4j properties 是 log4j rootLogger DEBUG Console File log4j appender Con
org.apache.catalina.LifecycleException：子容器在启动期间失败

SEVERE A child container failed during start java util concurrent ExecutionException org apache catalina LifecycleExcept
Spring - 无法解析 MVC“视图”thymeleaf

我有一个简单的HomeController class package com example tacos import org springframework stereotype Controller import org spring
获取 C 时区的夏令时转换日期

在 C 中是否有一种简单的跨平台方法来检索给定时区开始和结束夏令时的日期我已经有了时区偏移信息以及当前是否正在观察夏令时但我确实需要夏令时开始和结束的日期对于我无法控制的外部依赖项在 Windows 中我正在使用获取时区信息 t
在构造函数内分配原型

我有这个代码 var MyClass function b this a b this getA function return that a var SecondClass function b this prototype new My
Multer 不接受数组格式的文件会出现“意外文件错误”

Multer是与node js和express一起使用的用于上传文件的模块我在角度方面使用 ng file upload 模块当我一一发送多个文件时它工作得很好没有任何错误但是当我以数组格式一次性发送所有文件然后按照 Multe
Android ndk(cmake)：在第二个 jni 库中使用日志 api 时，“未定义引用‘__android_log_write’”

我使用 Android Studio 2 2 和 cmake 来构建 jni 文件我想在 jni 文件中显示日志但收到错误消息未定义对 android log write 的引用我的 CMakeLists txt 文件是 add l
CFG 的扩展，它是什么？

考虑以下上下文无关语法的扩展它允许规则在左侧有一个或多个终端在非终端的右侧即形式规则 A b gt 右侧可以是任何东西就像在上下文无关语法中一样特别是它是not要求右侧末尾具有完全相同的终端符号在这种情况下此扩展将是上下
大多数签名/未签名警告的可接受修复？

我本人确信在我正在研究的项目中有符号整数在大多数情况下是最佳选择即使其中包含的值永远不会是负数更简单的反向 for 循环更少的错误机会等特别是对于只能保存 0 到 20 之间的值的整数大多数出错的地方是 std vector
Android Play Places 出现 PLACES_API_INVALID_APP 错误

我正在尝试 Google Place Autocomplete 示例https github com googlesamples android play places 我已将正确的 API 密钥放在正确的位置我知道这一点是因为当我输入随
关于：下载文件时浏览器中出现空白#被阻止

我正在尝试从本地服务器下载文件也许将来我需要在其他服务器上执行此操作当我单击链接下载浏览器中的文件时会出现此消息 about blank blocked 我正在使用 axios 和vue js 代码是这样的 downloadItem
Flex：如何检测用户是否阻止共享对象写入

简单的问题是如果用户已阻止将数据写入共享对象我如何在动作脚本中检测 sharedObj SharedObject getLocal rememberme 这个返回总是共享对象但它的大小是0 即使我已经阻止了共享对象当我尝试将数据保存
如何将多个python文件转换为EXE？

我正在尝试将我的 python 应用程序转换为 exe 我见过像 py2exe 和 cx freeze 这样的东西但它们只编译一个 py 文件谁能帮我谢谢我目前使用py安装程序用于将项目构建为单个可执行文件这些项目都包含多个Pyt
gacutil 构建后事件已退出，代码为 1

我正在尝试在 GAC 中注册并组装构建后活动这是我的构建后命令 C Program Files x86 Microsoft SDKs Windows v7 0A Bin NETFX 4 0 Tools x64 gacutil exe if
如何在主目录中创建文件夹？

我想创建一个目录path HOME somedir 我尝试过使用boost filesystem create directory path 但它失败了显然该函数不会扩展系统变量我怎样才能以最简单的方式做到这一点注意在我的例子中字
从单个项目源构建多个 jar

我对 gradle 还很陌生我想知道是否可以从同一项目源构建多个 jar 我浏览过以前的类似问题但我的情况有点不同我想将所有源文件编译两次以生成两个不同的 jar 每个 jar 具有不同的依赖项和不同的工件 id 从概念上讲它可以表
MongoDB中每条记录的更新时间

MongoDB 的 ObjectId 有一个 getTimestamp 方法该方法返回插入记录的时间是否有类似的方法来获取上次更新的时间或者我应该使用单独的列来保存此数据使用 PHP 如果重要的话 MongoDB 不存储最后的更新
使用 jQuery 检查页面加载时的所有复选框

在页面加载时使用 jQuery 如何自动选择特定 div 中的所有复选框 function thediv input checkbox attr checked checked
如何在war文件中运行java类文件[重复]

这个问题在这里已经有答案了我有一个名为 Sample war 的战争文件在这个战争文件中我有一个名为 Maintest 的主类我想从战争之外运行或执行Maintest类如何做到这一点 War 文件只是带有额外元数据的 Jar 文件
R：在函数内使用 dplyr。 eval(expr, envir, enclos) 中的异常：未知列

我在 R 中创建了一个函数友善的帮助 Jim M 当我运行该函数时我收到错误错误未知列原始数据当查看调试器时我收到消息 Rcpp eval expr envir enclos 中的异常未知列 rawdata 然而当我查看环境

R：在函数内使用 dplyr。 eval(expr, envir, enclos) 中的异常：未知列

R：在函数内使用 dplyr。 eval(expr, envir, enclos) 中的异常：未知列 的相关文章

随机推荐

热门标签

R：在函数内使用 dplyr。 eval(expr, envir, enclos) 中的异常：未知列的相关文章