对多个任意过滤条件使用 tidy eval

2023-12-07

我想用整齐的评价编写多个完全灵活的过滤条件。一个相关但不太复杂的问题已解决在这个 Stackoverflow 问题中。以下代码（改编自上述其他问题）正在运行。它将两个过滤条件应用于gapminder数据集，并返回过滤后的数据。

library(tidyverse)
library(gapminder)

my_filter <- function(df, cols, vals){    
  paste_filter <- function(x, y) quo(!!sym(x) %in% {{y}})
  fp <- pmap(list(cols, vals), paste_filter)
  filter(df, !!!fp)
}

cols <- list("country", "year")
vals = list(c("Albania", "France"), c(2002, 2007))
gapminder %>% my_filter(cols, vals)

问题：到目前为止，该解决方案仅限于一种类型的过滤器运算符（%in%）。我想扩展这种方法来接受任意类型的运算符（==, %in%, >，...）。预期功能my_filter应该处理以下内容：

cols <- list("country", "year")
ops <- list("%in%", ">=")
vals = list(c("Albania", "France"), 2007))
gapminder %>% my_filter(cols, ops, vals)

我脑海中的用例是闪亮的应用程序。使用这样的功能，我们可以更轻松地让用户对数据集的变量设置任意过滤条件。

创建一个调用列表并将它们拼接到：

library(dplyr)
library(gapminder)

cols <- list("country", "year")
ops <- list("%in%", ">=")
vals <- list(c("Albania", "France"), 2007)

# Assumes LHS is the name of a variable and OP is
# the name of a function
op_call <- function(op, lhs, rhs) {
  call(op, sym(lhs), rhs)
}

my_filter <- function(data, cols, ops, vals) {
  exprs <- purrr::pmap(list(ops, cols, vals), op_call)
  data %>% dplyr::filter(!!!exprs)
}

gapminder %>% my_filter(cols, ops, vals)
#> # A tibble: 2 × 6
#>   country continent  year lifeExp      pop gdpPercap
#>   <fct>   <fct>     <int>   <dbl>    <int>     <dbl>
#> 1 Albania Europe     2007    76.4  3600523     5937.
#> 2 France  Europe     2007    80.7 61083916    30470.

在这里，我们不必担心范围问题，因为 (a) 假定列名在数据掩码中定义，(b) 值按值传递并内联到创建的调用中，(c) 函数假定为二元运算符，并且很少重新定义它们。

为了允许自定义用户功能，我们可以采用两种方法。首先，我们可以使用一个环境并手动创建配额new_quosure():

op_call <- function(op, lhs, rhs, env = caller_env()) {
  new_quosure(call(op, sym(lhs), rhs), env)
}

my_filter <- function(data, cols, ops, vals, env = caller_env()) {
  exprs <- purrr::pmap(list(ops, cols, vals), op_call, env)
  data %>% dplyr::filter(!!!exprs)
}

gapminder %>% my_filter(cols, ops, vals)

local({
  my_op <- `%in%`
  gapminder %>% my_filter(cols, list("my_op", ">="), vals)
})
#> # A tibble: 2 × 6
#>   country continent  year lifeExp      pop gdpPercap
#>   <fct>   <fct>     <int>   <dbl>    <int>     <dbl>
#> 1 Albania Europe     2007    76.4  3600523     5937.
#> 2 France  Europe     2007    80.7 61083916    30470.

另一种可能更简单的方法是允许调用包含内联函数。为此，请使用rlang::call2()代替base::call():

op_call <- function(op, lhs, rhs) {
  call2(op, sym(lhs), rhs)
}

my_filter <- function(data, cols, ops, vals) {
  exprs <- purrr::pmap(list(ops, cols, vals), op_call)
  data %>% dplyr::filter(!!!exprs)
}

local({
  my_op <- `%in%`
  gapminder %>% my_filter(cols, list(my_op, ">="), vals)
})
#> # A tibble: 2 × 6
#>   country continent  year lifeExp      pop gdpPercap
#>   <fct>   <fct>     <int>   <dbl>    <int>     <dbl>
#> 1 Albania Europe     2007    76.4  3600523     5937.
#> 2 France  Europe     2007    80.7 61083916    30470.

内联函数的缺点是，这将阻止优化和到其他 dplyr 后端的可移植性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对多个任意过滤条件使用 tidy eval 的相关文章

从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST
根据另一列中的键累积一列中的值时出现问题

我有一个看起来像这样的数据框我需要使用 PROJ ID 列中的字符串创建一个新的值列并形成 PROJ NAME 列中的值字符串这里提供的解决方案根据 r 中另一列的键累积一列中的值 https stackoverflow com q
比较 R 中的两个字符向量

我有两个 ID 字符向量我想比较这两个字符向量特别是我对以下数字感兴趣 A和B各有多少个ID 有多少个ID在A中但不在B中有多少个ID在B但不在A 我还想画维恩图以下是一些可以尝试的基础知识 gt A c Dog Cat Mouse
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
R：将 JSON 时间格式转换为 POSIX

我有一个 JSON 字符串并将其放入数据框中我能够做到这一点但我在使用 apply 函数之一将所有时间字符串转换为 POSIX 格式时遇到问题 See here https stackoverflow com questions 90
16 位以上整数的计算

我有两个大整数两者都超过 16 位确切地说是 20 位而且我知道由于双精度浮点运算我在使用这些数字进行计算甚至将它们存储在变量中独立于编程语言时受到限制不过我想也许gmp图书馆应该处理它们但不幸的是它没有可以计算更大的整
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
GGPLOT2：如何在 ggplot() 脚本中绘制特定选择

这是一个名为的大型数据集的峰值P 其中有 10 个优惠 CS 有不同的商店 SHP 具有多个数值数据集列出了按周排序的它们 WK 2 tm 52 它创建一个大文件仅前 6 行出现峰值 WK MND CS SHP RevCY RevLY
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug
非闪亮上下文中的反应式对象绑定

实际问题你怎样才能近似反应性环境行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数或者甚至可能在一个函数中使用这些函数无光泽上下文以
R - tidyr - 变异并传播多列

我在 R 中有以下数据框 my df test lt data frame V1 c 1 2 1 V2 c A B A V3 c S1 S1 S2 V4 c x x x V5 c y y y V6 c A B C V7 c D E F my
捕获段错误、内存未映射错误

我试图在 R 中找到 1347 x 209974 矩阵的列的相关性每次我这样做使用一个简单的命令cor matrix 我收到消息 caught segfault address 0xffffffffd058abf8 cause memo
从“parallel”包中的非基础 R 包调用函数，而无需在函数中将它们库化

假设我正在尝试运行以下代码 library gregmisc library parallel myfunction lt function x combinations 10 x 1 10 cl lt makeCluster getOpt
使用 R 交互式更改 Plotly 图像中的轴刻度（线性/对数）

Goal 创建交互式下拉菜单按钮来更新 R 中 Plotly 图形的轴比例 Issue 有很多关于创建的文档buttons https plot ly r custom buttons and 对数图 https plot ly r lo
如何一次导入多个 .csv 文件？

假设我们有一个包含多个 data csv 文件的文件夹每个文件包含相同数量的变量但每个文件来自不同的时间 R 中有没有办法同时导入它们而不必单独导入它们我的问题是我有大约 2000 个数据文件需要导入并且必须使用以下代码单独导入

随机推荐

将货币符号附加到 SQL 查询结果

sql查询的结果 select PayerDate PaymentAmount from Payments 付款金额小数 Date Amount 12 11 2012 34 31 12 11 2012 95 60 12 11 2012 3
keras ValueError：生成器的输出应该是一个元组（x，y，sample_weight）或（x，y）。发现：无

我有 Unet 模型视网膜网但是我增强了图像和蒙版现在它给了我这个错误ValueError output of generator should be a tuple x y sample weight or x y Found No
ngStyle VS Renderer2 ？我应该用什么？

我正在使用 Angular 5 2 9 我想知道什么时候应该使用 Renderer2 而不是 ngStyle 哪个是最好的解决方案 1 div FOO BAR div ViewChild div div ElementRef constru
virtualenv + google-app-engine-django 的单元测试导入错误

我正在使用 google app engine django zipped django 只需运行 python manage py test 即可成功没有错误但使用 virtualenv 时测试因导入单元测试错误而失败 Djan
呼叫和 Callvirt

CIL指令 Call 和 Callvirt 之间有什么区别当运行时执行call指令它正在调用一段确切的代码方法毫无疑问它存在于何处一旦 IL 被 JITted 调用站点生成的机器代码就是无条件的jmp指令相比之下 callvirt
查找数组中的非重复元素

我的数组是 array array 4 3 4 3 1 2 1 我想输出如下 Output 2 因为 2 只出现一次这是我尝试过的 array array 4 3 4 3 1 2 1 array1 array 4 3 4 3 1 2 1
在 Kotlin 中解析 webp 文件头以获取其高度和宽度，但得到意外结果

我正在尝试读取 WebP 图像标题根据WebP 容器规范扩展文件格式 fun get24bit data ByteArray index Int Int return data 0 index toInt or data 1 index
在 Firemonkey 中滚动后列表框项目发生变化

我正在 Firemonkey 中开发一个多设备应用程序其中 Main 类有一个包含一些项目的 ListBox 组件这些项目中的每一个都具有相同的定制风格我的问题是当列表框中有很多项目时我必须垂直滚动才能看到其余项目在这种情况下
当前 Icecast 流媒体歌曲的标题

我读过一些问题但没有人解决我的问题我制作了一个简单的客户端来通过icecast2服务器读取声音流我用以下方式读取声音 a new WMPLib WindowsMediaPlayer a URL http radiolink 8000
骨干项目组织

我正在努力寻找一种干净可靠的方法来组织我的 Backbone 应用程序我使用 Requirejs Handlebars 和 Requirejs Text 插件来动态加载 HTML 视图为了简单起见我们假设该网站有以下页面 Home
Heroku 无法安装 pywin32 库

我正在尝试将我的 Python 应用程序推送到 Heroku 但看起来像pywin32未安装 Counting objects 519 done Delta compression using up to 4 threads Compres
如何在Python的xml.dom.minidom中设置元素的id？

如何创建了一个文档和一个元素 import xml dom minidom as d a d Document b a createElement test setIdAttribute 不起作用 b setIdAttribute som
Oracle Apex 18.1 交互式网格 (IG) 以编程方式设置过滤器？自定义 IG 搜索

有没有办法通过 Javascript 或 PL SQL API 在 Oracle Apex 中为 IG 设置过滤器在进行研究时我偶然发现APEX IG 5 1 4 食谱或一些博文如何破解 APEX 交互式网格系列用于使用 Javascri
Git post-receive 挂钩不会从 master 中删除已删除的文件

我在我的服务器上创建了一个裸 git 存储库并设置了以下 post receive 挂钩这个博客 bin bash while read oldrev newrev ref do branch echo ref cut d f3 if m
如何在 Perl 中进行自省？

在 Perl OOP 中如何转储此类及其父类中的所有方法字段 my self 我看到了很多上面的构造函数那么什么是我有 Java OOP 背景如果你的解释能够遵循Java领域我会更容易理解 What is See perldo
不在 gridview 中显示日期时间最小值

given public class Customer public int Id get set public string FirstName get set public DateTime Birthdate get set 我有一个
使用reducebykey时出错：int对象不可订阅

我收到错误 int 对象不可订阅执行以下脚本时 element reduceByKey lambda x y x 1 y 1 with element 是一个键值 RDD value 是一个元组输入示例 A toto 10 A titi
如何为 iPhone 设置视口元以正确处理旋转？

所以我一直在使用让我的 HTML 内容在 iPhone 上完美显示它工作得很好直到用户将设备旋转到横向模式其中显示仍限制为 320 像素有没有一种简单的方法来指定一个视口该视口会随着用户更改而变化设备方向或者我必须求助于
对于终端应用程序来说，什么是好的 Java 类诅咒库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我想编写一个进行屏幕操作的 Java 终端应用程序是否有任何好的库可以让您像 nix C 世界中的诅咒一样操作屏幕我正在寻找的最小功能是窗口和用
对多个任意过滤条件使用 tidy eval

我想用整齐的评价编写多个完全灵活的过滤条件一个相关但不太复杂的问题已解决在这个 Stackoverflow 问题中以下代码改编自上述其他问题正在运行它将两个过滤条件应用于gapminder数据集并返回过滤后的数据 library

对多个任意过滤条件使用 tidy eval

对多个任意过滤条件使用 tidy eval 的相关文章

随机推荐

热门标签