是否可以根据变量标签选择列？

2023-12-24

对于非常广泛的数据集，是否可以使用变量标签来选择列？

library(expss)
data(mtcars)
mtcars = apply_labels(mtcars,
                      mpg = "Miles/(US) gallon",
                      cyl = "Number of cylinders",
                      disp = "Displacement (cu.in.)",
                      hp = "Gross horsepower",
                      drat = "Rear axle ratio",
                      wt = "Weight (1000 lbs)",
                      qsec = "1/4 mile time",
                      vs = "Engine",
                      vs = c("V-engine" = 0,
                             "Straight engine" = 1),
                      am = "Transmission",
                      am = c("Automatic" = 0,
                             "Manual"=1),
                      gear = "Number of forward gears",
                      carb = "Number of carburetors"
)
mtcars %>% 
  select(contains("Miles"))

这不起作用，因为它会查找列名称。它可以查看标签吗？

编辑：我应该添加，除了将标签转换为列名称的明显作用之外。

我们可以得到attributes“标签”，检查“里程”

library(dplyr)
library(stringr)
mtcars %>% 
   select(where(~ str_detect(attributes(.)$label, 'Miles')))

-output

#                      mpg
#Mazda RX4           21.0
#Mazda RX4 Wag       21.0
#Datsun 710          22.8
#Hornet 4 Drive      21.4
#Hornet Sportabout   18.7
#Valiant             18.1
#Duster 360          14.3
#Merc 240D           24.4
#Merc 230            22.8
#Merc 280            19.2
#Merc 280C           17.8
#Merc 450SE          16.4
# ..

或者使用base R (with R 4.1.0)，用循环遍历列lapply，提取labels属性、用途grep返回匹配的元素pattern“英里”，获取names并将其用于select of subset

mtcars |>  
    lapply(\(x) attributes(x)$label) |> 
    grep(pattern = 'Miles', value = TRUE) |> 
    names() |>
    {\(x) subset(mtcars, select = x)}()

-output

#                      mpg
#Mazda RX4           21.0
#Mazda RX4 Wag       21.0
#Datsun 710          22.8
#Hornet 4 Drive      21.4
#Hornet Sportabout   18.7
#Valiant             18.1
#Duster 360          14.3
#Merc 240D           24.4
#Merc 230            22.8
#Merc 280            19.2
# ...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

tidyr

是否可以根据变量标签选择列？的相关文章

如何让 print() 将参数传递给 R 中用户定义的打印方法？

我在 R 中定义了一个 S3 类它需要自己的打印方法当我创建这些对象的列表并打印它时 R 按其应有的方式对列表中的每个元素使用我的打印方法我想对打印方法实际显示的数量进行一些控制因此我的类的 print 方法需要一些额外的参数但
将命名参数列表传递给函数？

我想编写一个小函数来从适当的分布生成样本例如 makeSample lt function n dist params values lt makeSample 100 unif list min 0 max 10 values lt m
将 Instagram/youtube 嵌入 Shiny R 应用程序

我想通过点击图表来播放 Instagram 或 Youtube 视频例如显示异常值等到目前为止明确告诉 Shiny 视频内容是有效的 require shiny require ggplot2 data df lt data fram
基于另一个数据集获取数据集的子集

假设我有一个数据集即 dat1 ID block plot SPID TotHeight 1 1 1 4 44 5 2 1 1 4 51 3 1 1 4 28 7 4 1 1 4 24 5 5 1 1 4 27 3 6 1 1 4 20
如何在R中删除重复项

我有一个非常大的数据集如下所示 df lt data frame school c a a a b b c c c year c 3 3 1 4 2 4 3 1 GPA c 4 4 4 3 3 3 2 2 school year GPA
kableExtra 中的 row_spec() 函数不会在 html 输出中创建水平线

我想在 kableextra 表中的某一行下方添加一条水平线 row spec 函数的参数 hline after 应该在行下方添加水平线 row spec 文档 https www rdocumentation org packages
如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
重复测量引导统计数据，按多个因素分组

我有一个看起来像这样的数据框但显然还有更多行等 df lt data frame id c 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 cond c A A B B A A B B A A B B A A B B co
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
R - Plm 和 lm - 固定效应

我有一个平衡面板数据集 df 本质上由三个变量组成 A B and Y 对于一堆独特识别的区域来说它会随着时间的推移而变化我想运行一个回归其中包括区域下面等式中的区域和时间年份固定效应如果我没记错的话我可以通过不同的方式来
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
pyomo + 网状错误 6 句柄无效

我正在尝试运行pyomo优化我收到错误消息 Error 6 The handle is invalid 不知道如何解释它环顾四周似乎与特权有关但我不太明白在下面找到完整的错误跟踪以及重现它的玩具示例完整的错误跟踪 py run f
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
只读取选定的列

谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集
如何仅删除单括号并保留配对的括号

你好我亲爱的老师 R 用户朋友们我最近开始认真学习正则表达式最近我遇到了一种情况我们只想保留配对括号并省略未配对的这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou

随机推荐

为 Bson.M mongodb 创建自定义 mashler/unmashler 时出错

我收到错误WriteValueBytes can only write while positioned on a Element or Value but is positioned on a TopLevel当尝试为 bson M 创建
PyTuple_SetItem 的限制

我有一个 Python 扩展模块它创建一个元组作为另一个对象的属性并在元组中设置项目每当我在Python中执行这个模块时我总是收到错误SystemError bad argument to internal function 阅读完
为什么Cppcheck没有发现这个明显的数组越界错误？

我安装了Cppcheck http cppcheck sourceforge net 我的 C 项目的静态代码分析工具感觉它的性能很差例如谁能告诉我whyCppcheck无法在以下代码中找到数组越界错误 void f int c ch
从 C# 在 PowerShell 6 中运行 PowerShell 脚本

我有一个与 REST 服务器通信的 PowerShell 脚本该脚本仅适用于 PowerShell 6 我想从 C 调用它因为 C 程序需要来自 REST 服务器的信息并且我不想用 C 重写 REST 代码基本上我想从 C 运行
操作系统级别的睡眠是如何实现的？

我只是感兴趣如何sleep time in ms 是在 C 库中实现的或者基本上是在操作系统级别实现的我猜可能是基于处理器速度你做了一个 nop 的 while 循环我不确定睡眠时间是否准确处理器中的任何特殊寄存器您在其中写入
ASIHTTPRequest 中 POST 中的正文为空

基本上我发送一个带有空数据正文的 POST 请求 ASIHTTPRequest request ASIHTTPRequest alloc init request setURL NSURL URLWithString escapedUrl
Docker 未知速记标志：-aq 中的“a”）

我有多个正在运行的 docker 版本 18 09 0 构建 4d60db4 容器我希望立即停止它们这篇博文 http blog baudson de blog stop and remove all docker containers
将文件名设置为 Blob 文件

我想向我的 Blob 文件添加一个文件名但我真的不知道该怎么做这是我目前的代码 onClick var myHeader new Headers myHeader append Content Type text plain fetch
如何加密 web.config 中的一项

ASP NET 4 我用过RSA密钥加密 http msdn microsoft com en us library ff650304 aspx paght000006 webfarmscenarios用于我的网络场的 web config
ThreadLocal - 用作带有 spring-boot 的 REST API 的上下文信息

我有一些spring boot应用程序它公开了 REST API 提到的 REST API 是由spring security 一切都很好但是现在我需要设置上下文用于服务请求设置上下文是指根据用户上下文选择数据源关键是Routin
Unity Shader - 如何有效地重新着色特定坐标？

首先请允许我解释一下我所得到的内容然后我将讨论接下来我想要弄清楚的内容我有什么我有一个带纹理的自定义网格其一些边缘与 Unity 中的整数世界坐标完全对齐在网格中我添加了自己的粗略但有效的自定义表面着色器如下所示 Shade
Swift Closure 中的可选链接，返回类型必须为 Void

我正在创建一个脚本的双向链接列表 MSScripts 应该有自己的run 实现然后他们调用下一个脚本 rscript 当他们准备好时我想创建的脚本之一只是一个延迟它看起来像这样 class DelayScript MSScript v
Django - ManyToManyRelation 中的级联删除

使用以下相关模型一篇博客文章可以有多个修订版 class BlogEntryRevision models Model revisionNumber models IntegerField title models CharField m
lua 中的准引用/引用？

在 Lisp 中我可以 a b c d e f g 意思是 look up b c d e f g look up a apply value of a to above 那么我还可以 a b c d e f g 这相当于 list a
$_ 与命名输入或循环参数有何不同？

由于我经常使用我想更好地理解它的用法据我理解和使用是隐式值的全局变量由于似乎无论如何都已设置是否有理由在上使用命名循环变量besides可读性在什么情况下是全局变量很重要所以如果我使用 for array print o
后记 - 文档大小

附言中如何设置页面大小如何将文档旋转到宽度 Example 1 newpath 100 200 moveto 200 250 lineto 100 300 lineto 2 setlinewidth stroke showpage 谢谢
如何在 Jenkins 中将安全类型从 SSL 更改为 TLS？

我正在尝试设置 smtp 电子邮件通知我可以看到 Gmail 部分工作正常我想为我的 Office 365 配置它 smtp服务器 smtp office365 com 我们没有配置 SSL 相反我们使用 TLS 如何在 Jenkin
如何通过删除 NA 值的选项来融合 Pandas 中的数据框

我有一个像这样的 Pandas 数据框 df pd DataFrame VAR1 V1 V2 V2 V3 V4 V4 V5 VAR2 C1 C1 C1 C2 C2 C2 C3 VAR3 S1 S2 S3 S4 VAR4 S3 S4 S5 S
更改应用程序默认描述语言

我正在将我的应用程序的新版本提交到应用程序商店有没有办法更改 iTunesConnect 中的默认应用程序语言假设我有法语作为默认描述语言我需要更改default到英语我怎么做您的应用程序必须处于准备销售状态然后转到您的应
是否可以根据变量标签选择列？

对于非常广泛的数据集是否可以使用变量标签来选择列 library expss data mtcars mtcars apply labels mtcars mpg Miles US gallon cyl Number of cylinde

是否可以根据变量标签选择列？

是否可以根据变量标签选择列？ 的相关文章

随机推荐

热门标签

是否可以根据变量标签选择列？的相关文章