我组合了多个数据集并仅保留特定列,但是,当我使用 dplyr 中的选择函数时,它不会保留原始列标签(在我的情况下为项目文本)。
导入数据后,我使用以下代码来选择要保留的变量:
Wave1Data_Clean <- select(Wave1Data, ID, x1, x2, x3, x4, x5)
当我这样做时,列名称和值都是正确的,但是列标签将替换为原始数据帧的标签。例如,如果原始数据中第 1 列的标签为“location”,则 df 中 ID 的列名称将为“location”,而不是与 ID 关联的标签。
有没有办法保留适当的列标签?
当我在 RStudio 中查看数据框时,我可以看到您描述的问题。
RStudio 中的示例_Clean https://i.stack.imgur.com/C43m4.png
我不确定为什么标签会混淆,但您可以用正确的标签覆盖它们。
假设您正在使用read.spss
来自foreign
包中,标签存储为名为“variable.labels”的属性。您可以使用以下方式访问标签:
attr(Example_Clean, "variable.labels")
以下代码用正确的标签覆盖标签。
var_labs <- attr(Example_Clean, "variable.labels")
var_labs <- var_labs[names(Example_Clean)]
attr(Example_Clean, "variable.labels") <- var_labs
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)