我的数据结构如下,所有变量均采用字符串格式:
v1 v2 c1 c2 c1c2
00035A 943567 00088E 63968E 00088E;63968E
00088E 63968E 00088E 63968E 00088E;63968E
00088E 925524 00088E 63968E 00088E;63968E
000361 237924 00088E 63968E 00088E;63968E
000361 83367A 00088E 63968E 00088E;63968E
00055X 49328R 00088E 63968E 00088E;63968E
00056N 87885Q 00088E 63968E 00088E;63968E
000794 69911G 00088E 63968E 00088E;63968E
23792A 001674 00088E 63968E 00088E;63968E
63968E 17275R 00088E 63968E 00088E;63968E
我想做的是替换v1
with c1c2
if v1=c1
and v2
with c1c2
if v2=c2
通过使用 R 中的一些通用命令,即不包含特定值c1
, c2
, and c1c2
.
将不胜感激您的帮助。
您可以通过多种方式执行此操作:
1: with ifelse
基 R 中的语句:
df$v1 <- ifelse(df$v1==df$c1, df$c1c2, df$v1)
df$v2 <- ifelse(df$v2==df$c2, df$c1c2, df$v2)
2:或使用子集赋值:
df[df$v1==df$c1,"v1"] <- df[df$v1==df$c1,"c1c2"]
df[df$v2==df$c2,"v2"] <- df[df$v2==df$c2,"c1c2"]
3:或与数据表包裹:
library(data.table)
setDT(df)[v1==c1, v1 := c1c2][v2==c2, v2 := c1c2]
每个解决方案都会给出以下结果:
> df
v1 v2 c1 c2 c1c2
1: 00035A 943567 00088E 63968E 00088E;63968E
2: 00088E;63968E 00088E;63968E 00088E 63968E 00088E;63968E
3: 00088E;63968E 925524 00088E 63968E 00088E;63968E
4: 000361 237924 00088E 63968E 00088E;63968E
5: 000361 83367A 00088E 63968E 00088E;63968E
6: 00055X 49328R 00088E 63968E 00088E;63968E
7: 00056N 87885Q 00088E 63968E 00088E;63968E
8: 000794 69911G 00088E 63968E 00088E;63968E
9: 23792A 001674 00088E 63968E 00088E;63968E
10: 63968E 17275R 00088E 63968E 00088E;63968E
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)