我正在寻找一种快速有效的方法来填充共现矩阵(可以这么说)。
这是我正在使用的数据示例:
col1 col2
a e
a f
a e
b f
c g
a e
d f
a e
a g
b e
c e
我想要一个以下形式的矩阵:
... e... f... g
a
b
c
d
以及与频率相关的相应条目。
例如,矩阵中的元素 (3,1) 对应于 (c,e) 的共现频率,并且应具有值 1,而 (1,1) 的值应具有对应于 3 的值 3数据集中的 (a,e) 条目。
我目前正在使用两个 for 循环单独计算项目,并且计算矩阵需要非常长的时间(实际数据大约有一百万行)。
这是 R 中的解决方案table
:
df <- read.table(text="col1 col2
a e
a f
a e
b f
c g
a e
d f
a e
a g
b e
c e", header = TRUE)
table(df)
col2
col1 e f g
a 4 1 1
b 1 1 0
c 1 0 1
d 0 1 0
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)