填充共现矩阵

2023-12-19

我正在寻找一种快速有效的方法来填充共现矩阵(可以这么说)。 这是我正在使用的数据示例:

col1 col2
a e    
a f    
a e    
b f    
c g    
a e    
d f    
a e    
a g    
b e    
c e

我想要一个以下形式的矩阵:

... e...  f...  g    
a    
b    
c    
d

以及与频率相关的相应条目。

例如,矩阵中的元素 (3,1) 对应于 (c,e) 的共现频率,并且应具有值 1,而 (1,1) 的值应具有对应于 3 的值 3数据集中的 (a,e) 条目。

我目前正在使用两个 for 循环单独计算项目,并且计算矩阵需要非常长的时间(实际数据大约有一百万行)。


这是 R 中的解决方案table:

df <- read.table(text="col1 col2
a e    
a f    
a e    
b f    
c g    
a e    
d f    
a e    
a g    
b e    
c e", header = TRUE)

table(df)

    col2
col1 e f g
   a 4 1 1
   b 1 1 0
   c 1 0 1
   d 0 1 0
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

填充共现矩阵 的相关文章

随机推荐