我想在列之间匹配相似的单词

2024-01-30

1.0 2.0 3.0
loud complaint problems
pain stress confused
dull pain stress

这是我的数据集,我想重新组织行,以便如果每列中出现一个单词,它就会转移到相应的行。例如

1.0 2.0 3.0
loud NA NA
pain pain NA
dull NA NA
NA complaint NA
NA stress stress
NA NA confused
NA NA problems

等等,这样每个单词都有自己的行,如果该行中的单词出现在该列中,它就会与其他列匹配

我一直在寻找如何做到这一点,但找不到好的代码。我得到的一个想法是创建所有出现的单词的列表,然后尝试将它们与每一列匹配,但仍然没有找到这方面的代码。


我们可以使用match in base R- 得到unique元素来自于unlist编辑数据作为vector,循环列,获取匹配元素的索引,以及replace具有匹配元素的索引并在处理长度后转换为 data.frame

v1 <- unique(unlist(df1))
lst1 <- lapply(df1, \(x) 
   {i1 <- match(x, v1)
   replace(rep(NA, max(i1)), i1, v1[i1])
 })
list2DF(lapply(lst1, `length<-`, max(lengths(lst1))))
 1.0       2.0      3.0
1 loud      <NA>     <NA>
2 pain      pain     <NA>
3 dull      <NA>     <NA>
4 <NA> complaint     <NA>
5 <NA>    stress   stress
6 <NA>      <NA> problems
7 <NA>      <NA> confused

data

df1 <- structure(list(`1.0` = c("loud", "pain", "dull"), `2.0` = c("complaint", 
"stress", "pain"), `3.0` = c("problems", "confused", "stress"
)), class = "data.frame", row.names = c(NA, -3L))

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我想在列之间匹配相似的单词 的相关文章

  • R foreach问题(某些进程返回NULL)

    我遇到了问题foreach我正在 R 中使用的程序的一部分 该程序用于运行不同参数的模拟 然后将结果返回到单个列表 然后用于生成报告 当并非所有分配的模拟运行都在报告上实际可见时 就会出现问题 从各方面来看 似乎只有分配的运行的一个子集实际
  • 如何计算R中移动窗口内的平均斜率

    我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次 我正在尝试计算移动中的平均坡度20秒窗口 即计算第一个 20 秒斜率值后 窗口向前移动一个时间单位 05 秒 并计算下一个 20 秒窗口 在以下位置生成连续 20 秒斜率值
  • 使用 pracma::findpeaks 识别持续峰值

    我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值 并且我相信该选项peakpat这就是我能做到的
  • 通过间接引用列来修改数据框中的某些值

    我正在整理一些数据 我们将失败的数据分类到垃圾箱中 并按批次计算每个分类箱的有限产量 我有一个描述排序箱的元表 这些行按升序测试顺序排列 一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
  • Dendextend:关于如何根据定义的组为树状图的标签着色

    我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色 我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答 但我仍然不
  • 尝试读取 CSV 文件时出现“无法识别的字符串转义”

    我正在尝试导入一个 csv文件 以便我可以观看此视频 R ggplot2 图形直方图 http www youtube com watch v 47kWynt3b6M 我安装了所有正确的软件包 包括ggplot以及相关的包 视频中的第一个说
  • pyomo + 网状错误 6 句柄无效

    我正在尝试运行pyomo优化 我收到错误消息 Error 6 The handle is invalid 不知道如何解释它 环顾四周似乎与特权有关 但我不太明白 在下面找到完整的错误跟踪以及重现它的玩具示例 完整的错误跟踪 py run f
  • 从命令行运行 R 代码 (Windows)

    我在名为 analysis r 的文件中有一些 R 代码 我希望能够从命令行 CMD 运行该文件中的代码 而无需通过 R 终端 并且我还希望能够传递参数并在我的代码中使用这些参数 例如就像下面的伪代码 C gt execute r scri
  • 使用 R 选择第一个非 NA 值

    df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量 它是每个单独 ID 测试的第一个非 NA 值 对于只有NA的个体
  • R 中的列乘以子字符串

    假设我有一个数据框 其中包含多个组件及其在多个列中列出的属性 并且我想对这些列运行多个函数 我的方法是尝试将其基于每个列标题中的子字符串 但我无法弄清楚如何做到这一点 下面是数据框的示例 Basket F Type 1 F Qty 1 F
  • r 中训练和测试数据的最小最大缩放/归一化

    我正在创建一个函数 它将训练集和测试集作为其参数 最小 最大缩放 标准化并返回训练集并使用这些same最小值和最小 最大范围的值 标准化并返回测试集 到目前为止 这是我想出的功能 min max scaling lt function tr
  • 只读取选定的列

    谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列 例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2
  • 在 r 中的 group_by 之后建模后取消列表列的嵌套

    我想对所有组进行线性回归group by 将模型系数保存在列表列中 然后使用 unnest 扩展列表列 这里我用的是mtcars以数据集为例 注 我想用do here becausebroom tidy 不适用于所有型号 mtcars gt
  • 如何仅删除单括号并保留配对的括号

    你好 我亲爱的老师 R 用户朋友们 我最近开始认真学习正则表达式 最近我遇到了一种情况 我们只想保留配对括号 并省略未配对的 这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou
  • 将不均匀的层次列表转换为数据框

    我认为还没有有人问过这个问题 但是有没有一种方法可以将具有多个级别和不均匀结构的列表的信息组合成 长 格式的数据帧 具体来说 library XML library plyr xml inning lt http gd2 mlb com c
  • read_html(url) 和 read_html(content(GET(url), "text")) 之间的区别

    我正在看这个很棒的答案 https stackoverflow com a 58211397 3502164 https stackoverflow com a 58211397 3502164 解决方案的开头包括 library httr
  • SPSS 中的标准化残差与 R rstandard(lm()) 不匹配

    在寻找 R 相关解决方案时 我发现 R 和 SPSS 版本 24 在计算简单线性模型中的标准化残差方面存在一些不一致 看来SPSS所谓的标准化残差匹配 R学生化残差 我完全不认为某处存在软件错误 但显然这两个程序之间存在差异 看看这个例子
  • 在 ifelse() 语句内部和外部运行一行时的不同输出

    我正在尝试运行一个简单的命令 但不知道为什么在内部和外部运行它时输出不同ifelse 功能 函数条件评估为FALSE 所以输出应该完全相同 但是 单独运行时 输出为0 0 1 1 0 1 0 1 NA 根据需要 但是从ifelse 函数 输
  • 如何将plot中的单变量列表图表转换为ggplot2格式?

    我正在搜索 但仍然找不到一个非常简单的问题的答案 我们如何使用 R 中的 ggplot2 生成一个变量的简单线图 我正在分析时间序列数据 并且想要对图表进行更复杂的操作 我认为如果我使用 ggplot2 代替会更好plot It works
  • 线性判别分析图

    如何将样本 ID 行号 作为标签添加到此 LDA 图中的每个点 library MASS ldaobject lt lda Species data iris plot ldaobject panel function x y points

随机推荐

  • Java:如何检查数组中的元素是否已初始化?

    我想检查数组中的某个元素是否已初始化 我该怎么做 创建数组时 数组中的所有值都会被初始化 初始值可以明确设置 例如X xs x1 xN 或者在实例化数组时分配默认值 对于对象数组 每个元素的默认值是null for a boolean数组
  • 在 Windows Phone 7 上录制扬声器

    您知道是否可以拦截 win Phone 7 上的音频流并记录扬声器上正在播放的内容 或者 我使用 MediaElement 有没有办法获取当前流 我想在达到特定频率时添加一些动画 thanks 只要您知道该媒体的位置并可以启动下载 您就可以
  • Simple_form 必填字段不起作用 - Ruby on Rails

    我在 RoR 应用程序中有一个使用 simple form 构建的提交表单 当字段为空时 应用程序仍会进入下一步 不会提示错误或警告 这些字段应该是默认的required true 但即使手动编写也不起作用 该应用程序有 3 个步骤 New
  • 创建交换链失败

    我正在关注 DX 示例和 MSDN 参考 但现在遇到了困难 我从 D3D11CreateDeviceAndSwapChain 获取 E InvalidArg 的 HRESULT 我知道它是我传递的 IDXGIAdapter 因为如果我将其更
  • Gradle war 清单版本号对于发布版本错误

    我有一个构建 war 文件的 gradle 项目 并包含一个清单 war archiveName archive war manifest attributes Implementation Title project name Imple
  • 无法从 Matplotlib 轴中删除流图箭头

    我怎样才能删除一个流线图 https matplotlib org 3 2 1 api as gen matplotlib pyplot streamplot html来自 Matplotlib 绘图而不清除所有内容 i e 不使用plt
  • LInq 排序依据和排序依据描述

    我正在使用 Linq 来过滤对象列表并对它们进行排序 例如 myList Where x gt x Item SF x AdSize minadSize OrderBy x gt x ManufacturingDate OrderBy x
  • MGTwitterEngine 和 iPhone

    我下载了 MGTwitterEngine 并添加到我的 iPhone 项目中 它正在连接并获取雕像 我可以通过将它们转储到 NSLog 中来判断它们 但是 我不知道如何解析这些调用 以便将它们添加到表中 它们以 NSString 形式返回
  • Grails 应用程序的种子数据

    将种子 初始或测试 数据加载到 grails 应用程序中的最佳方法是什么 我正在考虑 3 个选择 将所有内容放入 BootStrap groovy 文件中 如果领域类和测试数据很多 这会很乏味 编写自定义功能以通过 xml 加载它 借助 g
  • 从小书签加载模式窗口(如亚马逊愿望清单小书签)

    我正在使用一个书签来加载一个 html 页面 一切都很好 但是 由于浏览器的外观通常很丑陋 所以看起来不太热 有没有办法完全无框架加载页面 就像它的 jquery 模态版本一样 我认为它不可能在页面内实现 可以说是覆盖自身 有没有办法可以在
  • 如何从根网站及其所有子网站循环访问

    我遇到了一个需要解决的问题 我想循环访问根网站及其所有子网站 并希望设置一些属性 using System using System Collections Generic using System Linq using System Te
  • 如何将 Swift 对象转换为字典

    我对 iOS 编程还比较陌生 然而 我认为 Swift 会有一种自动方式将对象转换为 JSON 反之亦然 话虽这么说 我已经找到了几个可以做到这一点的库 然而 似乎无论您如何将数据发布到 Web 服务 甚至使用 AlamoFire 之类的东
  • java.lang.InternalError:名称太长而无法表示

    我收到此错误 java lang InternalError name is too long to represent at java lang ClassLoader defineClass1 Native Method at java
  • 使用批处理脚本从文本文件中删除多行字符串

    我正在尝试创建一个批处理文件 该文件将编辑文本文件以删除包含特定字符串的行and之后直接删除该行 该文件的示例如下所示 LINE ENTRY KEEP 1 BLA BLA END LINE ENTRY REMOVE 1 FOO BAR EN
  • Java 小程序 java.security.AccessControlException

    我正在开发一个打印文件的 Java 小程序 该小程序是 自签名的 打印函数为 argFilePath path to file http localhost Teste pdf1 pdf argPrintService something
  • 检查浮点变量是否具有“正常”值

    我如何检查浮点值是否是正常数并且没有任何原始状态 inf ind nan qnan 非正规 用它自己检查身份似乎对 nan 有用 但其他状态呢 抱歉 我忘了提及我与 C90 编译器绑定在一起 您可以使用isnormal macro incl
  • iOS:如何使用 AVAssetWriter 制作包含一系列图像的电影

    我在这里和其他论坛上多次看到这个问题以不同的形式被问到 有些问题得到了解答 有些则没有 有一些回答者或作者声称已经取得了成功 我已经实施了那些声称成功的示例 但尚未看到相同的结果 当从 AVCaptureSession 获取样本缓冲区时 我
  • 如何在 angular2 中禁用 AOT?

    我得到这样的东西 ng build prod no aot 但我无法理解之间有什么区别 ng build prod and ng build prod no aot 更新 适用于 Angular 6 使用以下命令禁用 AOT 模式 ng b
  • @firebase/firestore:Firestore (5.0.4):无法到达 Cloud Firestore 后端。后端10秒内没有响应

    我正在开发一个 Angular 6 项目 这是我构建时遇到的错误 prod标记 主持并运行 我已经坐了很长时间了 最初认为这可能是 firestore 包的问题 我等待着 但现在更新到firestore 5 0 4 问题依然存在 2018
  • 我想在列之间匹配相似的单词

    1 0 2 0 3 0 loud complaint problems pain stress confused dull pain stress 这是我的数据集 我想重新组织行 以便如果每列中出现一个单词 它就会转移到相应的行 例如 1