如何检查小标题中不同行的组合或匹配? [复制]

2023-12-19

我有一个像这样的巨大文件:

library(tidyverse)

test <- structure(list(one = c(5014, 5014, 5014, 5033, 5033, 5033, 5040, 
5040, 5040, 5171, 5171, 5171, 5174, 5174, 5174, 5183, 5183, 5183, 
5193, 5193, 5193, 5304, 5304, 5304), two = c(5033, 5040, 5304, 
5014, 5040, 5304, 5014, 5033, 5304, 5174, 5183, 5331, 5171, 5183, 
5331, 5171, 5174, 5331, 5161, 1538, 5190, 5014, 5033, 5040)), row.names = c(NA, 
-24L), class = c("tbl_df", "tbl", "data.frame"))

两列中的数字以(递归?)方式与其他数字匹配(抱歉,我不知道如何更好地解释它)。在这个示例中,很明显(对于人类,而不是计算机)只有三个组。我怎样才能分开这些组?

我所需要的就是这样的:

组号
1 5014
1 5033
1 5040
1 5304
2 5171
2 5174
2 5183
2 5331
3 5193
3 5161
3 1538
3 5190

我想多个自连接是可能的,但这似乎非常乏味......


With igraph:

library(igraph)
graph_from_data_frame(test) |>
  components() |>
  getElement("membership") |>
  stack() |>
  arrange(values)

output

   values  ind
1       1 5014
2       1 5033
3       1 5040
4       1 5304
5       2 5171
6       2 5174
7       2 5183
8       2 5331
9       3 5193
10      3 5161
11      3 1538
12      3 5190
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何检查小标题中不同行的组合或匹配? [复制] 的相关文章

  • 如何计算R中移动窗口内的平均斜率

    我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次 我正在尝试计算移动中的平均坡度20秒窗口 即计算第一个 20 秒斜率值后 窗口向前移动一个时间单位 05 秒 并计算下一个 20 秒窗口 在以下位置生成连续 20 秒斜率值
  • 使用 pracma::findpeaks 识别持续峰值

    我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值 并且我相信该选项peakpat这就是我能做到的
  • 通过间接引用列来修改数据框中的某些值

    我正在整理一些数据 我们将失败的数据分类到垃圾箱中 并按批次计算每个分类箱的有限产量 我有一个描述排序箱的元表 这些行按升序测试顺序排列 一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
  • Dendextend:关于如何根据定义的组为树状图的标签着色

    我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色 我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答 但我仍然不
  • 从命令行运行 R 代码 (Windows)

    我在名为 analysis r 的文件中有一些 R 代码 我希望能够从命令行 CMD 运行该文件中的代码 而无需通过 R 终端 并且我还希望能够传递参数并在我的代码中使用这些参数 例如就像下面的伪代码 C gt execute r scri
  • 使用 R 选择第一个非 NA 值

    df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量 它是每个单独 ID 测试的第一个非 NA 值 对于只有NA的个体
  • 将每列的值乘以 R 中另一个 data.frame 中的权重

    我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
  • r 中训练和测试数据的最小最大缩放/归一化

    我正在创建一个函数 它将训练集和测试集作为其参数 最小 最大缩放 标准化并返回训练集并使用这些same最小值和最小 最大范围的值 标准化并返回测试集 到目前为止 这是我想出的功能 min max scaling lt function tr
  • ggplot2 geom_密度和geom_histogram在一个图中

    如何制作一个所有条形加起来为 1 的直方图 并在适合的上方添加一个密度层 set seed 1234 df lt data frame sex factor rep c F M each 200 weight round c rnorm 2
  • 如何在文本集中创建所有字符组合?

    例如 我有这样的文本集 第 1 栏 a b 第 2 栏 l m n 第 3 栏 v w x y 我想将它们组合起来以获得如下输出 alv alw alx aly amv amw amx amy 这将输出 24 种文本组合 如果我只使用前两列
  • 将数据框中重叠的范围合并到唯一的组中

    我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
  • 使用 Shiny 发布平行坐标图表时出现“错误:路径[1]="”:没有这样的文件或目录”

    我有一个似乎很常见但我还没有找到解决方案的问题 当尝试使用 rCharts Parcoords 发布 Web 应用程序时 出现以下错误 错误 路径 1 没有这样的文件或目录 奇怪的是 该应用程序在我的笔记本电脑上运行得很好 下面是我正在使用
  • ddply 和aggregate 之间的区别

    有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别 数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
  • 在 r 中的 group_by 之后建模后取消列表列的嵌套

    我想对所有组进行线性回归group by 将模型系数保存在列表列中 然后使用 unnest 扩展列表列 这里我用的是mtcars以数据集为例 注 我想用do here becausebroom tidy 不适用于所有型号 mtcars gt
  • 如何仅删除单括号并保留配对的括号

    你好 我亲爱的老师 R 用户朋友们 我最近开始认真学习正则表达式 最近我遇到了一种情况 我们只想保留配对括号 并省略未配对的 这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou
  • 在 Rcpp 中使用其他包中的 C 函数

    我试图从 C 函数中的 cubature 包调用 C 例程来执行多维积分 我试图重现的基本 R 示例是 library cubature integrand lt function x sin x adaptIntegrate integr
  • 如何在 R 中匹配多个 ggplot2 图中的调色板?

    自从被问到这个问题以来已经有一段时间了 但我知道一个事实 我很快就会提取新数据 我想弄清楚如何用这种技术来绘制它 看起来评论和答案中的人知道如何做到这一点 但我无法完全弄清楚所给我的内容 还有人想尝试一下吗 我正在尝试使用具有多个级别的因子
  • 使用 ggmap 截断密度多边形

    我在使用 R ggmap 绘制密度图时遇到问题 我的数据如下所示 gt head W date lat lon dist 1 2010 01 01 31 942 86 659 292 415 2 2010 01 10 32 970 84 1
  • 如何绘制具有显着性水平的箱线图?

    前段时间问了一个关于绘制箱线图的问题Link1 https stackoverflow com questions 14604439 plot multiple boxplot in one graph 我有一些包含 3 个不同组 或标签
  • 如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型

    我想评估同一数据集上多个 主要是 线性回归模型的性能 我想也许使用tidymodels包连同workflowsets workflow set 可能会起作用 我按照这个例子here https workflowsets tidymodels

随机推荐

  • AchartEngine简单动画

    是否可以使用 achartengine 库来制作它 以便在绘制图表时使其看起来像动画一样 就像柱形图的情况一样 柱形图是从屏幕底部缓慢向上移动的 您可以拥有动态图表 这意味着您可以在运行时添加数据 然后更新图表 但您不能在 AChartEn
  • 如何使用 spacy 的词形还原器将单词转化为基本形式

    我是 spacy 的新手 我想使用它的 lemmatizer 函数 但我不知道如何使用它 就像我进入单词字符串一样 它将返回具有单词基本形式的字符串 例子 单词 gt 单词 做了 gt 做 谢谢 之前的答案很复杂 无法编辑 所以这里是一个更
  • 无法读取 VR 路径注册表 - Selenium Webdriver

    我正在尝试使用 Selenium 和 java 执行测试用例 但页面未完全加载 并且我在 eclipse 控制台中收到此消息 无法读取 VR 路径注册表 这个消息是什么意思 这是代码 FirefoxDriver driver new Fir
  • UITableView reloadData - 如何停止闪烁

    我有 UITableView 闪烁的问题 我有一个hidden我想在向用户显示之前刷新 UITableView 这样做会导致表视图在再次隐藏之前非常短暂地显示在所有其他子视图之上 即使这样的代码也没有帮助 self tableView hi
  • 如何在 Chrome 中显示图像的替代文本

    来源无效的图像在 Firefox 中显示替代文本 但在 Chrome 中不会显示 除非调整图像的宽度 img height 90 width 90 src http www google com intl en ALL images log
  • 根据参数值返回不同类型的通用函数

    我有一个保存寄存器的结构 我想要我的read register函数返回一个u8 for Register V0 and Register V1 but a u16 for Register V2 and Register V3 我不确定如何
  • 在 RowDataBound 上添加 CSS 类

    我正在尝试将 CSS 类附加到 RowDataBound 上的一行 我正在针对 GridView 使用交替 css 类属性 因此我假设这适用于 RowDataBound 如果您以编程方式将 CSS 类分配给 RowDataBound 事件中
  • 为什么encode_base64给我TypeError:预期的类似字节的对象,而不是NoneType

    我有一个错误 TypeError 预期类似字节的对象 而不是 NoneType 错误源自 encoders encode base64 eml atch 第 56 行 import smtplib from email mime multi
  • 使用 CSS 垂直居中多个框

    我需要将多个不同高度的盒子垂直居中 我不知道盒子的高度 因为它们是可变文本 我怎样才能用 CSS 做到这一点 无需使用 td 和 valign 尝试过display table cell但好像不兼容IE 下图是设计图 便利贴是浏览器窗口 删
  • Powershell Invoke-Sqlcmd 捕获详细输出

    我正在尝试捕获 Powershell 中 Invoke Sqlcmd 的详细输出 任何人有任何想法可以做到这一点 i e Invoke Sqlcmd Query PRINT Hello World ServerInstance Server
  • 情节上相当于 pd.DataFrame.hist

    我正在寻找一种模仿的方法hist的方法pandas DataFrame情节地使用 这是一个使用的示例hist method import seaborn as sns import matplotlib pyplot as plt load
  • 使用 QWebPage 抓取多个 url

    我正在使用 Qt 的 QWebPage 来呈现一个使用 javascript 动态更新其内容的页面 因此仅下载页面静态版本的库 例如 urllib2 将无法工作 我的问题是 当我渲染第二页时 大约 99 的情况下程序都会崩溃 其他时候 它会
  • SQL Server Reporting Services - 设置多值报表参数的默认值

    我在 SSRS 中有一份报告 我使用的参数之一是城市 用户可以从城市列表中进行选择 以提取该位置或多个位置的报告 我的数据集只是从 tblCities 中选择 当我运行报告时 我确实看到选项之一是 全选 但是 我想知道 有没有办法可以将此
  • 如何将 Supervisor + Django + Celery 与多个队列和 Worker 一起使用?

    我正在使用 Celery Django Supervisord 并且尝试通过创建 3 个不同的队列来设置 优先级 如建议的那样 https stackoverflow com a 15827160 54872 https stackover
  • 如何转换从模块返回的对象

    我尝试ModuleLayer使用 JDK 11 我创建了两个模块Implementation and Model 考虑Implementation模块提供了一个方法 该方法返回一个类型的对象Foo 班上Foo定义于Model module
  • 用户是否可以使用我的 api 在第三方网站上通过 facebook 注册我的应用程序

    我有一个 Rails 应用程序 允许第三方网站将我的小部件嵌入到他们的网站上 我的应用程序的部分功能要求人们 链接 他们的 Facebook 帐户 这可以通过小部件来完成吗 他们可以通过第三方网站上的小部件将 Facebook 链接到我的应
  • 选择框选项的边框底部在 Chrome 上不起作用

    我想underline上的禁用选项select盒子 看我的代码 CODE myselect option font size 13px color 1A1F24 myselect option disabled font size 11px
  • 如何使用 JetBrains Runtime 运行 IntelliJ IDEA

    我正在尝试激活连字按照此中的说明 IntelliJ IDEA 2016 2 中的一个新功能video https www youtube com watch v pKCKwI bfG0但缺少字体 当使用 64 版本时我得到这个提示 您运行
  • 如何获取OS X系统版本?

    我想获取 OS X 系统版本 例如 10 5 4 10 4 8 等 我想在我的应用程序中获取它 我该怎么做 谢谢 您可以阅读 System Library CoreServices SystemVersion plist 中的属性列表并提取
  • 如何检查小标题中不同行的组合或匹配? [复制]

    这个问题在这里已经有答案了 我有一个像这样的巨大文件 library tidyverse test lt structure list one c 5014 5014 5014 5033 5033 5033 5040 5040 5040 5