旋转数据框以保留 R 中的列标题和子标题

2024-01-15

我正在尝试旋转一个包含标题和副标题的表格，以便标题进入“日期”列，并且副标题是两列而不是重复。

这是我的数据的示例。

这是使用制作的dput()，因此在原始 Excel 文件中，每个日期都跨越两个子标题（“蓝色”和“绿色”），在 R 中，这些空白单元格被重新命名为 X.1、X.2 等。

table <- "          X    X.1 X02.Jul.12   X.2 X03.Jul.12   X.3 X04.Jul.12   X.4
1  category number       blue green       blue green       blue green
2         G      1          1     0          1     0          1     0
3         G      2          2    99          2    99          1    99
4         G      3          1     1          1    99          1    99
5         G      4          1     1          1     1          2    99
6         G      5          1     0          1     0          1    99
7         G      6          1    99          1     1          1    99
8         G      7          1     0          1     0          1     0
9         G      8          1     1          1     1          1    99
10        G      9          1     1          1     1          1     1
11        H      1          1     1          1     1          1     1
12        H      2          1    99          1     0          1     0
13        H      3          1     1          1     1          1    99
14        H      4          1    99          1     2          1    99
15        H      5          1     1          1     1          1     1
16        H      6          1     0          1     0          1    99
17        H      7          1     1          2     1          1    99
18        H      8          2     0          2     0          1     1
19        H      9          2     0          2     0          1     1"

#Create a dataframe with the above table
df <- read.table(text=table, header = TRUE)
df

下面是 Excel 中的示例：

这是我想要实现的期望输出：

虽然这可以在 Excel 中手动完成，但我有多个包含超过 100 个日期/列的文件，因此更愿意找到一种在 R 中清理它的方法。

任何帮助，将不胜感激！

Excel 代表

下面是数据集的表示，就好像它是从 Excel 中读取的，没有进行名称更正：

# Define the dataset.
df_excel <- structure(
  list(
    c("category", "G", "G", "G", "G", "G", "G", "G", "G", "G", "H", "H", "H", "H", "H", "H", "H", "H", "H"),
    c("number", "1", "2", "3", "4", "5", "6", "7", "8", "9", "1", "2", "3", "4", "5", "6", "7", "8", "9"),
    `02.Jul.12` = c("blue", "1", "2", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "2", "2"),
    c("green", "0", "99", "1", "1", "0", "99", "0", "1", "1", "1", "99", "1", "99", "1", "0", "1", "0", "0"),
    `03.Jul.12` = c("blue", "1", "2", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "2", "2", "2"),
    c("green", "0", "99", "99", "1", "0", "1", "0", "1", "1", "1", "0", "1", "2", "1", "0", "1", "0", "0"),
    `04.Jul.12` = c("blue", "1", "1", "1", "2", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1"),
    c("green", "0", "99", "99", "99", "99", "99", "0", "99", "1", "1", "0", "99", "99", "1", "99", "99", "1", "1")
  ),
  class = "data.frame",
  row.names = c("1", "2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13", "14", "15", "16", "17", "18", "19")
)

# Save dataset in Excel file ('reprex.xlsx') for reproducibility.
openxlsx::write.xlsx(x = df_excel, file = "./reprex.xlsx")

df %>%
  set_names(enframe(unlist(df[1,])) %>%
  mutate(name = na_if(name, ''))%>%
  fill(name)%>%
  transmute(nms = coalesce(str_c(name, value, sep='_'), value)) %>%
  pull(nms)) %>%
  slice(-1)%>%
  type.convert(as.is = TRUE)%>%
  pivot_longer(-c(category, number), names_to = c('Date', '.value'), 
               names_sep = '_', names_transform = list(Date = dmy)) %>%
  arrange(category, Date, number)

# A tibble: 54 x 5
   category number Date        blue green
   <chr>     <int> <date>     <int> <int>
 1 G             1 2012-07-02     1     0
 2 G             2 2012-07-02     2    99
 3 G             3 2012-07-02     1     1
 4 G             4 2012-07-02     1     1
 5 G             5 2012-07-02     1     0
 6 G             6 2012-07-02     1    99
 7 G             7 2012-07-02     1     0
 8 G             8 2012-07-02     1     1
 9 G             9 2012-07-02     1     1
10 G             1 2012-07-03     1     0
# ... with 44 more rows

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Pivot

pivottable

tidyr

datacleaning

旋转数据框以保留 R 中的列标题和子标题的相关文章

如何让 print() 将参数传递给 R 中用户定义的打印方法？

我在 R 中定义了一个 S3 类它需要自己的打印方法当我创建这些对象的列表并打印它时 R 按其应有的方式对列表中的每个元素使用我的打印方法我想对打印方法实际显示的数量进行一些控制因此我的类的 print 方法需要一些额外的参数但
替换列表列表中的元素

The applyR 中的函数是简化 for 循环以获得输出的好方法是否有一个等效的函数可以帮助人们在替换向量的值时避免 for 循环通过示例可以更好地理解这一点 Take this list for example x list li
基于服务器中的条件逻辑呈现闪亮的用户输入

我正在尝试设置一个闪亮的导航栏面板页面其中用户控制我根据一组单选按钮中所做的初始选择来显示更改我直接在 ui 中渲染单选按钮然后在 Server r 中的观察到的逻辑控制结构内构建条件控件弹出错误是因为我的初始 if 语句计算结
ggplot2可以在一个图例中分别控制点大小和线大小（线宽）吗？

一个使用的例子ggplot2绘制数据点组和连接每组均值的线并使用相同的映射aes for shape并为linetype p lt ggplot mtcars aes gear mpg shape factor cyl linetype
如何在R中删除重复项

我有一个非常大的数据集如下所示 df lt data frame school c a a a b b c c c year c 3 3 1 4 2 4 3 1 GPA c 4 4 4 3 3 3 2 2 school year GPA
将年月格式转换为 POSIXct [重复]

这个问题在这里已经有答案了我有一些年月形式的数据我想将其格式化以用于绘图ggplot date lt c 2016 03 2016 04 2016 05 2016 06 2016 07 2016 08 2016 09 2016 10 2
如何在for循环中引用变量？

我正在循环访问不同的 data tables 和 data table 中的变量但我在引用内部变量时遇到问题for loop dt1 lt data table a1 c 1 2 3 a2 c 4 5 2 dt2 lt data tabl
在shiny中过滤传单地图数据

我在用传单地图设置这个闪亮的东西时遇到了麻烦我的原帖 https stackoverflow com questions 50111566 applying leaflet map bounds to filter data within
如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
使用 purrr 迭代替换数据帧列中的字符串

我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
透视包含字符串的 Pandas Dataframe - “没有要聚合的数字类型”错误

关于此错误有很多问题但环顾四周后我仍然无法找到解决解决方案我正在尝试用字符串旋转数据框以使一些行数据变成列但到目前为止还没有成功我的 df 的形状
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
尝试读取 CSV 文件时出现“无法识别的字符串转义”

我正在尝试导入一个 csv文件以便我可以观看此视频 R ggplot2 图形直方图 http www youtube com watch v 47kWynt3b6M 我安装了所有正确的软件包包括ggplot以及相关的包视频中的第一个说
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
pyomo + 网状错误 6 句柄无效

我正在尝试运行pyomo优化我收到错误消息 Error 6 The handle is invalid 不知道如何解释它环顾四周似乎与特权有关但我不太明白在下面找到完整的错误跟踪以及重现它的玩具示例完整的错误跟踪 py run f
twitterR 和 ROAuth R 软件包安装

我在安装 CRAN 上的 twitteR 和 RAOuth 软件包时遇到一些问题我尝试了几种不同的方法在 Windows 下使用源代码在 Ubuntu 下使用 RStudio 我尝试了以下命令 sudo apt get install
使用 pandas 中的数据透视表进行加权平均

我编写了一些代码来使用 pandas 中的数据透视表计算加权平均值但是我不确定如何添加执行加权平均的实际列添加一个新列其中每行包含累积计数值数据看起来像这样 VALUE COUNT GRID agb 1 43 1476 10
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
在 R 格子包中微调点图

我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域我有三个变量方案指定所使用的算法数据集是正在测试算法的数据集以及 Area under ROC 我正在 R 中使用lattice库命令如下点图方案 Area und
如何仅删除单括号并保留配对的括号

你好我亲爱的老师 R 用户朋友们我最近开始认真学习正则表达式最近我遇到了一种情况我们只想保留配对括号并省略未配对的这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou

随机推荐

发出局部变量并为其赋值

我正在初始化一个整数变量如下所示 LocalBuilder a ilGen DeclareLocal typeof Int32 我如何访问它并为其赋值我想做这样的事情 int a b a 5 b 6 return a b Use the
在 Python 中进行自动属性分配的最佳方法是什么？这是一个好主意吗？

而不是每次定义类时都编写这样的代码 class Foo object def init self a b c d e f g self a a self b b self c c self d d self e e self f f sel
php刷新当前页面？

我有一个页面如果设置了变量在会话中它会执行一个动作然后它会取消会话现在它必须自我更新这就是我被困住的地方有没有办法获取当前页面的确切 url 或者有一个函数可以做到这一点吗 so header location header
使用 SVG 仅填充半颗星

对于我正在构建的评级系统有没有办法向这个 svg 示例添加一个 css 类以便它只显示填充的一半星号参见jsbin http jsbin com cifip 2 http jsbin com cifip 2 在此示例中当前填充为黄色
TinyMCE 增加字体系列下拉字体大小

有谁知道如何增加 TinyMCE 中字体系列下拉列表项的字体大小 Thanks 您需要创建一个自己的 css 文件并使用 tinymce 配置参数 content css your css file css 您的 css 文件必须包含以
gradle 存储库指向具有多个库的本地目录

我对本地存储库的 build gradle 中的构建依赖项有疑问即使用本地目录 dependencies compile fileTree include jar dir libs 它只解决libs目录中的依赖关系还是解决lib目录中所有
获取经过身份验证的 Facebook 用户的年龄，无需进一步的权限提示

使用 Facebook Graph API 是否可以在不首先提示用户年龄或年龄范围的情况下获取用户的年龄或年龄范围 user birthday or friends birthday允许你不能年龄要求user birthday o
我需要帮助使用 Knockout 格式化数据绑定

我对 Knockout 相当陌生我正在寻找格式化输出的方法我看到了一个类似这样的例子但我的尝试当然是行不通的这是 jsfiddle 的链接 http jsfiddle net cezmp http jsfiddle net cezm
Django的URL字段测试问题

有人可以解释一下为什么这个网址吗http www nacolmeia com br do Home oferta EnERURLField 的 Django 生成的表单不被接受 Thanks 您是否在尝试验证该网站的同一台服务器上托管该网站
Faye 和 Nodejs：如何运行 Faye 服务器端客户端？

我正在尝试开发一个 Faye 服务器端客户端以根据需要自动运行在Faye的官方网站上我只找到了关于服务器端客户端的文档没有关于如何运行它的信息请告诉我该怎么做谢谢文档中缺少一个关键部分看来你需要打电话client connec
为什么 PHP 4.4.9 抛出“解析错误：语法错误，意外的 T_STATIC”？ [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我刚刚意识
Spring：@Component 与 @Bean

我明白那个 Component注解是在 spring 2 5 中引入的目的是通过使用类路径扫描来摆脱 xml bean 定义 Bean于 spring 3 0 中引入可与 Configuration为了完全摆脱 xml 文件并使用 ja
线程状态阻塞和等待之间的区别[重复]

这个问题在这里已经有答案了我已通过以下帖子阅读了答案 WAIT 和 BLOCKED 线程状态之间的区别 https stackoverflow com questions 15680422 difference between wait
我可以扩展 Button 以添加右键单击事件，同时也保留图形副作用吗？

我正在尝试扩展 Button 以添加右键单击事件我的客户想要一个按钮来执行不同的操作具体取决于您是左键单击还是右键单击我预计会有一个简单的右键单击事件但事实证明没有我希望 Button 的视觉行为与预先存在的 Click 事件相同
当部分在页面上滚动时处于活动状态时，突出显示目录中的项目

当您向下滚动页面时我试图突出显示粘性目录中的当前部分项目目前的结构是这样的 div div div div h2 Header h2 div content div div div div div 目录如下 ul li a href I
Makefile 将目录中的所有 cpp 文件编译为单独的可执行文件

我现在正在学习C 我想要一个 makefile 它将编译当前目录中的所有 cpp 文件以分离可执行文件例如一个目录下有3个c 文件比如考试1 cpp 考试2 cpp and 示例3 cpp 我想要一个 makefile 来编译和链接它
如何覆盖 console.log() 并在输出的开头添加一个单词？

我有一个 Log 函数它可以打印数据以及传递的参数如何打印内容并同时始终在日志开头打印单词 Report function Log if app debug logs if console console log console log
加特林使一个场景在一系列场景中运行一次

我有一个场景我必须执行某些步骤但我不希望用户多次登录所以我链接了这些场景但登录仍然发生多次有没有办法限制部分链只运行一次 class CreateUserSimulation extends Simulation val logi
硒：无法定位元素

我正在尝试切换到框架但 Selenium 无法找到该元素这是我在定位之前使用 Selenium 获得的 HTML 代码 div class jqmPopOverlay style height 100 width 100 div div
旋转数据框以保留 R 中的列标题和子标题

我正在尝试旋转一个包含标题和副标题的表格以便标题进入日期列并且副标题是两列而不是重复这是我的数据的示例这是使用制作的dput 因此在原始 Excel 文件中每个日期都跨越两个子标题蓝色和绿色在 R 中这些空白单元格被

旋转数据框以保留 R 中的列标题和子标题

Excel 代表

旋转数据框以保留 R 中的列标题和子标题 的相关文章

随机推荐

热门标签

旋转数据框以保留 R 中的列标题和子标题的相关文章