如何将包含多个部分的 CSV 文件导入到 R 中?

2024-02-08

我想将csv文件的内容导入到R中,csv文件垂直包含多个数据部分,由空行和星号分隔。例如

********************************************************
* SAMPLE DATA ******************************************
********************************************************
Name, DOB, Sex
Rod, 1/1/1970, M
Jane, 5/7/1980, F
Freddy, 9.12,1965, M

*******************************************************
*  Income Data ****************************************
*******************************************************
Name, Income
Rod, 10000
Jane, 15000
Freddy, 7500

我想将其作为两个单独的数据帧导入到 R 中。目前,我正在手动将 csv 文件切割成更小的文件,但我想我可以使用 read.csv 以及 read.csv 的跳过和 nrows 设置来完成此操作,如果我能找出分节符在哪里。

这给了我每个空行的逻辑 TRUE

ifelse(readLines("DATA.csv")=="",TRUE,FALSE)

我希望有人已经解决了这个问题。


在这种情况下,我会做类似的事情:

# Import raw data:
data_raw <- readLines("test.txt")

# find separation line:
id_sep <- which(data_raw=="")

# create ranges of both data sets:
data_1_range <- 4:(id_sep-1)
data_2_range <- (id_sep+4):length(data_raw)

# using ranges and row data import it:
data_1 <- read.csv(textConnection(data_raw[data_1_range]))
data_2 <- read.csv(textConnection(data_raw[data_2_range]))

实际上你的第一个示例集结构不一致,所以data_1看起来很奇怪。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将包含多个部分的 CSV 文件导入到 R 中? 的相关文章

  • 有谁知道一种更快的方法来执行 String.Split() 吗?

    我正在读取 CSV 文件的每一行 并且需要获取每一列中的各个值 所以现在我只是使用 values line Split delimiter where line是保存由分隔符分隔的值的字符串 衡量我的表现ReadNextRow我注意到它花费
  • 从命令行运行 R 代码 (Windows)

    我在名为 analysis r 的文件中有一些 R 代码 我希望能够从命令行 CMD 运行该文件中的代码 而无需通过 R 终端 并且我还希望能够传递参数并在我的代码中使用这些参数 例如就像下面的伪代码 C gt execute r scri
  • API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误:SSL 证书问题:证书已过期

    几天前 我运行了代码几个月 没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
  • 在 R 格子包中微调点图

    我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域 我有三个变量 方案 指定所使用的算法 数据集 是正在测试算法的数据集 以及 Area under ROC 我正在 R 中使用lattice库 命令如下 点图 方案 Area und
  • R 中的列乘以子字符串

    假设我有一个数据框 其中包含多个组件及其在多个列中列出的属性 并且我想对这些列运行多个函数 我的方法是尝试将其基于每个列标题中的子字符串 但我无法弄清楚如何做到这一点 下面是数据框的示例 Basket F Type 1 F Qty 1 F
  • r 中训练和测试数据的最小最大缩放/归一化

    我正在创建一个函数 它将训练集和测试集作为其参数 最小 最大缩放 标准化并返回训练集并使用这些same最小值和最小 最大范围的值 标准化并返回测试集 到目前为止 这是我想出的功能 min max scaling lt function tr
  • ddply 和aggregate 之间的区别

    有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别 数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
  • 文本挖掘 pdf 文件/词频问题

    我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到 当我挖掘一些 pdf 文档时 我得到的高频词是 phi taeoe toe sigma gamma 等 它与某些 pdf 文档配合良好 但与其他文档配合使用时却得到这
  • 如何从 R keras 中的类似生成器的数据中评估()和预测()

    我有以下代码 数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
  • 计算 R 中各列的唯一值

    我正在尝试创建一个新变量 其中包含来自两个不同列的字符串值的唯一计数 所以我有这样的东西 例如 A tibble 4 x 2 names partners
  • 如何在 R 中匹配多个 ggplot2 图中的调色板?

    自从被问到这个问题以来已经有一段时间了 但我知道一个事实 我很快就会提取新数据 我想弄清楚如何用这种技术来绘制它 看起来评论和答案中的人知道如何做到这一点 但我无法完全弄清楚所给我的内容 还有人想尝试一下吗 我正在尝试使用具有多个级别的因子
  • 为什么 R 更新后 sim_slopes() 中会出现此错误?

    我正在尝试使用 交互 包来创建简单斜率的约翰逊 尼曼图 但是 当尝试运行 sim slopes 函数时 出现以下错误 直到我将R更新到4 2 2 我才没有遇到这个问题 我使用的是 macOS Ventura 13 1 Error class
  • 使用 ggmap 截断密度多边形

    我在使用 R ggmap 绘制密度图时遇到问题 我的数据如下所示 gt head W date lat lon dist 1 2010 01 01 31 942 86 659 292 415 2 2010 01 10 32 970 84 1
  • 将不均匀的层次列表转换为数据框

    我认为还没有有人问过这个问题 但是有没有一种方法可以将具有多个级别和不均匀结构的列表的信息组合成 长 格式的数据帧 具体来说 library XML library plyr xml inning lt http gd2 mlb com c
  • R“错误:“}”中出现意外的“}”[重复]

    这个问题在这里已经有答案了 我有一个字符串变量 对于缺少数据的情况 它具有 空值 我想将 空值 重新编码为缺失 而不是说 空值 我正在尝试编写一个循环来删除这些 空值 条目 但我不断收到错误 错误 中出现意外的 for row in dat
  • 使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

    我有一个 CSV 文件 我正在使用 Python 来解析该文件 我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
  • 条件字体颜色 R Markdown

    我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
  • R:使用 tidyverse 将 NA 替换为 df 中的其他变量

    我想使用 tidyverse 替换 df 中的 NA 值 我想要的值应该从其他列中计算出来 input ID X1 X2 X3 A 0 96 NA 0 97 B 1 00 NA 1 01 C 0 98 0 03 NA A 1 00 NA 1
  • 使用 template.docx 从 Shiny App 编织 Word 文档

    我正在尝试使用 template docx 文件从闪亮的应用程序编写一个 Word 文档 我收到以下错误消息 pandoc exe template docx openBinaryFile 不存在 没有这样的文件或目录 以下 3 个文件当前
  • 如何修复 R 中 Kaplan Meier 图的风险表计算错误

    以下是一个数据帧 其中 6 个参与者中的每一个都有唯一的 record ID 我想绘制一个生存分析图 其中包含感兴趣事件的复发以及在时间间隔 tstart 到 tstop 内 暴露 药物剂量 数值变量 的时间依赖性协变量 每个参与者的最大

随机推荐

  • 第一次从 MVC 站点访问时,WCF 服务返回“请求的服务‘...’无法激活”

    我们有一个由 MVC3 网站访问的 WCF 服务 没有安全性 在开发人员计算机上 我们没有任何问题 但是当我们的 TeamCity 设置构建中央版本并将其部署在 IIS7 下时 我们第一次加载 MVC3 站点并且它访问 WCF 服务 服务调
  • 在 Delphi 中如何位反映一个字节?

    在Delphi中是否有一种简单的方法来位反映字节变量 以便最高有效位 MSB 获得最低有效位 LSB 反之亦然 在代码中你可以这样做 function ReverseBits b Byte Byte var i Integer begin
  • 具有派生接口的 C# 接口实现

    在下面的示例中 类 SomeClass 没有实现 ISomeInterface 为什么我不能通过传递一个更派生的接口来实现这一点 该接口确实实现了基本要求 无论传递什么实例 它仍然会实现基础 我是否遗漏了什么 namespace Test
  • 搜索标签,然后将标签之间的文本保存为变量

    我对 Java 很陌生 但是我如何在文件中搜索标签 然后标签之间的所有内容 如文本字符串 将被分配给一个变量 例如 我有 但后来我想将字符串 THE TITLE 保存到一个名为 title1 的变量或其他变量中 我应该怎样做呢 谢谢 如果你
  • 结构赋值是否保证填充也相等

    假设我有一个包含 2 个字段的结构 并且我的 C 实现在这些字段之间也有一些填充 如果我创建结构体的两个变量并将一个变量分配给另一个变量 是否可以保证填充相等 我知道对于大多数编译器来说都是如此 因为它们只是调用 memcpy 但我想知道标
  • DB.eval() 与 Mongo Java 驱动程序

    我准备了一些在 Mongo 上执行的脚本 它按照命令行的预期工作 mongo 127 0 0 1 27017 dbName script js 但是当我尝试在 java scala 代码中移动它时 它不起作用 db eval scriptC
  • SQL Server 中 mysql“LIMIT”子句的等效语法是什么

    SQL Server 中 MySQL LIMIT 子句的等效语法是什么 我想用它来对我的结果进行分页 想要显示记录5到10 最接近的是 TOP Select top 5 from tablename 您可以获得一个范围 第 5 10 行 S
  • SAPUI5 路由配置中“controlAggregation”的含义是什么?

    我真的不明白下面的属性 controlAggregation 对于路由 SAPUI5 应用程序有何作用 不存在具有该 id 的元素 我在此处找到的演示应用程序中的任何位置都找不到对 页面 的任何引用 SAPUI5路由演示 https sap
  • java indexof(String str) 方法复杂性[重复]

    这个问题在这里已经有答案了 可能的重复 String indexof 函数调用的成本 复杂性是多少 https stackoverflow com questions 3562919 what is the cost complexity
  • 使用未声明的类型“PHAsset”BSImagePicker

    我在 swift 中从 CocoaPods 导入了一个模块 我做了所有需要做的事情 而且它也有效 因为模块已成功导入 我现在想测试 BSimagepicker 的一些演示脚本 但它显示未声明的类型 PHAsset 我需要做的是选择不同的图像
  • 如何在 Spark RDD 中比较不区分大小写的字符串?

    我有以下数据集 drug name num prescriber total cost AMBIEN 2 300 BENZTROPINE MESYLATE 1 1500 CHLORPROMAZINE 2 3000 想要从上面的数据集中找出
  • 以编程方式安装 Chrome 扩展程序

    我知道这个问题已经被问了很多 我读了所有这些 但找不到与我的问题相关的任何内容 所以再次询问 我做了一个简单的 chrome 扩展 还使用 chrome 将其打包为 crx 我想使用 nsis 或 C 安装程序以编程方式安装它 从这里得到一
  • 将 setDate 与 jQueryUi 日期选择器结合使用

    我正在尝试将另一个日期选择器的日期设置为距原始日期选择器关闭整整 1 年 我有以下代码 myDatepicker1 datepicker onClose function dateText inst myDatepicker2 datepi
  • 蟒蛇+igrph。类型错误:绘图不可用

    我想使用python笔记本 igraph包来画图 示例代码在这里 我认为是对的 pip install cairocffi import cairocffi as cairo corlor for i in g vs name if set
  • 适用于 Android 的 YouTube Api 异常“service_missing”

    我想在我的 Android 应用程序中播放 YouTube 视频 我在 YouTube 初始化时遇到异常 例如 service missing 我写下面的代码 package com example youtubedemo import a
  • 现在 Xna 不受支持,什么是更好的选择? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 节点 UnhandledPromiseRejectionWarning

    我的 npm 包有一个问题 就像这个问题 但我不知道如何解决 什么是未处理的 Promise 拒绝 https stackoverflow com questions 40500490 what is unhandled promise r
  • Android 手机中的部分唤醒锁功耗

    我正在创建一个远程服务来保持 PARTIAL WAKE LOCK 以便不断地 做一些后台工作 我预计 Android 设备的功耗范围是多少 由此 在我的设备上 从充满电开始测量 电池续航时间在 30 分钟到 2 小时之间 None
  • 如何使用 XMLHttpRequest 在后台下载 HTML 页面并从中提取文本元素?

    我想制作一个 Greasemonkey 脚本 当您在 URL 1 中时 该脚本会在后台解析 URL 2 的整个 HTML 网页 以便从中提取文本元素 具体来说 我想下载整个页面的 HTML 代码 a烂番茄page 在后台并将其存储在变量中
  • 如何将包含多个部分的 CSV 文件导入到 R 中?

    我想将csv文件的内容导入到R中 csv文件垂直包含多个数据部分 由空行和星号分隔 例如 SAMPLE DATA Name DOB Sex Rod 1 1 1970 M Jane 5 7 1980 F Freddy 9 12 1965 M