将 txt 文件读入 R 时遇到问题，其中列由 || 分隔

2023-12-13

我在尝试读取包含 561366 行和 15 列的 .txt 文件时遇到问题。第一行看起来像这样：

  70000||Consumer A||23||DN||70000||10038782||1||SI||2||NO||0||N/A||0||N/A||1
  90000||Consumer B||23||DN||90000||15402432||1||SI||2||NO||0||N/A||0||N/A||1 
  .
  .
  .

我用来读取文件的代码是：

  Datos <- read.table("C:/Users/hernandezn/Desktop/DataSets/INACTIVOS.txt", 
  header=FALSE, sep="|", na.strings="N/A", dec=".", strip.white=TRUE)

如您所见，我的列由"||"，但我不能在 R 命令中使用它read.table as asep选项。所以，我用过sep="|"并且必须为此付出代价（现在我有 29 列）。

问题是我只从文件中的 561366 行中获取 241116 行。另一方面，我尝试通过替换来读取该文件"||"符号由;并将其保存为 .xlsx 文件，我以这种方式获取所有行。

你能建议我一种解决这个问题的方法吗？可能是内存问题吗？我有一个 32 位 R 版本，在具有 2GB 内存 RAM 的计算机上运行。

我认为sep=字符长度必须为一。所以你可以简单地调用一个外部命令（比如sed or perl) 来替换两个字符||，或者自己在 R 中完成。

这是一个概念验证单行代码，它首先切换|| to ,（并作为|是一个元字符，我们需要对其进行转义，并对转义字符进行转义\ too):

R> read.csv(textConnection(gsub("\\|\\|", ",", "70000||Consumer A||23||DN||70000||10038782||1||SI||2||NO||0||N/A||0||N/A||1\n90000||Consumer B||23||DN||90000||15402432||1||SI||2||NO||0||N/A||0||N/A||1")), header=FALSE)
     V1         V2 V3 V4    V5       V6 V7 V8 V9 V10 V11 V12 V13 V14 V15
1 70000 Consumer A 23 DN 70000 10038782  1 SI  2  NO   0 N/A   0 N/A   1
2 90000 Consumer B 23 DN 90000 15402432  1 SI  2  NO   0 N/A   0 N/A   1
R>

或者两行可能更清晰：

R> txt <- "70000||Consumer A||23||DN||70000||10038782||1||SI||2||NO||0||N/A||0||N/A||1\n90000||Consumer B||23||DN||90000||15402432||1||SI||2||NO||0||N/A||0||N/A||1"
R> read.csv(textConnection(gsub("\\|\\|", ",", txt)), header=FALSE)
     V1         V2 V3 V4    V5       V6 V7 V8 V9 V10 V11 V12 V13 V14 V15
1 70000 Consumer A 23 DN 70000 10038782  1 SI  2  NO   0 N/A   0 N/A   1
2 90000 Consumer B 23 DN 90000 15402432  1 SI  2  NO   0 N/A   0 N/A   1
R>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

将 txt 文件读入 R 时遇到问题，其中列由 || 分隔的相关文章

R - 在浏览器中获取帮助而不是内置的 R 帮助程序

我见过 R help 的两种不同行为当你输入 density例如帮助已在您的默认浏览器中打开帮助在内置 R 帮助程序中打开 R 中的窗口我目前有第二种行为但我想在浏览器中打开帮助我可以轻松地在这两种行为之间切换吗无需重新安装
有没有办法在 RStudio 中调试 RScript 调用？

假设我从命令行运行 R 脚本如下所示 Rscript prog R x y z 我想检查某一行的代码目前我无法在 RStudio 中以交互方式调试它因为我不知道如何传递参数由于它设计为从命令行运行因此如何通过命令行 RStudi
在 R 中进行 Cox 回归后，将预测危险比列添加到数据帧中

在 R 中运行 Cox PH 回归后我需要在数据框中添加预测风险比的列数据框是面板数据其中 numgvkey 如果公司标识符和年龄是时间标识符您可以从此链接下载一小部分日期 https drive google com file
可以明确声明包依赖项的版本吗？

我倾向于对我编写的代码进行明确而不是隐含的描述因此在成功创建自己的包之后我立即想到的下一件事是如何最好地确保代码的健壮性和可靠性其中一部分与我的包所依赖的包有关实际问题在这方面是否可以明确声明需要期望哪个版本的包依赖项我正
如何使用 r 中的 caret 包在最佳调整超参数的 10 倍交叉验证中获得每次折叠的预测？

我试图使用 R 中的插入符包使用 10 倍交叉验证和 3 次重复来运行 SVM 模型我想使用最佳调整的超参数获得每次折叠的预测结果我正在使用以下代码 Load packages library mlbench library caret
使用 ggplot2 修改点子集的形状

我正在尝试绘制一个沿大量维度变化的大型散点图这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集我只是
分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
ggplot 中的错误问题：“grid.Call(”L_textBounds“, as.graphicsAnnot(x$label), x$x, x$y, … 中的错误”[重复]

这个问题在这里已经有答案了我试图在 ggplot 中制作一个条形图其中我通过强制其中一些标签为长度为零的字符串即来指定要显示的标签但是我收到错误 Error in grid Call L textBounds as graphi
使用 dplyr:group_by 将数据帧分成多个子集？

有没有办法根据 group by 组使用 dplyr 将一个数据帧拆分为数据帧的子集 mtcars gt group by cyl gear gt codes 非常感谢好吧并不是你真的想要但你可以这样做tidyr 即nearly一样的
错误：“rjags”的包或命名空间加载失败

在终端的 conda 环境之一中我能够成功安装包 rjags 但是当我在该环境中运行 R 并运行库 rjags 时出现以下错误加载所需的包 coda 错误 rjags 的包或命名空间加载失败 rjags 的 loadNamespac
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
R.matlab/readMat：readTag(this) 中出错

我正在尝试使用 R matlab 将 matlab 文件读入 R 但遇到此错误 require R matlab r lt readMat file mat verbose T Trying to read MAT v5 file stre
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
解析，用三点参数替换

让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
使用outer代替expand.grid

我正在寻找尽可能快的速度并留在基地做该做的事expand grid做我用过outer为过去类似的目的创建一个向量像这样的东西 v lt outer letters LETTERS paste0 unlist v lower tri v
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
如何计算嵌套函数中的粘合表达式？

我正在尝试嵌套一个函数该函数将两个字符串粘合在一起该函数使用组合字符串来命名数据帧的列然而问题似乎是粘合表达式没有足够早地评估为字符串我可以并且应该强制在将表达式作为参数传递给另一个函数之前对其进行求值吗 library ti
具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

全部我想使用以下方法从相关矩阵中获取 p 值dplyr 和或扫帚包并同时测试多个变量我知道其他方法但 dplyr 对我来说似乎更简单更直观此外 dplyr 需要关联每个变量以获得特定的 p 值这使得该过程更容易更快我检查
非闪亮上下文中的反应式对象绑定

实际问题你怎样才能近似反应性环境行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数或者甚至可能在一个函数中使用这些函数无光泽上下文以

随机推荐

在 Windows Phone 8 应用程序中下载并解压缩 zip 文件

我正在开发一个 Windows Phone 8 应用程序 phonegap 它从我的服务器位置下载一个 zip 文件我想在运行时在我的应用程序中解压缩该文件以使用存档中的文件您可以使用第 3 方库来解压和提取 WP7 WP8 中的 ZI
SonarQube 分析读取超时

我们之前讨论过这个问题现已关闭SonarQube 用户邮件列表通过优化Postgre DB 交换了半周左右解决了问题然后问题又出现了我们使用的是 Jenkins 1 612 使用 SonarQube Jenkins Plugin 2
带有别名的动态命名空间类

SO 我在使用命名空间动态创建对象时遇到问题这是命名空间代码 namespace Foo class Bar 现在我正在尝试创建类对象Bar with include namespace php sName Bar sClass Foo
透明父级中的不透明子级

我在 html 中有透明的 div 块其中还有另一个子块是否可以使子 div 不透明我不相信但你可以这样做 div div div div p I m fully opaque p div div 这种技术基本上是将一个 div 覆
Manage.py：错误：无法识别的参数：runserver 8000，Google Analytics API Django

这是我的 Models py import argparse import os from django db import models from django db import models from django contrib a
如何更改 Android 应用程序的包名称

我的密钥库已损坏因此 Android Market 要求我重命名该应用程序并重新提交然而每当我去编辑清单和整个文件中的包名称时都会出现大量错误更改应用程序名称的正确方法是什么有一种方法可以在 Eclipse 中轻松更改包名称右
将对象（.o）文件添加到 qtcreator 项目

如何在 QtCreator 中将第三方 o 和 h 文件添加到 Qt C 项目中我想将一些来自 John The Ripper 的已编译 o 文件添加到我的项目中忽略其非跨平台性作为测试 a 编写了一个小型 C 程序在 QtCrea
使用 InCallService 替换 Android 6 和 7 上的默认电话应用程序

添加了 Android API 级别 23InCallService to 提供用于管理电话呼叫的用户界面该文档提供了一个清单注册示例但我无法让它工作该应用程序编译正常但设置中的默认应用程序不显示我的应用程序我找到有关该主题的唯一
ADODB 命令失败使用参数化 SQL 查询执行

我有以下 JScript 代码 var conn new ActiveXObject ADODB Connection conn Open Driver MySQL ODBC 5 1 Driver Server localhost Data
如何刷新缓存

在 Apps 脚本中我需要一种方法来刷新缓存而不管密钥如何或者我需要一种方法来查找当前缓存的所有键当我们缓存项目时我们会根据许多动态属性创建密钥因此我们无法确定缓存中某一时刻有哪些密钥有没有办法在 AppsScript 中执
使用 jQuery 突出显示表中的列

我有一个表我使用 jquery 突出显示表中的备用列 table Table22 tr td nth child even css background blue 不过我还有另一个 table 里面一个 tr 作为最后一行如何避免突出显
通过 DOM 解析器转换 PRE 标签之间的空格

正则表达式是我最初的想法作为解决方案尽管很快就发现 DOM 解析器会更合适我想将空格转换为 nbsp HTML 文本字符串中的 PRE 标记之间例如 table tr td adfa a adfadfaf gt td td br df
在Javascript中将字符串中的奇数和偶数索引字符转换为大写/小写？

我需要创建一个函数来读取字符串输入并将字符串中的奇数索引字符转换为大写字母将偶数索引字符转换为小写字母 function alternativeCase string for var i 0 i lt string length i if
使用SqlCommand，如何向其对象添加多个参数，通过winform插入sql表

我的winform中有10个文本框我需要将这些文本框中输入的文本保存到sql数据库表的10列中所以为此我应该写 INSERT INTO item c1 c2 c3 c10 values a b j cmd Parameters Add
将函数应用于 pandas 数据框

我正在尝试对以下内容执行一些文本分析pandas dataframe 但我在流程上遇到了一些问题或者也许我只是不明白 PS 我是一个Python初学者数据框示例 df pd DataFrame Document a 1 a 6 7 N
在 Rust 中，将 C++ std::function 存储在向量中相当于什么？

这是我想要实现的 C 等价物 std vector
无法使用 MongoTemplate 从嵌套数组中提取并查询返回子文档

我在 springboot 中使用 mongodb 这是我的数据的一部分 topic topicId 5e5e4d4bb431502946c15342 name testName0 username test0 date 158323847
如何使用 Jenkins 在 GlassFish 4 服务器中部署 war 文件

我正在使用 Jenkins 在 GlassFish 4 服务器中部署 war 文件但无法部署 Glassfish 4 服务器中的 war 文件我正在遵循以下流程但它在构建时给出以下错误错误构建步骤失败出现异常 org codeh
AngularJS：如何使用令牌安全性和自定义方法处理 RESTful API？

所以说我有一个RESTful API有标准的GET POST PUT and DELETE方法但我还有其他针对特定对象类型自定义的方法最重要的是我需要一个安全令牌因此该服务的 URL 可能如下所示获取放置发布删除 http s
将 txt 文件读入 R 时遇到问题，其中列由 || 分隔

我在尝试读取包含 561366 行和 15 列的 txt 文件时遇到问题第一行看起来像这样 70000 Consumer A 23 DN 70000 10038782 1 SI 2 NO 0 N A 0 N A 1 90000 Consu

将 txt 文件读入 R 时遇到问题，其中列由 || 分隔

将 txt 文件读入 R 时遇到问题，其中列由 || 分隔 的相关文章

随机推荐

热门标签

将 txt 文件读入 R 时遇到问题，其中列由 || 分隔的相关文章