在 R 中执行 read.csv 时未读取所有行

2024-05-26

这是输入文件：http://www.yourfilelink.com/get.php?fid=841283 http://www.yourfilelink.com/get.php?fid=841283。我执行了

options(stringsAsFactors=FALSE)
x=read.csv("test1.csv", header = FALSE, sep="'").

结果是这样的：http://www.yourfilelink.com/get.php?fid=841284 http://www.yourfilelink.com/get.php?fid=841284

我没有给出 135 行，而是只得到 7 行！列数是正确的，为 13。x[6,10] 也包含其后面的行的内容，只是在字符串中用 \n 分隔。

请帮助我。我被这个问题困住了！ :/

所描述的具有多个“\n”的极长项目的症状表明您可能需要处理不匹配的引号。如果名称或地址条目中有引号，则解析器将等待下一个，然后再考虑条目完成。尝试”

x=read.csv("test1.csv", header = FALSE, sep="'", quote="")

这实际上对我下载的文件不起作用。（并且请注意， sep 参数将被忽略read.csv。）我需要首先使用 count.fields 和该分隔符，然后使用read.table with fill =TRUE。结果仍然有点混乱，几列都用逗号填充，但至少有一些东西可以处理：

table( count.fields("~/Downloads/test1.txt", sep="'", quote=""))

 10  13 
  5 130 
 x <- read.table("~/Downloads/test1.txt", header = FALSE, sep="'", quote="", stringsAsFactors=FALSE, skip=5)
#Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
#  line 6 did not have 13 elements
 x <- read.table("~/Downloads/test1.txt", header = FALSE, sep="'", 
                  quote="", stringsAsFactors=FALSE, fill=TRUE)
 str(x)
 #########################################################
'data.frame':   135 obs. of  13 variables:
 $ V1 : chr  "INSERT INTO message VALUES (52," "INSERT INTO message VALUES (53," "INSERT INTO message VALUES (54," "INSERT INTO message VALUES (55," ...
 $ V2 : chr  "[email protected] /cdn-cgi/l/email-protection" "[email protected] /cdn-cgi/l/email-protection" "[email protected] /cdn-cgi/l/email-protection" "[email protected] /cdn-cgi/l/email-protection" ...
 $ V3 : chr  "," "," "," "," ...
 $ V4 : chr  "2000-01-21 04:51:00" "2000-01-24 01:37:00" "2000-01-24 02:06:00" "2000-02-02 10:21:00" ...
 $ V5 : chr  "," "," "," "," ...
 $ V6 : chr  "<12435833.1075863606729.JavaMail.evans@thyme>" "<29664079.1075863606676.JavaMail.evans@thyme>" "<15300605.1075863606629.JavaMail.evans@thyme>" "<10522232.1075863606538.JavaMail.evans@thyme>" ...
 $ V7 : chr  "," "," "," "," ...
 $ V8 : chr  "ENRON HOSTS ANNUAL ANALYST CONFERENCE PROVIDES BUSINESS OVERVIEW AND GOALS FOR 2000" "Over $50 -- You made it happen!" "Over $50 -- You made it happen!" "ROAD-SHOW.COM Q4i.COM CHOOSE ENRON TO DELIVER FINANCIAL WEB CONTENT" ...
 $ V9 : chr  "," "," "," "," ...
 $ V10: chr  "HOUSTON - Enron Corp. hosted its annual equity analyst conference today in==20Houston.  Ken Lay, Enron chairman and chief execu"| __truncated__ "On Wall Street, people are talking about Enron.  At Enron, we re talking=20about people...our people.  You are the driving forc"| __truncated__ "On Wall Street, people are talking about Enron.  At Enron, we re talking=20about people...our people.  You are the driving forc"| __truncated__ "HOUSTON =01) Enron Broadband Services (EBS), a wholly owned subsidiary of E=nron=20Corp. and a leader in the delivery of high-b"| __truncated__ ...
 $ V11: chr  "" "," "," "," ...
 $ V12: chr  "" "Robert_Badeer_Aug2000Notes FoldersPress releases" "Robert_Badeer_Aug2000Notes FoldersPress releases" "Robert_Badeer_Aug2000Notes FoldersPress releases" ...
 $ V13: chr  "" ");" ");" ");" ...

我使用逗号作为分隔符并仅使用单引号而不是默认的单引号或双引号得到了更好的结果read.*- 函数使用：

x2 <- read.table("~/Downloads/test1.txt", header = FALSE, sep=",",
                  quote="'", stringsAsFactors=FALSE, fill=TRUE)
 str(x2)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

csv

在 R 中执行 read.csv 时未读取所有行的相关文章

R - Plm 和 lm - 固定效应

我有一个平衡面板数据集 df 本质上由三个变量组成 A B and Y 对于一堆独特识别的区域来说它会随着时间的推移而变化我想运行一个回归其中包括区域下面等式中的区域和时间年份固定效应如果我没记错的话我可以通过不同的方式来
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
在 R 中创建虚拟变量，排除某些情况为 NA

我的数据看起来像这样 V1 V2 A 0 B 1 C 2 D 3 E 4 F 5 G 9 我想创建一个虚拟变量R where 0 1 1 2 3 4 and NA 0 5 9 应该很简单有人可以帮忙吗我们可以转换V2 into a fa
使用 R 选择第一个非 NA 值

df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量它是每个单独 ID 测试的第一个非 NA 值对于只有NA的个体
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
使用 C# 中的 CsvHelper 将不同文化的 csv 解析为十进制

C 中 CsvHelper 解析小数的问题我创建了一个从 byte 而不是文件获取 csv 文件的类并且它工作正常 public static List
在 r 中的 group_by 之后建模后取消列表列的嵌套

我想对所有组进行线性回归group by 将模型系数保存在列表列中然后使用 unnest 扩展列表列这里我用的是mtcars以数据集为例注我想用do here becausebroom tidy 不适用于所有型号 mtcars gt
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集
Android Excel CSV 的 MIME 数据类型是什么？

我尝试了 text csv 甚至 application vnd ms excel 但 Excel 不会显示在选择列表中很多其他应用程序也可以 void shareCsv Uri uri Context context Intent in
如何在 R 或 Python 中制作旭日图？

到目前为止我一直无法找到一个可以创建旭日图的 R 库约翰斯塔斯科 http www cc gatech edu gvu ii sunburst 有人知道如何在 R 或 Python 中实现这一点吗在极坐标投影中使用 matplotli
MySQL 查询到 CSV [重复]

这个问题在这里已经有答案了有没有一种简单的方法来运行MySQL查询来自linux命令行并以csv格式输出结果这就是我现在正在做的事情 mysql u uid ppwd D dbname lt lt EOQ sed e s g tee l
R：如何获取该月的周数

我是 R 新手我想要该日期所属月份的周数通过使用以下代码 gt CurrentDate lt Sys Date gt Week Number lt format CurrentDate format U gt Week Number 3
R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案：函数是否存在，我应该编写自己的函数，还是我错过了重点？

最近我发现了base files命令与其他命令一起使用例如getwd write lines file show dir等等似乎有许多 bash 函数的 R 等价物我还在 R 中编写了一些函数来简化对ssh and rsync通过
read_html(url) 和 read_html(content(GET(url), "text")) 之间的区别

我正在看这个很棒的答案 https stackoverflow com a 58211397 3502164 https stackoverflow com a 58211397 3502164 解决方案的开头包括 library httr
applyStrategy 错误

我是R新手最近运行后遇到以下错误applyStrategy函数来自quantstrat包裹 Error in eval expr envir enclos object signal not found Error in colnames
条件字体颜色 R Markdown

我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
使用 template.docx 从 Shiny App 编织 Word 文档

我正在尝试使用 template docx 文件从闪亮的应用程序编写一个 Word 文档我收到以下错误消息 pandoc exe template docx openBinaryFile 不存在没有这样的文件或目录以下 3 个文件当前
任意列中包含字符串的子集行

我有一个如下所示的数据集 Col1 Col2 Col3 abckel NA 7 jdmelw njabc NA 8 jdken jdne 如何对数据集进行子集化使其仅保留包含字符串 abc 的行最终预期输出 Col1 Col2 Col3

随机推荐

C++ 中带有 lambda 的简单自定义迭代器

假设我有一个容器其中包含int 一个作用于包含以下内容的容器的函数Point 并且我有一个函数可以给出一些int给我相应的Point它代表想象一下我已经在一些大的场景中索引了场景中的所有点std vector
如何让一个 Flask 应用程序监听两个不同的端口？

是否可以有一个单一的 Flask 应用程序其路由位于两个不同的端口上我的 Flask 应用程序需要侦听 Webhooks 并且由于某些安全原因它无法在默认端口上接收外部 POST 请求可以做这样的事情吗 app route hook
Device.BeginInvokeOnMainThread 的用途是什么？

我希望有人向我解释什么是 Device BeginInvokeOnMainThread 以及它的用途是什么还有一些使用案例的示例只是添加一个例子假设你有一个异步方法DoAnyWorkAsync如果你这样称呼它仅作为示例 DoAnyW
如何在 mySQL 中定义自定义 ORDER BY 顺序

在 MySQL 中如何定义自定义排序顺序为了尝试解释我想要的内容请考虑这张表 ID Language Text 0 ENU a 0 JPN b 0 DAN c 1 ENU d 1 JPN e 1 DAN f 2 etc 在这里我想返回
如何将日期格式设置为 1900 年代？

我正在预处理数据一列代表日期例如 6 1 51 我正在尝试将字符串转换为日期对象到目前为止我所拥有的是 date row 2 strip format m d y datetime object datetime strptime d
使用 Android 数据绑定时，如何通过 xml 为自定义 setter 传递多个参数

假设我有一个自定义 setter 方法其中需要两个参数 BindingAdapter imageUrl placeholder public static void loadImage ImageView imageView String
将对象传递给 uibinder 中定义的小部件的构造函数

我试图将我的应用程序的 EventBus 通过其构造函数传递给 UiBinder 中声明的小部件我使用 UiConstructor 注释来标记接受 EventBus 的构造函数但我不知道如何从 ui xml 代码中实际引用该对象也就是
QuantLib：构建关键利率风险

我能够为国债市场建立一条贴现曲线然而我希望用它来找出单个债券最终是债券投资组合的关键利率风险我正在寻找的关键利率风险是如果我拥有 30 年期债券并且我们改变用于贴现债券的 1 年期利率同时保持其他利率不变那么债券的价格会变
原生C有通用符号吗？

在GCC10中 gcc默认为fno common 这意味着所有暂定定义的符号都不通用我认为gcc符合C规范但本地C程序中似乎没有通用符号通用符号仅适用于扩展语法吗原生C有通用符号吗阅读C11标准n1570 https web c
防止用户在 javascript 中离开我的页面

在我的表单中我有一个不显眼的情态如果用户单击我的离开图像我会打开模式并询问他是否想离开如果用户同意 JavaScript Jquery 是否可以停止重新加载或页面更改以显示我的模式并继续操作重新加载下一页上一页等 I t
Stripe 创建使用记录错误 - 时间戳必须早于订阅的当前周期结束时间 - Date.now()？

我正在尝试为按计量计划的客户创建条带使用记录当我在请求中使用时间戳 Date now 时我收到的错误是无法使用此时间戳创建使用记录因为时间戳必须早于订阅的当前周期结束时间这似乎是不言自明的但考虑到订阅的当前周期结束时间还剩 14
用于检查属性是否适用的 React 函数是什么？ [复制]

这个问题在这里已经有答案了基于此问答 React 包装器 React 无法识别 DOM 元素上的 staticContext 属性 https stackoverflow com questions 49358560 react wrap
PowerShell，使用 Start-Job 和 Start-Process 测试异步任务的性能/效率

我很想测试 PowerShell 中异步任务的性能有用性Start ThreadJob Start Job and Start Process 我有一个包含大约 100 个 zip 文件的文件夹因此进行了以下测试 New Item 00
如何使用 VBS 将 ping 写入文本文件

如果我使用 VBS 运行一些 CMD 命令在本例中为 ping 如何使用 VBS 而不是 DOS 将命令写入文本文件 Set objCmdTest WScript CreateObject WScript Shell Set Output
如何找出NPX运行的是哪个文件？

当你跑步的时候说 npx webpack在终端中 NPX 找到一个webpack打包某处并运行它如何确定NXP运行的二进制文件的确切位置我正在寻找类似的工具which https en wikipedia org wiki Which
在 IntelliJ IDEA 中附加 Gradle 源

当我使用默认的 gradle 包装器并创建目录选项在 IntelliJ 中创建 Gradle 项目后我看到项目结构是通过以下命令创建的build gradle file IntelliJ 提示我您可以配置 Gradle 包装器以使用带有
如何根据条件禁用 TestNG 测试

目前有没有办法根据条件禁用 TestNG 测试我知道您当前可以在 TestNG 中禁用测试 Test enabled false group blah public void testCurrency 我想根据条件禁用相同的测试但不知道
Firebase 验证电子邮件模板编辑

是否有或将会有任何方式来编辑验证电子邮件模板或使用不同的语言而不仅仅是英语对于非英语用户来说用户体验很糟糕请您分享一下此功能的路线图谢谢托马斯在发送 firebase 电子邮件之前您可以设置模板的语言您可以在firebas
wpf 控件宽度绑定

我有两个带有内容的边框第二个边框宽度根据情况而变化在内容上我试图将第一个边框绑定到第二个边框宽度但是它不起作用我不确定我错过了什么有人可以给我一些指导吗下面是我目前正在尝试的示例
在 R 中执行 read.csv 时未读取所有行

这是输入文件 http www yourfilelink com get php fid 841283 http www yourfilelink com get php fid 841283 我执行了 options stringsAsF

在 R 中执行 read.csv 时未读取所有行

在 R 中执行 read.csv 时未读取所有行 的相关文章

随机推荐

热门标签

在 R 中执行 read.csv 时未读取所有行的相关文章