R 中的 fread 将大型 .csv 文件导入为一行数据框

2024-03-11

我正在将一个大型 .csv 文件导入到 R 中（大约 50 万行），因此我一直在尝试使用 data.table 包中的 fread() 作为 read.table() 和 read.csv( ）。然而，fread() 返回一个数据帧，其中包含一行内各行的所有数据，即使它具有正确的列数。我发现 2013 年的错误报告显示这与 integer64 数据类相关：

有没有解决办法或方法来解决这个问题？

我尝试读取的 .csv 文件完全是 0 - 10000 范围内的整数，没有丢失数据。我在 Windows 7 计算机上使用 R 版本 2.15.2，以及 data.table 包版本 1.8.8。

我正在运行的代码是：

require(data.table)
fread("pre2012_alldatapoints.csv", sep = ",", header= TRUE)-> pre
head(pre)

1: 1 22 -105 22 -105
2: 2 22 -105 22 -105
3: 3 20 -105 20 -105
4: 4 21 -105 21 -105
5: 5 21 -105 21 -105
6: 6 21 -105 21 -105

dim(pre)
[1] 12299  5 #dim returns the correct number of dimensions
#this is a subset of the file I want to import that I've confirmed imports correctly with read.csv
   
pre[,1]
[1] 1 #but trying to print a column returns this

length(pre[,1])
[1] 1 #and length for any column returns a row length of 1

fread创建一个data.table. The data.table包装内附有许多小插图；请访问网站了解更多信息：https://rdatatable.gitlab.io/data.table/ https://rdatatable.gitlab.io/data.table/

实际上自从这个问题发布以来，data.table已经改变了pre[ , 1]现在按原来的预期工作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R 中的 fread 将大型 .csv 文件导入为一行数据框的相关文章

par(mfrow=c(1,2)) 不显示并排密度图[重复]

这个问题在这里已经有答案了 par mfrow c 1 2 plot 1 12 log y plot 1 2 xaxs i 然而当我尝试做并排密度图时图会单独输出 load the stud recs dataset library U
R中添加水印

我在用magickR中的库我想在一些图片上添加水印 I used image annotate功能如下 img lt image read C Users Maydin Desktop manzara png image annotate
decompose() 的周期太少[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 错误看起来像这样 decompose
如何在R中删除重复项

我有一个非常大的数据集如下所示 df lt data frame school c a a a b b c c c year c 3 3 1 4 2 4 3 1 GPA c 4 4 4 3 3 3 2 2 school year GPA
是否可以通过扫描从控制台读取而不回显字符？

这是一个示例函数 passwordEntry lt function cat Enter your password pwd lt scan n 1 what character quiet TRUE invisible pwd 并测试该功
kableExtra 中的 row_spec() 函数不会在 html 输出中创建水平线

我想在 kableextra 表中的某一行下方添加一条水平线 row spec 函数的参数 hline after 应该在行下方添加水平线 row spec 文档 https www rdocumentation org packages
如何在for循环中引用变量？

我正在循环访问不同的 data tables 和 data table 中的变量但我在引用内部变量时遇到问题for loop dt1 lt data table a1 c 1 2 3 a2 c 4 5 2 dt2 lt data tabl
如何用外部图像填充地图边界？

我正在创建一张带有州边界的巴西地图这可以直接使用ggplot2 and geom sf 然而这一次我不想用数据填充每个状态的颜色而是想用外部图像 png 填充每个状态的边界类似于this https online olivet e
在shiny中过滤传单地图数据

我在用传单地图设置这个闪亮的东西时遇到了麻烦我的原帖 https stackoverflow com questions 50111566 applying leaflet map bounds to filter data within
重复测量引导统计数据，按多个因素分组

我有一个看起来像这样的数据框但显然还有更多行等 df lt data frame id c 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 cond c A A B B A A B B A A B B A A B B co
R foreach问题（某些进程返回NULL）

我遇到了问题foreach我正在 R 中使用的程序的一部分该程序用于运行不同参数的模拟然后将结果返回到单个列表然后用于生成报告当并非所有分配的模拟运行都在报告上实际可见时就会出现问题从各方面来看似乎只有分配的运行的一个子集实际
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
如何使用 R 计算成为列表中中位数的概率？

假设我有以下数据集其中显示了假设实验的每个状态的三个观察结果的列表 state lt c Iowa Minnesota Illinois outcome lt list c 5 11 11 c 3 12 8 c 9 14 2 dat lt
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
twitterR 和 ROAuth R 软件包安装

我在安装 CRAN 上的 twitteR 和 RAOuth 软件包时遇到一些问题我尝试了几种不同的方法在 Windows 下使用源代码在 Ubuntu 下使用 RStudio 我尝试了以下命令 sudo apt get install
从命令行运行 R 代码 (Windows)

我在名为 analysis r 的文件中有一些 R 代码我希望能够从命令行 CMD 运行该文件中的代码而无需通过 R 终端并且我还希望能够传递参数并在我的代码中使用这些参数例如就像下面的伪代码 C gt execute r scri
使用 R 选择第一个非 NA 值

df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量它是每个单独 ID 测试的第一个非 NA 值对于只有NA的个体
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集

随机推荐

Google应用程序脚本根据一列删除重复项

下面的代码非常棒可以删除重复项但我想更改一件事例如如果我有 A 列并且它包含重复值而 B 列包含唯一值在这种情况下该函数不会从 A 列中删除重复项因为它如何将 A 列和 B 列连接在一起然后删除重复项我需要的是仅根据 A 列
LISP：关键字参数，提供-p

目前我正在学习 Peter Seibel 的 Practical Common Lisp 在实用一个简单的数据库一章中 http www gigamonkeys com book practical a simple database
QT：QXmlStreamReader 始终返回“文档提前结束”错误

我对 Qt QXmlStreamReader 有奇怪的问题我正在尝试解析简单的文档注意它是使用 QXmlStreamWriter 生成的
使用 AAD 将 SAML 交换为 JWT

我有一个内部应用程序允许用户使用 Azure AD 登录身份验证时将返回 SAML 断言但是应用程序进行的某些调用需要 JWT 用户登录时获取 JWT 的最佳方式是什么或者有没有办法让我将 SAML 换成 JWT 免责声明我不
EventSetter - Visual Studio 设计器中的 XAML 错误

我已经使用 XAML 完成了 TreeView 但现在我想使用隐藏代码来管理事件 HierarchicalDataTemplate 包含一个图像我需要捕获图像上的 MouseEnter MouseLeave 事件我已经尝试过这样的方式
Google Chrome 使用 Flexbox 视口锚定扩展方向

Google Chrome 中存在一个问题当元素放置在带有adjacent弹性项目有space between or center合理的内容这在 Firefox IE11 Edge 或 Safari 中不是问题因为元素始终向下扩展我
scala: list.flatten: 没有找到与参数类型 (Any) => Iterable[Any] 匹配的隐式参数

在 scala 2 7 6 中编译此代码 def flatten1 l List Any List Any l flatten 我收到错误 no implicit argument matching parameter type Any g
AngularJS 在 ng-options 上去除 HTML 过滤器

我正在尝试创建一个自定义过滤器来去除我选择菜单上的 HTML 这是我尝试过的但它不起作用
如何限制 hikaricp 中的初始池大小？

我曾经有一个tomcat连接池配置限制初始池大小 spring datasource tomcat initial size 2 现在切换到hikaricp 限制最初启动的连接相当于什么边注 spring datasource hikar
开放、封闭、绑定和非绑定通用类型

我读过很多关于此的文章但我仍然不确定我是否完全理解这些定义以下是我认为不同术语的示例我是否走在正确的轨道上或者我仍然不理解这些概念谢谢 Array
使用 NHibernate 选择每第 n 行

如何使用 NHibernate QueryOver HQL 或 Criteria 实现选择每第 n 行的查询目前我使用以下 T SQL 查询 SELECT FROM SELECT ROW NUMBER OVER ORDER BY Id A
如何访问 docker-for-desktop 上的 PersistentVolume 文件？

我想访问和编辑 Kubernetes 中的文件持续量在我的本地计算机 macOS 上但我不知道在哪里可以找到这些文件我指着我的hostPath to tmp wordpress volume但我在任何地方都找不到它我想念的隐藏秘密是什
重定向子域（IE）时保留锚点

Firefox http example com about anchor http example com about anchor gt http www example com about anchor http www exampl
将 AWS Cognito 和 aws-ios-sdk v.2.4.16 与开发人员身份结合使用

我设置了一组 lambda 函数来完成所有身份验证我通过 api 网关从我的应用程序进行连接然后最终调用 GetOpenIdTokenForDeveloperIdentity 这将通过网关将 IdentityId 和令牌返回到我的设备
使用 Typescript 调试 VS Code 显示转译的变量名称而不是真实名称

我正在努力寻找正确的配置以便 VS Code 能够向我显示用于调试的真实变量名称在附图中我应该能够看到conn 例如变量但调试器显示转译版本exports conn tsconfig json compilerOptions ba
如何将 Angular.js 与 Pusher 或 PubNub 等实时消息服务集成？

是否可以将 Pusher 或 PubNub 定义为 Angular 服务有人有这种集成的代码示例吗有人已经做到了 http jsfiddle net bv5Kq 13 http jsfiddle net bv5Kq 13 请务必查看 w
找到最小割中的所有边

令 G s t c 为流网络令 F 为所有边 e 的集合其中存在至少一个最小割 A B 使得 e 从 A 到 B 给出一个查找 F 中所有边的多项式时间算法注意到目前为止我知道我需要运行 Ford Fulkerson 以便每个边缘
异常 java.lang.VerifyError: Bad type on operand stack 的原因

下面的简单java代码发送java lang VerifyError 操作数堆栈上的类型错误例外 public class TestJavaCodes int parentData 0 public void init A ob new B
无法使用请求从网页中抓取特定字段的值

我正在努力挖掘价值Balance使用请求模块从网页我找过这个名字Balance在开发工具和页面源代码中但找不到我希望应该有任何方法来获取价值Balance从该网页无需使用任何浏览器模拟器网站地址 https tronscan org
R 中的 fread 将大型 .csv 文件导入为一行数据框

我正在将一个大型 csv 文件导入到 R 中大约 50 万行因此我一直在尝试使用 data table 包中的 fread 作为 read table 和 read csv 然而 fread 返回一个数据帧其中包含一行内各行的所有数据

R 中的 fread 将大型 .csv 文件导入为一行数据框

R 中的 fread 将大型 .csv 文件导入为一行数据框 的相关文章

随机推荐

热门标签

R 中的 fread 将大型 .csv 文件导入为一行数据框的相关文章