fread 的填充选项

2024-05-03

假设我有这个 txt 文件：

"AA",3,3,3,3
"CC","ad",2,2,2,2,2
"ZZ",2
"AA",3,3,3,3
"CC","ad",2,2,2,2,2

With read.csv I can:

> read.csv("linktofile.txt", fill=T, header=F)
  V1 V2 V3 V4 V5 V6 V7
1 AA  3  3  3  3 NA NA
2 CC ad  2  2  2  2  2
3 ZZ  2 NA NA NA NA NA
4 AA  3  3  3  3 NA NA
5 CC ad  2  2  2  2  2

However fread gives

> library(data.table)

> fread("linktofile.txt")
   V1 V2 V3 V4 V5 V6 V7
1: CC ad  2  2  2  2  2

我可以得到相同的结果吗fread?

主要更新

看起来像是开发计划fread改变了并且fread现在已经获得了fill争论。

使用本答案末尾的相同示例数据，我得到的结果如下：

library(data.table)
packageVersion("data.table")
# [1] ‘1.9.7’
fread(x, fill = TRUE)
#    V1 V2 V3 V4 V5 V6 V7
# 1: AA  3  3  3  3 NA NA
# 2: CC ad  2  2  2  2  2
# 3: ZZ  2 NA NA NA NA NA
# 4: AA  3  3  3  3 NA NA
# 5: CC ad  2  2  2  2  2

安装“data.table”的开发版本：

install.packages("data.table", 
                 repos = "https://Rdatatable.github.io/data.table", 
                 type = "source")

原答案

这并不能回答你的问题fread：@Matt 已经解决了这个问题。

然而，它确实为您提供了一个可供考虑的替代方案，与基础 R 相比，它应该可以给您带来良好的速度提升read.csv.

Unlike fread，您必须通过向这些函数提供一些有关您尝试读取的数据的信息来帮助这些函数。

您可以使用input.file来自“iotools”的功能。通过指定列类型，您可以告诉格式化程序函数需要多少列。

library(iotools)
input.file(x, formatter = dstrsplit, sep = ",",
           col_types = rep("character", max(count.fields(x, ","))))

样本数据

x <- tempfile()
myvec <- c('"AA",3,3,3,3', '"CC","ad",2,2,2,2,2', '"ZZ",2', '"AA",3,3,3,3', '"CC","ad",2,2,2,2,2')
cat(myvec, file = x, sep = "\n")

## Uncomment for bigger sample data
## cat(rep(myvec, 200000), file = x, sep = "\n")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

fread 的填充选项的相关文章

R：如何将描述小时、分钟和秒的非直观字符串转换为可行的 POSIXct 格式以执行标准算术？

我在 R 中有一个数据集其值采用小时分钟和秒格式然而有些值只有小时和分钟有些值只有分钟和秒有些值只有分钟有些值只有秒它的格式也不是很有利样本数据如下 example lt as data frame c 22h28m 17
无效的命令名称“tk_chooseDirectory”错误

我使用 bioconductor 进行 WES 管道并使用 tk choose dir 选择用户存储输入文件的目录并将其存储以供进一步使用这里是命令行 library tcltk dataDir lt dirname tk choos
r：按多列分组并计数

我有以下数据框 df LeftOrRight SpeedCategory NumThruLanes R 25to45 3 L 45to62 2 R Gt62 1 我想按速度类别对其进行分组并循环遍历其他列以获取每个速度类别中每个唯一代码的
更新两组单选按钮 - 闪亮

我问了这个问题反应式更新两组单选按钮闪亮 https stackoverflow com questions 35040579 update two sets of radiobuttons reactively shiny 昨天但也
使用 roxygen2 导入两个同名函数

我是 CRAN 包的维护者在加载时收到以下消息 checking whether package qdap can be installed 10s 10s WARNING Found the following significant
在防风草模型上使用 VIP 包计算重要性度量

我正在尝试使用 vi firm 在防风草中制作的逻辑回归模型上计算特征重要性对于正则表达式我将使用 iris 数据集并尝试预测观察结果是否为 setosa iris1 lt iris gt mutate class case when
R 中的点图每行有多个值

我有以下 R 输入文件 car 1 car 2 car 3 car2 1 car2 2 car2 3 然后我使用以下命令来绘制图表 autos data 点图 autos data V2 autos data V1 但这将每个汽车和 ca
在 R 的替换命令中取消引用字符串

我想知道是否可以unquote通过替换命令传递给表达式的字符串具体来说我使用 dplyr 从数据框中过滤和选择 gt w subject sex response 1 1 M 19 08 2 2 M 16 46 6 6 M 23 60
RMySQL fetch - 找不到继承的方法

使用 RMySQL 我想将数据从数据库加载到 R 中的数据帧中为此我使用以下代码 R连接数据库 con lt dbConnect MySQL user root password password dbname prediction h
将模式的所有元素与向量以相同的顺序匹配

我创建了一个函数yes seq需要两个参数一个模式pat和数据dat 该函数以相同的顺序查找数据中是否存在模式例如 dat lt letters 1 10 dat 1 a b c d e f g h i j pat lt c a c g
如何将数据从长格式重塑为宽格式

我在重新排列以下数据框时遇到问题 set seed 45 dat1 lt data frame name rep c firstName secondName each 4 numbers rep 1 4 2 value rnorm 8 d
如何在R中创建for循环？ [复制]

这个问题在这里已经有答案了可能的重复如何在 R 编程中启动 for 循环 https stackoverflow com questions 4162363 how to start a for loop in r programmin
连接树状图和热图

我有一个heatmap 一组样本的基因表达 set seed 10 mat lt matrix rnorm 24 10 mean 1 sd 2 nrow 24 ncol 10 dimnames list paste g 1 24 sep p
构造奎因（自我复制功能）

有没有人构建过 quine 生成自己源文本的副本作为其完整输出的程序 http www nyx net gthompso quine htm http www nyx net gthompso quine htm 在 R 中 quine 标
如何使用 Facet R 添加线条[重复]

这个问题在这里已经有答案了所以我有一个多面图我希望能够向其中添加随每个面而变化的线这是代码 p lt ggplot mtcars aes x wt geom histogram bins 20 aes fill factor cyl
按名称包含在单个对象中的多个列对 data.frame 进行排序？

我想排序一个data frame由多列组成理想情况下使用基础 R 无需任何外部包尽管如果有必要就这样吧读过如何按列对数据框进行排序 https stackoverflow com questions 1296646 how to s
Matlab 中是否有相当于 R 的 dput() 的函数？

Matlab 中是否有相当于 R 的 dput 的函数 dput 将 R 对象的 ASCII 文本表示形式写入文件或连接 UPDATE 1 添加了递归和对单元格的支持 UPDATE 2 添加了对结构的支持 UPDATE 3 增加了对逻辑整
R中data.frame（列表）的列平均值

Data https i stack imgur com ZYsmv jpg 请我需要计算此 data frame 中维吉尼亚币 Sepal Length 列的平均值 Sepal Length Sepal Width Petal Leng
如何在闪亮的observeEvent中监听多个事件表达式

我想要两个不同的事件触发观察者有人建议here https stackoverflow com questions 34731975 how to listen for more than one event expression wit
SparkR 和 Sparklyr 之间导入 parquet 文件所需的时间差异

我正在使用 databricks 导入镶木地板文件SparkR and sparklyr data1 SparkR read df dbfs data202007 source parquet header TRUE inferSchema

随机推荐

不允许为 VPC 创建 EC2 实例

是否可以将 EC2 实例模板的 VPCId 定义为属性我想做的是 Resources Ec2Instance Type AWS EC2 Instance Properties SecurityGroups Ref AWSSecurityG
使用 pythons strftime 显示日期，例如“5 月 5 日”？ [复制]

这个问题在这里已经有答案了可能的重复 Python 日期顺序输出 https stackoverflow com questions 739241 python date ordinal output 在Python中 time strf
在 Perl 中，如何从父进程向子进程发送消息（或信号），反之亦然？

我正在编写一个管理多进程的程序这就是我所做的而且效果很好但现在我想将消息从子进程发送到父进程反之亦然从父进程到子进程你知道最好的方法吗你知道我所做的是否是我想要的正确方法从子进程到父进程发送消息信号或共享内存反之亦然
使用“nuxt build”时动态创建的类不可用 - tailwindcss nuxtjs

我有一个 nuxtjs 项目与 tailwindcss 一起使用在该项目中我动态生成负边距的类如下所示 div class mins 1 div 整个项目在本地运行良好但如果我运行nuxt build nuxt start 它的编
有没有办法重新分区 Kafka 流中的输入主题？

我有一个由 byte 键控的主题我想对其进行重新分区并通过消息正文中字段中的另一个键处理该主题我发现有KGroupedStream and groupby功能但它需要一个聚合函数来转换为 KTable KStream 我不需要聚合我
即使我确实为变量设置了初始值，数据段也没有被初始化

我已经编写了一个代码该代码应该生成某种数字列表但是即使我为它们分配了初始值我的数据段变量也没有被初始化 This is how DS 0000 looks when I run it 这是我的代码但数据段只保留垃圾值 MODEL s
实体框架的状态模式

我有一个模型Enquiry 它可以处于两种状态之一还有更多状态但出于此目的我将仅比较两种状态 New and Closed 查询所处的状态取决于用户能够对查询执行什么操作例如无法删除已关闭的查询而可以删除新的查询等等基本示例
Windows Phone 8.1 应用程序多语言

我正在使用 Visual Studio 2015 在 SilverLight 中创建 Windows Phone 应用程序 8 1 我正在用英语和阿拉伯语创建多语言应用程序为此我在项目中创建了 Strings 文件夹其中包含 en U
仅从 MySQL 中的日期时间 (YYYY-MM-DD HH:MM:SS) 中选择不同的日期

执行此命令会带来以下结果所有列中的所有日期因此它本质上与 SELECT date 执行相同的操作没有不同 SELECT DISTINCT date FROM daily ORDER BY date DESC 2013 02 12 16
如何在 Android Studio 中为单独的模块生成签名的 APK？

我的项目有 3 个模块 include app include videograbber include audiograbber 现在我想为Videograbber模块生成签名的APK 当我在 Android Studio 中使用生成签
自定义 UIAlertView？

鉴于蓝色与我的 UI 界面不相配我只是想知道是否有办法更改 uialertview 的颜色或者使用图像代替所有按钮关闭等仍然存在 Thanks CodeCropper 的优秀人员刚刚推出了一个开源控件可让您创建自定义警报视图这
Big O 用于有限、固定大小的可能值集

这个问题 https stackoverflow com questions 12305028 java what is the best way to find first duplicate character in a string引
在画布中的鼠标位置放大/缩小

我正在尝试使用 p5 js 实现缩放功能当前缩放级别以及 x 和 y 位置存储在controls view目的默认位置或 0 0 位置位于左上角问题是调整放大缩小时的 x 和 y 位置值以便无论视图的当前位置是什么它都会停留在缩
调试 python Web 服务

我正在使用找到的说明here http www diveintopython net http web services user agent html 尝试检查发送到我的网络服务器的 HTTP 命令但是我没有看到按照教程中的建议在控制
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
registerForActivityResult TakePicture 未触发

我尝试使用新的 registerForActivityResult 来拍照我可以打开相机意图但拍照后未触发回调并且我在 logcat 上看不到任何有关 Activity Result 或错误的信息我也尝试了RequestPermi
如何在android中格式化长整型以始终显示两位数

我有一个倒计时器显示从 60 到 0 的秒数 1 分钟倒计时器当它达到 1 位数字例如 9 8 7 时它显示 9 而不是 09 我尝试使用String format B 02d B x 我将 x 从 long 转换为字符串它不起作
角度材质选择不会检测嵌套组件生成的选项的更改

我正在尝试提取过滤和显示我的逻辑mat option是我的mat selects 到他们自己的组件中然而由于某种原因会显示选项但单击它们不会触发事件我正在编写的网络应用程序有很多mat select每个都可能有很多mat opti
实体框架..自引用表..获取深度=x的记录？

我成功地在实体框架中使用自引用表但我不知道如何获得所需深度的记录这应该是什么逻辑 Model public class FamilyLabel public FamilyLabel this Children new Collectio
fread 的填充选项

假设我有这个 txt 文件 AA 3 3 3 3 CC ad 2 2 2 2 2 ZZ 2 AA 3 3 3 3 CC ad 2 2 2 2 2 With read csv I can gt read csv linktofile txt

fread 的填充选项

主要更新

原答案

样本数据

fread 的填充选项 的相关文章

随机推荐

热门标签

fread 的填充选项的相关文章