write_csv read_csv 在第 1000 行后使用科学记数法

2023-12-03

使用 write_csv() 将混合有小整数条目（值小于 1000）和“大”整数条目（值 1000 或以上）的数据框写入 csv 文件，会混合科学和非科学条目。如果前 1000 行是小值，但此后有一个大值，则 read_csv() 似乎会与这种混合混淆并输出科学记数法的 NA：

test_write_read <- function(small_value, 
                            n_fills, 
                            position, 
                            large_value) {
    tib             <- tibble(a = rep(small_value, n_fills))
    tib$a[position] <- large_value
    write_csv(tib, "tib.csv")
    tib             <- read_csv("tib.csv")
}

以下几行不会产生任何问题：

tib <- test_write_read(small_value = 1, 
                       n_fills     = 1001, 
                       position    = 1000, #position <= 1000
                       large_value = 1000)
tib <- test_write_read(1, 1001, 1001, 999)
tib <- test_write_read(1000, 1001, 1000, 1)

但是，以下几行可以：

tib <- test_write_read(small_value = 1, 
                       n_fills     = 1001, 
                       position    = 1001, #position > 1000
                       large_value = 1000)
tib <- test_write_read(1, 1002, 1001, 1000)
tib <- test_write_read(999, 1001, 1001, 1000)

典型输出：

problems(tib)
## A tibble: 1 x 5
#  row   col   expected               actual file
#  <int> <chr> <chr>                  <chr>  <chr>
#1 1001  a     no trailing characters e3     'tib.csv'

tib %>% tail(n = 3)
## A tibble: 3 x 1
#      a
#  <int>
#1   999
#2   999
#3    NA

csv 文件：

$ tail -n3 tib.csv
#999
#999
#1e3

我在跑步：

R version 3.4.3 (2017-11-30)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.3 LTS

使用 tidyverse_1.2.1（加载 readr_1.1.1）

这是一个应该报告的错误吗？

添加两个正确的答案以及社区 Wiki 的基本原理。

read_csv 有一个参数guess_max，默认情况下将设置为 1000。因此 read_csv 在尝试找出应如何解析每一列之前仅读取前 1000 条记录。将guess_max 增加到大于总行数应该可以解决该问题。 – 马吕斯 4 小时前

您还可以指定,col_types= ...,作为双精度或字符。 –CPak 3小时前

从长远来看，使用@CPak的建议将使您的代码更具可重复性，并且您的分析更具可预测性。这是 read_csv() 吐出一条有关colspec阅读后（以便您可以复制并使用它）。复制它，修改它并告诉它使用不同的类型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

write_csv read_csv 在第 1000 行后使用科学记数法的相关文章

在函数内部调用 clusterApply 时，性能会下降

我遇到了一个奇怪的问题clusterApply 我已经能够尽可能地隔离它如下所示首先我从全局环境运行以下代码 require parallel cl lt makeCluster rep localhost 20 SOCK xl lt
ggplot 中的错误问题：“grid.Call(”L_textBounds“, as.graphicsAnnot(x$label), x$x, x$y, … 中的错误”[重复]

这个问题在这里已经有答案了我试图在 ggplot 中制作一个条形图其中我通过强制其中一些标签为长度为零的字符串即来指定要显示的标签但是我收到错误 Error in grid Call L textBounds as graphi
如何更新条件公式？

让我直接进入示例考虑以下等式 frml lt formula y a b x z 使用这样的公式规范例如和AER ivreg 我想更新这个公式使其显示为 frml2 lt y a b c x z w 但是我不确定如何更新条件标志之前
在 R 中绘制对数正态概率密度

我正在尝试在 R 中生成对数正态概率密度图其中包含 3 个不同的均值对数和标准差对数我尝试了以下方法但我的图表太丑了看起来一点也不好看 x lt seq 0 10 length 100 a lt dlnorm x meanlog 0
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
如何更改 Shiny 中 navbarPage 折叠的断点

我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时将导航元素折叠到菜单中默认情况下当浏览器宽度小于 940 像素时会触发折叠有什么方法可以改变这一点以便在稍大的浏
如何从文件C++中读取带有科学记数法的浮点数？

我有一个具有以下格式的文件 0 0064785667 0 73900002 0 028505694 4 7858757e 39 315 218 0 0051828534 0 73900002 0 028505694 4 6936954e 3
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
逻辑回归/二项式的 glmnet 误差

当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
使用 R 进行项目组织 [重复]

这个问题在这里已经有答案了可能的重复统计分析和报告撰写的工作流程 https stackoverflow com questions 1429907 workflow for statistical analysis and repor
具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

全部我想使用以下方法从相关矩阵中获取 p 值dplyr 和或扫帚包并同时测试多个变量我知道其他方法但 dplyr 对我来说似乎更简单更直观此外 dplyr 需要关联每个变量以获得特定的 p 值这使得该过程更容易更快我检查
GGPLOT2：如何在 ggplot() 脚本中绘制特定选择

这是一个名为的大型数据集的峰值P 其中有 10 个优惠 CS 有不同的商店 SHP 具有多个数值数据集列出了按周排序的它们 WK 2 tm 52 它创建一个大文件仅前 6 行出现峰值 WK MND CS SHP RevCY RevLY
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug
单击 R 中的 Sankey Chart 线时添加额外的标签值

以下 R 闪亮脚本创建一个桑基图如下面的快照所示我的要求是当我单击左右节点之间的任何链接即 a1 和 a2 时我希望相应的 a3 的总和出现在标签中例如 a1 中的 A 和 a2 中的 E 总共具有值 50 和 32 因此我想
为什么 \K 似乎消耗了基本 R 的 gsub 中的一个字符

这是一个示例字符串 bcadefgh 我希望我能匹配除了 cad 具有以下模式 wa w K w 如果我想替换所有不是的东西 cad 我可以用gsub 像这样gsub wa w K w bcadefgh perl TRUE 但是这输出 ca
从“parallel”包中的非基础 R 包调用函数，而无需在函数中将它们库化

假设我正在尝试运行以下代码 library gregmisc library parallel myfunction lt function x combinations 10 x 1 10 cl lt makeCluster getOpt
R中将矩阵拆分为子矩阵的函数

我有一个 16 行 12 列的矩阵 M 我想将其拆分为 16 个矩阵的数组每个矩阵有 4 行 3 列我可以通过以下方式手动完成 M matrix sample 0 127 16 12 replace TRUE c 16 12 ma1 M
ggplot2 可视化/显示中的地图错误？

正如您在下面看到的我使用 ggplots 制作的地图上存在一个奇怪的显示问题任何投影似乎都会发生同样的问题这是代码仅包maps and ggplot2需要 mapWorld lt borders world colour gray5
使用 purrr、broom 从许多单变量模型中获得整洁的输出

我有一个由二进制结果列组成的数据框 y 和多个独立的预测列 x1 x2 x3 我想运行许多单变量逻辑回归模型例如y x1 y x2 y x3 并将每个模型的指数系数比值比 95 置信区间和 p 值提取到数据框标题的行中在我看来使用

随机推荐

jQuery UI 对话框定位

我正在尝试使用jQuery 对话框 UI库以便在将鼠标悬停在某些文本上时将对话框放置在其旁边 jQuery 对话框采用一个位置参数该参数是从当前视口的左上角开始测量的换句话说 0 0 将始终将其放在浏览器窗口的左上角无论您当前滚动到
获取连接表列的不同总和

我在这里遇到问题我希望有一个简单的解决方案我会尝试使这尽可能简单门票属于与会者 Example 得到结果没有子查询你必须求助于高级窗口函数技巧 SELECT sum count OVER AS tickets count sum m
合并重叠区间的算法

我一直在寻找一种有效的算法来合并动态间隔数组上的重叠间隔例如开始时间结束时间明智的 1 2 4 8 3 10 becomes 1 2 3 10 合并后因为 4 8 和 3 10 重叠重叠意味着两个间隔的任何部分共享相同的时刻我
将sourcesJar任务添加到自定义Gradle插件

我的公司最近为普通配置存储库跨项目的常见依赖项等编写了 gradle 插件总的来说这极大地简化了我们的构建过程并发现了项目之间的一些不一致之处我们最近尝试添加一个sourcesJar任务到插件但它不起作用这是损坏的插件 p
同一内存地址有两个不同的值

Code include
ts：“Props”可以用任意类型实例化，该类型可能与其他类型无关

const withFirebase
如何在AWS lex中从意图A调用意图B？ [复制]

这个问题在这里已经有答案了我正在使用 aws lex 我有一个意图 A 我给它起了个名字welcomeMsg 我想打电话给另一个人intent B from intent A 欢迎msg intent A 它会说 gt Hi I am a
python 库中的“randrange() 的非整数参数 1”

我使用随机数生成器生成 5 到 10 之间的随机数能不能这么难我之前在代码中使用过它 2000 行代码对于这里来说太多了并且没有发生编码错误我的代码对于我的游戏来说只是复活节彩蛋但它破坏了我的所有代码 def slowp t f
AngularJS 和 Express Routing 问题

我正在使用 AngularJS 和 ExpressJS 并且遇到路由问题我看到了很多其他帖子但这些解决方案似乎都不起作用这是我在 Express 中的路线 module exports function app auth Api ro
R 如何在不知道长度的情况下创建 for 循环？

目前在这方面site我正在抓取镜头图表信息为了抓取信息我需要为有多少个镜头创建一个 for 循环我通过单击球队统计数据并查找投篮尝试次数来查找投篮次数我想做适当的for loop无需找出镜头的数量我目前正在做的事情 shotc
更新第一行mysql php

我正在尝试更新数据库中的第一行我用Limit 1仅更新第一行但什么也没有发生肯定有匹配的行但数据库中没有任何变化这是代码 foreach player fromsite as match player in game querytw
loadNibNamed 方法太慢 - 如何使其更快？

我有一个滚动视图其中包含大约 40 50 个不同类型的对象对象的类型是根据对象位置的函数定义的例如如果是滚动视图中的第 5 个对象 gt 是 Object1 如果是滚动视图中的第 11 个对象 gt 则是 Object2 类型等使
Python Popen 无法在 Windows PowerShell 中使用正确的编码

我正在 Windows PowerShell 中运行 Python 脚本该脚本应使用 Popen 运行另一个程序然后通过管道传输该程序实际上是 Mercurial 的输出以在我的脚本中使用当我尝试在 PowerShell 中执行脚本
在 Java 中逐行读取大型 JSON 文件的快速高效方法

我有 1 亿条记录JSON文件需要一种高效且最快的方法来读取数组的数组JSON文件输入java JSON文件看起来像 XYZ ABC XYZ ABC XYZ ABC XYZ ABC XYZ ABC XYZ ABC XYZ ABC XYZ
有使用 pywin32 createprocessasuser 并获取输出的好例子吗？

我需要使用 pywin32 方法以不同的用户身份创建进程然后从生成的进程中获取标准输出标准错误和错误代码并在进程运行时将输入输入到进程中问题是我似乎找不到 createprocess 函数的一个很好的例子这个问题变得更加复杂因
如何在seaborn中检索错误栏

我使用以下函数在seaborn中绘制了条形图 ax sns barplot x Year y Value data df 现在我想根据以下规则为每个条形着色 percentages for bar yerr in zip bars yerr
使用 Kryo 序列化任意 Java 对象（出现 IllegalAccessError）

动机为了帮助远程调试 Java 能够请求远程服务器将任意对象发送到我的本地计算机进行检查非常有用然而这意味着远程服务器必须能够序列化运行时事先未知的任意java对象于是我四处打听偶然发现Kryo序列化库 From Kryo 的文档
在固定 div 内旋转文本

我正在尝试在页面左侧设置一个固定 div 距离左侧 24px 并从页面顶部延伸到底部该 div 内将包含导航和标题我试图将标题旋转 90 度并居中定位到 div 的底部很难弄清楚这一点查了很多地方都没有看到类似的例子我已经用当前的
将 HTML 字符串转换为 DOM 元素？

有没有办法将 HTML 转换为 div a href a span span div 或者任何其他 HTML 字符串到 DOM 元素中这样我就可以使用appendChild 我知道我可以执行 innerHTML 和 innerText 但
write_csv read_csv 在第 1000 行后使用科学记数法

使用 write csv 将混合有小整数条目值小于 1000 和大整数条目值 1000 或以上的数据框写入 csv 文件会混合科学和非科学条目如果前 1000 行是小值但此后有一个大值则 read csv 似乎会与这种混合

write_csv read_csv 在第 1000 行后使用科学记数法

write_csv read_csv 在第 1000 行后使用科学记数法 的相关文章

随机推荐

热门标签

write_csv read_csv 在第 1000 行后使用科学记数法的相关文章