使用UTF-16LE编码读取csv的快速方法

2024-01-17

我正在处理使用 UTF-16LE 编码的 .csv 文件，此方法可以读取文件，但与 read_csv 相比，read.csv 非常慢。

  read.csv2(path,dec=",",skip=1,header=T,fileEncoding="UTF-16LE",sep="/t")

不幸的是，我无法使 read_csv 工作，我只得到空行，而且我什至找不到在函数中指定编码的方法。

我无法分享我的数据，但如果有人处理过这种编码，我们将不胜感激。

您可以使用 readr 函数（例如带有 locale 选项的 read_csv）指定文件编码：locale=locale(encoding="UTF-16LE")。但是，我还没有成功使用 read_csv 读取 utf-16le 文件。我收到“不完整的多字节序列”错误。有一个相关的问题已提交 https://github.com/tidyverse/readr/issues/306，但我的文件仍然存在问题——希望其他人能取得更大的成功。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

utf16le

使用UTF-16LE编码读取csv的快速方法的相关文章

如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
绘制点之间的所有线

我有以下 R 代码 x lt c 0 01848598 0 08052353 0 06741172 0 11652034 y lt c 0 4177541 0 4042247 0 3964025 0 4074685 d lt data fr
尝试读取 CSV 文件时出现“无法识别的字符串转义”

我正在尝试导入一个 csv文件以便我可以观看此视频 R ggplot2 图形直方图 http www youtube com watch v 47kWynt3b6M 我安装了所有正确的软件包包括ggplot以及相关的包视频中的第一个说
pyomo + 网状错误 6 句柄无效

我正在尝试运行pyomo优化我收到错误消息 Error 6 The handle is invalid 不知道如何解释它环顾四周似乎与特权有关但我不太明白在下面找到完整的错误跟踪以及重现它的玩具示例完整的错误跟踪 py run f
以引用透明的方式从函数的省略号参数中提取符号

事情又发生了我正要按下发布答案按钮的问题被删除了我正在寻找一种方法来从函数的省略号参数中提取绑定到符号的对象的值以及符号也就是说我试图以引用透明的方式从省略号中提取符号我尝试过使用替代品和lazy dots 但没有成功 funct
在 R 中使用 lapply 绘制多个数据帧

我正在尝试使用 lapply 函数绘制多个数据帧每个数据帧一个图但是尽管有关此主题的所有帖子我都找不到答案因为我不断收到错误图的输出列表为空我的数据结构如下 df1 lt mtcars gt group by cyl gt tal
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o
在 r 中的 group_by 之后建模后取消列表列的嵌套

我想对所有组进行线性回归group by 将模型系数保存在列表列中然后使用 unnest 扩展列表列这里我用的是mtcars以数据集为例注我想用do here becausebroom tidy 不适用于所有型号 mtcars gt
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
使用 ggmap 截断密度多边形

我在使用 R ggmap 绘制密度图时遇到问题我的数据如下所示 gt head W date lat lon dist 1 2010 01 01 31 942 86 659 292 415 2 2010 01 10 32 970 84 1
纵向比较 R 中的值...并进行扭转

我有许多人在多达四个时间段进行的测试结果这是一个示例 dat lt structure list Participant ID c A A A A B B B B C C C C phase structure c 1L 2L 3L 4L
将不均匀的层次列表转换为数据框

我认为还没有有人问过这个问题但是有没有一种方法可以将具有多个级别和不均匀结构的列表的信息组合成长格式的数据帧具体来说 library XML library plyr xml inning lt http gd2 mlb com c
SPSS 中的标准化残差与 R rstandard(lm()) 不匹配

在寻找 R 相关解决方案时我发现 R 和 SPSS 版本 24 在计算简单线性模型中的标准化残差方面存在一些不一致看来SPSS所谓的标准化残差匹配 R学生化残差我完全不认为某处存在软件错误但显然这两个程序之间存在差异看看这个例子
Shiny：动态数据框构建； renderUI、观察、reactiveValues

我认为如何使用 Shiny 的 renderUI 功能动态子集数据的问题经常出现但我很难理解何时使用 renderUI 带有 uiOutput 而不是其他功能包括观察反应反应值甚至条件面板我想构建一个完全交互式的数据框架其中每个
如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型

我想评估同一数据集上多个主要是线性回归模型的性能我想也许使用tidymodels包连同workflowsets workflow set 可能会起作用我按照这个例子here https workflowsets tidymodels
在 Shiny 中的用户会话之间共享反应数据集

我有一个相当大的反应数据集该数据集是通过轮询文件然后按预定义的时间间隔读取该文件而派生的数据更新频繁需要不断重新加载诚然重新加载可以增量完成并附加到 R 中的现有对象但事实并非如此然而目前尽管会话中的数据相同但此操作是针对

随机推荐

Arduino：将数据存储在 EEPROM 中的轻量级压缩算法

我想将大量数据存储到我的 Arduino 上ATmega168 http www atmel com devices atmega168 aspx ATmega328 http www atmel com devices atmega328
jsf一次验证两个字段[重复]

这个问题在这里已经有答案了我可以用一个验证器验证两个相互依赖的字段吗
如何判断 Apache Flink 运行在哪个端口？

我安装了 apache flink 转到flink 1 14 3文件夹并运行 bin start cluster sh 它似乎已成功启动集群因为它输出了以下内容 Starting cluster Starting standalonese
剔除那些没有分配员工的部门

我想编写一个sql查询并想从DEPT表中获取在EMP表中没有分配员工的部门名称表结构 EMP EMPNO ENAME DEPTNO DEPT DEPTNO DNAME 所以我想了解那些没有员工协会的部门这只是correct不存在 SE
如何使用ReactJS在URL不匹配任何路由以及URL包含/#/时显示404

这是我第一次使用 ReactJS 也不是我的项目但是我试图将任何不存在的路由重定向到我制作的 404 页面当输入任何与路由不匹配的 URL 时我的 404 页面当前会按预期显示apart从 URL 包含时开始例如此 URL 将重
隐藏 DOM 元素会提高性能吗？

假设我有一个 HTML div 其中包含许多表单元素这些元素都在监视模型值如果我在 div 上使用 ng show ng if 或 ng switch 来隐藏它这会阻止 Angular JS 进行脏检查吗表单元素从而提高我的应用程序
计算传入字符流中某个单词的出现次数

我在面试时被问到这个问题虽然我在 DS Algo 方面很擅长但我无法解决这个问题无论如何这是一个有趣的问题所以发布它问题您有一个传入的字符流并且需要计算单词的出现次数您只有一个 API 可以从流中读取数据即stream
使用键 (Xpages) 获取多类别视图（两个类别）的条目数

我正在尝试使用键检索多类别视图两个类别的条目计数 var db NotesDatabase session getDatabase sessionScope serverPath sessionScope dbName var luvi
IE。一开始让我的 JS 脚本崩溃，然后我按 F12，它工作得很好

我有一个在所有浏览器中都可以正常工作的 JS 脚本但令所有人惊讶的是在 I E 第一次尝试时不起作用如果在加载页面后按 F12 打开即调试器并刷新页面效果很好就像其他浏览器一样但对于这项工作我必须按 F12 当我们打开 ie
从 Win7 启动位于 NW 驱动器上的 C# exe 时出现“错误 26 - 定位服务器错误”； SQL数据库

我有几个 C 程序使用LINQ to SQL 类如果我将 exe 文件放在网络驱动器并从那里处决他们我得到 error 26 但只有当我在Win7上这样做时一步步创建一个新的C 项目我在XP机器上使用VS 2010 Premium
htaccess 允许通过扩展名访问文件吗？

我看到几个 htaccess 示例禁用某些文件访问
截断后更新缓慢

我有一个相对简单的更新语句 update sv konginfo ki set AnzDarl 1 where kong nr in select kong nr from sv darlehen group by kong nr havi
Keras：input_shape=train_data.shape 产生“列表索引超出范围”

我想使用 Keras 构建 CNN LSTM 网络但是我很难找到第一层的正确形状input shape范围 My train data是形状的 ndarray 1433 32 32 1433 张尺寸为 32x32 的图片正如发现的这个
j2me - 列表是否有任何属性来跟踪标识项目的“密钥”

您通常如何处理列表以及它们没有明确标识特定项目的属性这一事实到目前为止我能想到的唯一解决方案是将我使用的密钥放在开头后跟连字符和每个项目上显示的文本这样当我从所选项目中检索文本时我可以获得该项目的密钥我就是这样做的但肯定有更
如何在 Eclipse 项目中使用 Firebase 云消息？

我在 eclipse 中有一个项目我需要包括firebase https console firebase google com 图书馆如果我使用 Android Studio 步骤将很简单所有的图书馆都包括在内但我无法理解如何将
使用 JWT OAuth 2.0 令牌的 Cordova 应用程序中的 Azure MFA

我正在开发一个 Cordova 应用程序该应用程序到目前为止使用密码授予从 Azure 中的 Microsoft 标准 OAuth 提供程序检索 JWT https login microsoftonline com tenant o
使用 bootstrap-vue 导航栏 item-dropdown 更改文本颜色

我在用Bootstrap Vue编写网页但我无法更改网页上的文本颜色Bootstrap navbar 尤其是b nav item dropdown标签我尝试过使用 span class text dark span
如何获取我的项目路径？ [复制]

这个问题在这里已经有答案了可能的重复使用 C 获取我的 exe 的路径 https stackoverflow com questions 3991933 get path for my exe using c sharp 你好我有一个
如何使用 terraform 将 ssh 密钥添加到 GCP 实例？

因此我有一个在 Google Cloud Platform 中创建实例的 terraform 脚本我希望能够让我的 terraform 脚本也将我的 ssh 密钥添加到我创建的实例中以便我可以通过 ssh 来配置它们这是我当前的 t
使用UTF-16LE编码读取csv的快速方法

我正在处理使用 UTF 16LE 编码的 csv 文件此方法可以读取文件但与 read csv 相比 read csv 非常慢 read csv2 path dec skip 1 header T fileEncoding UTF 16

使用UTF-16LE编码读取csv的快速方法

使用UTF-16LE编码读取csv的快速方法 的相关文章

随机推荐

热门标签

使用UTF-16LE编码读取csv的快速方法的相关文章