R 未检测到字符串中的 \x 模式

2024-01-10

有人知道如何检测并替换“\x”吗R?

library(stringr)
x <- "gesh\xfc"
str_detect(x, "\\x")
# Error in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) : 
# Unrecognized backslash escape sequence in pattern. (U_REGEX_BAD_ESCAPE_SEQUENCE)

nchar(x)
# Error in nchar(x) : invalid multibyte string, element 1

iconv(x, "latin1", "utf-8")
# [1] "geshü"
Encoding(x)
# [1] "unknown"

会议信息:

> sessionInfo()
R version 3.6.0 (2019-04-26)
Platform: x86_64-apple-darwin15.6.0 (64-bit)
Running under: macOS High Sierra 10.13.6

...

locale:
[1] fr_CH.UTF-8/fr_CH.UTF-8/fr_CH.UTF-8/C/fr_CH.UTF-8/fr_CH.UTF-8

上下文:我读取了一个 .csv 文件data.table::fread()但该文件的名称为德语,带有 ä、ö、ü 等字母。一旦在 R 中读取,这些字母就会变成以"\x"。此后在 R 中就无法使用了。


只是总结一下这里发生的事情。 “\x”不是字符串的一部分。这就是 R 转义它无法打印的值的方式。对于“gesh\xfc”,前 4 个字符是基本 ASCII 字符,但最后一个字符被编码为“\xfc”。在 latin1 编码(Windows 默认使用)中fc字符是“ü”字符。所以在我的 Windows 机器上,我看到

x <- "gesh\xfc"
x
# [1] "geshü"

您可以使用以下命令查看该字符串的原始字节

charToRaw("gesh\xfc")
# [1] 67 65 73 68 fc

您可以看到前 4 个值的 ASCII 十六进制字符代码,然后您可以看到\x实际上只是用于在字符串中包含“fc”字符代码。字符串本身只有 5 个“字符”。

但如果你不使用latin1,“fc”字符不映射到任何内容。基本上,该字符串在 Mac 默认使用的 utf-8 编码中没有任何意义。您可以使用以下命令转换为 utf-8

iconv("gesh\xfc", "latin1", "utf-8")

但由于您通过导入文本文件获得了该文件,因此问题是 R 不知道该文件的编码不是 UTF-8,因此您最终会得到这些奇怪的值。你应该告诉fread该文件来自 Windows,因此它可以从一开始就正确导入字符串

fread(file, encoding = "Latin-1")

您需要知道使用什么编码来制作要导入的文件,尤其是由其他人制作的文件。程序实际上不可能正确猜测。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 未检测到字符串中的 \x 模式 的相关文章

  • dplyr,do(),从模型中提取参数而不丢失分组变量

    R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
  • 如何在 R 中为传单中的数值变量设置不对称颜色渐变

    我想让传单调色板以零为中心 红白绿发散 我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时 我得
  • R:将 readRDS 应用于 .Rds 文件名的列表对象

    我有几个包含数据帧对象的 Rds 文件 我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中 但是 当我尝试从文件名列表中读取多个 Rds 文件时 我收到错误 FUN X i 中的错误 从连接读取时出错 readRDS 不适用于列表吗 R
  • 在 R 中绘制对数正态概率密度

    我正在尝试在 R 中生成对数正态概率密度图 其中包含 3 个不同的均值对数和标准差对数 我尝试了以下方法 但我的图表太丑了 看起来一点也不好看 x lt seq 0 10 length 100 a lt dlnorm x meanlog 0
  • 根据另一列中的键累积一列中的值时出现问题

    我有一个看起来像这样的数据框 我需要使用 PROJ ID 列中的字符串创建一个新的值列 并形成 PROJ NAME 列中的值字符串 这里提供的解决方案 根据 r 中另一列的键累积一列中的值 https stackoverflow com q
  • R 更改小数位且不四舍五入

    gt signif 1 89 digits 2 1 1 9 我想要1 8 这有点笨拙 但它会起作用并保持所有数字 x lt 1 829380 trunc dec lt function x n floor x 10 n 10 n Resul
  • 将函数应用于 3d 数组的每一层,返回一个数组

    假设您有一个包含行 列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数 它接受一个矩阵作为输入并返回一个矩阵作为输出 就像t 如何将该函数应用于数组的每一层 返回与第一层大小相同的另一个数组 我觉得我应该
  • 逻辑回归/二项式的 glmnet 误差

    当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时 出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
  • 比较 R 中的两个字符向量

    我有两个 ID 字符向量 我想比较这两个字符向量 特别是我对以下数字感兴趣 A和B各有多少个ID 有多少个ID在A中但不在B中 有多少个ID在B但不在A 我还想画维恩图 以下是一些可以尝试的基础知识 gt A c Dog Cat Mouse
  • fread 将空导入为 NA

    我正在尝试导入带有空白的 csv 读取为 不幸的是他们都读作 NA now 为了更好地演示问题 我还展示了如何NA NA and 都映射到同一事物 除了最底部的示例 这将妨碍简单的解决方法dt is na dt lt gt write cs
  • 使用 R 进行项目组织 [重复]

    这个问题在这里已经有答案了 可能的重复 统计分析和报告撰写的工作流程 https stackoverflow com questions 1429907 workflow for statistical analysis and repor
  • 带 R 的多彩标题

    我想添加颜色某些词在我的图表标题中 我已经能够在这里找到一些先例 http blog revolutionanalytics com 2009 01 multicolor text in r html 具体来说 我希望用撇号括起来的文本 在
  • 表单提交时出现 rvest 错误

    我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
  • R:将 JSON 时间格式转换为 POSIX

    我有一个 JSON 字符串 并将其放入数据框中 我能够做到这一点 但我在使用 apply 函数之一将所有时间字符串转换为 POSIX 格式时遇到问题 See here https stackoverflow com questions 90
  • 在 R 中使用 Huggingface Transformer 模型

    我正在尝试在 R 中使用不同的 Huggingface 模型 这是通过 reticulate 导入 Transformer 包来实现的 谢谢 https rpubs com eR ic transfoRmers https rpubs co
  • 具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

    全部 我想使用以下方法从相关矩阵中获取 p 值dplyr 和 或扫帚包 并同时测试多个变量 我知道其他方法 但 dplyr 对我来说似乎更简单 更直观 此外 dplyr 需要关联每个变量以获得特定的 p 值 这使得该过程更容易 更快 我检查
  • 如何修改秤包生成的标签?

    所以我正在制作金字塔可视化 我在用着scale y continuous labels scales label number si accuracy 0 1 来生产标签 但是 我想去掉图表女性部分的负号 我认为保留 SI 后缀但删除负号的
  • 使用许多特殊字符将 R 连接到 HANA 数据库时出现问题

    我在将 HANA 数据读入 R 时遇到问题 我已通过以下方式建立了连接 ch lt odbcConnect HANA uid USER pwd PW 并确认我已通过以下方式连接 sqlTables ch 这会调出我的表格列表 对我想要拉取的
  • 根据R中的前一行和当前行按组计算

    我可以根据 R 中的前一行和当前行进行计算 对于此数据框 df A B 1 2 2 2 2 3 3 4 5 5 B2 A2 0 5 B1 我可以使用这段代码来计算这个函数 for i in 2 nrow df B i lt 1 2 B i
  • 基于条件反应逻辑闪亮的 Flexdashboard

    我正在尝试有条件地进行一种类型的渲染 renderPlot 或其他 renderText 基于一些输入 这是我尝试过的 title Citation Extraction output flexdashboard flex dashboar

随机推荐

  • NSTimer改变图像iPhone编程

    如何在iPhone编程中使用NSTimer定期更改图像 我创建一个用于加载图像的图像视图 我想在 imageview 中显示图像并使用 NSTimer 定期更改图像 我不使用 NSTimer 而是使用一组图像并对它们进行动画处理 查看文档从
  • 在cordova android项目中定义有关buildType的包名称

    如何定义关于我的 buildType 的正确包名称 我有这个命令行来构建 cordova run android device buildType beta 我有这个钩子 在准备之后 它从命令行设置 buildType fs appendF
  • 网格图的常见图例[重复]

    这个问题在这里已经有答案了 在这个可重现的示例网格图中 3 个图有 3 种填充颜色 z 显示为蓝色 col 但在第四个图中只有 1 个 col 因此 z 显示为红色 我只想展示一个常见的传说 我可以做到 但我希望 z 在所有四个图中都是蓝色
  • 如何在网站登录完成之前隐藏 WebView? [本机反应]

    我正在尝试制作一个显示网站的组件WebView然后自动填写用户信息进行登录 我通过向其中注入一些 javascript 来处理自动填充部分WebView与injectedJavascipt prop 但问题是我想隐藏WebView 登录页面
  • 在 Haskell 中实现 Iota

    Iota 是一种小得可笑的 编程语言 仅使用一个组合器 我有兴趣了解它是如何工作的 但是以我熟悉的语言查看其实现会很有帮助 我找到了一个用Scheme编写的Iota编程语言的实现 不过 我在将其翻译成 Haskell 时遇到了一些麻烦 它相
  • 错误:onActivityResult 不覆盖任何内容

    我正在用 Kotlin 为 Android 编写一个语音识别应用程序 class MainActivity AppCompatActivity public override fun onCreate savedInstanceState
  • 如何在 Android 7+ 上阻止“按住后退按钮”退出“锁定任务模式”

    我正在尝试使用 锁定任务模式 如上所述https developer android com work cosu html https developer android com work cosu html 我的目标是让单个应用程序在 信
  • Google Script GetRange 与基于列中的值的过滤器并仅选择某些列

    我有一个 35 列和 300 行的数据集 我想要获取仅包含第 30 列 名称 中某些值的行的范围 要过滤数据的名称基于活动报告表中的报告文件单元格 B6 到目前为止我尝试过这个 var report SpreadsheetApp getAc
  • 如何捕获抽屉的打开和关闭抖动?

    如何捕捉抽屉打开和关闭的颤动 原则上 必须使用两个对象来实现此目的 保存 抽屉的 DrawerController 和抽屉回调 抽屉回调应该跟踪抽屉的打开和关闭 但是讨论的代码https github com flutter flutter
  • iOS 中 UITextField 中的密码验证

    我有 1UITextfield我的 iPhone 应用程序中的密码 我想通过以下验证来验证此文本字段 必须至少 10 个字符 必须至少包含 1 个小写字母 1 个大写字母 1 个数字和 1 个特殊字符 有效的特殊字符是 10 d a z A
  • 在react-admin中,如果查询字段的长度很短,如何防止发送get请求

    我正在使用react admin并尝试创建一个带有自动完成字段的过滤器 该过滤器将在我键入时进行查询 并且仅当搜索条件长度长于2时才开始发送查询 我目前正在使用shouldRenderSuggestions在我的里面Autocomplete
  • Matlab:显式指定饼图切片颜色

    我正在创建一个饼图 pie a b c d 是否可以显式更改各个切片的颜色 例如 如果我希望 a 和 b 的切片始终为绿色 c 和 d 的切片始终为蓝色 无论其大小如何 我该怎么做 在我看来 颜色图使用切片的大小进行着色 不一定是提供给饼函
  • JavaFX - 如何更改选定的未聚焦行的 TableView 颜色?

    无论我做什么 该行的颜色保持不变并且呈灰色 这些更改仅在 TableView 获得焦点时才有效 我尝试了在网上找到的所有其他建议 例如另一个线程的解决方案 table row cell selected fx background colo
  • 无法在 VS 2015 中编译 CUDA 代码

    我最近安装了Cuda 8 0工具包 https developer nvidia com cuda downloads在我的 Windows 10 桌面中 删除所有 v7 5 组件后 尽管以前的版本与 Visual Studio 2015
  • Keras 如何计算多类分类问题的验证准确性和训练准确性?

    我想知道 Keras 如何计算多类分类问题的验证和训练精度 即使用的函数 我将模型编译设置如下 model compile optimizer Adam lr 0 001 loss categorical crossentropy metr
  • ListView.ItemContainerStyle IsSelected 属性似乎不影响 WinRT 上的选择

    我试图在问题调试期间将 IsSelected 直接设置为 true 无绑定 最后我尝试使用绑定 但发现即使没有绑定也不起作用 以下代码在 WPF 中运行良好 选择了所有项目 但在 WinRT 上不起作用 执行后未选择任何项目 这是一个错误
  • 如何找到给定 GArray 的长度?

    我有一个 GValue 的 GArray 全部非零 它已在运行时使用 g array append val 进行分配 我想知道如何找出最后一个元素的索引是什么 或者更准确地说数组包含多少个元素 代码如下 for length 0 g val
  • 如何使用 javascript 访问 json 文件 (API) 中的元素?

    我正在尝试显示此 JSON 文件中的所有名称 https next json generator com api json get 41P1 UhSI https next json generator com api json get 4
  • Rust 中是否可以返回借用或拥有的类型?

    在下面的代码中 如何返回floor而不是一个新对象 是否可以让函数返回借用的引用或拥有的值 extern crate num 0 2 0 use num bigint BigInt fn cal a BigInt b BigInt floo
  • R 未检测到字符串中的 \x 模式

    有人知道如何检测并替换 x 吗R library stringr x lt gesh xfc str detect x x Error in stri detect regex string pattern negate negate op