如何处理 R 包中具有 UTF-8 标记字符串的示例数据

2024-04-30

我想包括一个示例数据集（Twitter推文和metadata) in an R我正在写的包。

我使用下载了一个示例 data.frameTwitter API并将其另存为.RData（与相应的 .R数据描述文件）在我的包中。

当我跑步时R CMD检查一下，我得到以下注释，

 * checking data for non-ASCII characters ... NOTE
 Note: found 287 marked UTF-8 strings

我尝试保存data.frame with ASCII=TRUE，希望这能解决问题。但它仍然存在。关于如何获得的任何想法R CMD检查是否在没有注释的情况下运行？

（另外，我愿意删除所有UTF-8如果这是解决方案，请从示例数据中标记字符串）。谢谢你！

data.frame 中的示例行：

First time in SF (@ San Francisco International Airport (SFO) - @flysfo in San Francisco, CA) https://t.co/1245xqxtwesr
  favorited favoriteCount replyToSN             created truncated replyToSID                 id replyToUID
1     FALSE             0      <NA> 2015-03-13 23:30:35     FALSE       <NA> 576525795927179264       <NA>
                                                   statusSource screenName retweetCount isRetweet retweeted
1 <a href="http://foursquare.com" rel="nofollow">Foursquare</a>  my_name93            0     FALSE     FALSE
      longitude    latitude
1 -122.38100052 37.61865062

如果它对将来的任何人有用，我找到的解决方案是这样的：

UTF-8 标记的字符位于数据集中，因为 Twitter 推文有时包含表情符号。

我得到的建议是，没有一种简单的方法可以在不删除所有 UTF-8 标记字符串的情况下删除 PACKAGE CMD CHECK 中的注释。

为此，我使用了以下命令：

nonUTF <- iconv(df$TroubleVector, from="UTF-8", to="ASCII")

在具有表情符号等的矢量上。如果该值具有 UTF-8 标记的字符串，则此命令返回 NA。我用它来子集数据集 - 现在我得到了一个干净的构建。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

twitter

UTF8

如何处理 R 包中具有 UTF-8 标记字符串的示例数据的相关文章

如何生成向量的所有组合[重复]

这个问题在这里已经有答案了假设我有 3 个绿球 2 个橙球和 8 个黄球我想订购它们鉴于所有相同颜色的球都是相同的如何生成所有可能的序列在 R 中使用gregmisc 我可以 balls lt c orange orange g
将summary()写入as.data.frame以在ggplot / R中使用

请查找 af 数据样本t below 我正在使用以下方法进行竞争风险分析etmCIF来自etm package 产生以下结果这很好但需要更好的图形曾经有一个ggtrans etm函数将数据导入ggplot 然而这个功能显然被删除了
分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
如何在不循环的情况下添加组ID？

我有数据框例如 productid ordernum p1 10 p2 20 p3 30 p4 5 p5 20 p6 8 我想添加另一列称为 groupid 它将产品按顺序分组在一起一旦 sum ordernum 达到 30 分配一个
如何更新条件公式？

让我直接进入示例考虑以下等式 frml lt formula y a b x z 使用这样的公式规范例如和AER ivreg 我想更新这个公式使其显示为 frml2 lt y a b c x z w 但是我不确定如何更新条件标志之前
使用 dplyr:group_by 将数据帧分成多个子集？

有没有办法根据 group by 组使用 dplyr 将一个数据帧拆分为数据帧的子集 mtcars gt group by cyl gear gt codes 非常感谢好吧并不是你真的想要但你可以这样做tidyr 即nearly一样的
如何在 iOS 中通过 Twitter API 获取用户电子邮件地址？

我尝试了多个 SDK 但无法从任何资源获取电子邮件 ID 我努力了FHSTwitterEngine为此目的但我没有得到解决方案 FHSTwitterEngine twitterEngine FHSTwitterEngine sharedE
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
如何更改 Shiny 中 navbarPage 折叠的断点

我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时将导航元素折叠到菜单中默认情况下当浏览器宽度小于 940 像素时会触发折叠有什么方法可以改变这一点以便在稍大的浏
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
逻辑回归/二项式的 glmnet 误差

当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
仅保留百分比的尾随零

给出以下示例 library pander tableAbs lt Titanic 1 1 tablePct lt round prop table tableAbs 100 2 table lt cbind tableAbs tableP
比较 R 中的两个字符向量

我有两个 ID 字符向量我想比较这两个字符向量特别是我对以下数字感兴趣 A和B各有多少个ID 有多少个ID在A中但不在B中有多少个ID在B但不在A 我还想画维恩图以下是一些可以尝试的基础知识 gt A c Dog Cat Mouse
为绘图制作 2D 图例 - 双变量分区统计图

我一直在玩双变量 choropleth 地图并且一直在如何创建类似于 2d 图例的问题上陷入困境约书亚史蒂文斯 http www joshuastevens net cartography make a bivariate chorop
glmnet 未从 cv.glmnet 收敛 lambda.min

我跑了20倍cv glmnet套索模型以获得 lambda 的最佳值但是当我尝试重现结果时glmnet 我收到一个错误内容如下 Warning messages 1 from glmnet Fortran code error c
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
R：将 JSON 时间格式转换为 POSIX

我有一个 JSON 字符串并将其放入数据框中我能够做到这一点但我在使用 apply 函数之一将所有时间字符串转换为 POSIX 格式时遇到问题 See here https stackoverflow com questions 90
ggplot散点图中的图例问题

我想使用 ggplot 创建显示方法比较数据的散点图绘图应包含原始数据理想线和带误差的拟合线图例应显示理想线和拟合线的线型线宽线颜色我可以获得大部分我想要的东西但是图例存在以下问题图例显示每种线型有 2 条线为什么如何解
如何匹配 R 中的所有匹配项？

我有 1000 个名字的列表说A 我还有另外 5 个名字的清单说B 我想找出这5个名字出现在1000个号码列表中的第几行例如 Amy 在 A 中可以出现 25 次 B 里有艾米我想知道 Amy 出现在 A 中的哪些行我以前使用过
具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

全部我想使用以下方法从相关矩阵中获取 p 值dplyr 和或扫帚包并同时测试多个变量我知道其他方法但 dplyr 对我来说似乎更简单更直观此外 dplyr 需要关联每个变量以获得特定的 p 值这使得该过程更容易更快我检查

随机推荐

在 python 中将 blob 保存到文件中

我正在尝试将通过 ajax 发送的 blob 保存为 python 中的文件以前经历过这个Python 如何在二进制和 Base 64 之间相互转换 https stackoverflow com questions 5305456 py
如何配置 Ransack Rails Gem 以添加 NULLS LAST 进行排序

我希望兰萨克总是添加NULLS LAST这会将空值放在排序列的最后有办法做到这一点吗我在 github 上开了一个问题 https github com activerecord hackery ransack issues 443 h
从 Windows 命令行连接到 websocket

是否可以从 Windows 命令行连接到 websocket 我已经从 Mac 终端使用了 WSCAT 但我似乎找不到替代方案任何帮助将不胜感激 Windows 中没有内置可与 WebSocket 配合使用的工具虽然你可以使用teln
在 Java 中从复杂的 HTML 表格中提取数据到二维数组

如何转换 HTML 表格带有 colspan 和 rowspanJava中的二维数组矩阵我在 Python 和 jQuery 中找到了很好的解决方案但在 Java 中却没有只有通过 jsoup 的非常简单的表 XSLT 有一种很好的
R——对缺失值的二维数据集进行插值的方法

我目前正在使用 Akima 插值例程来进行二维线性插值我目前正在尝试通过排除不良数据点和依赖于它们的插值来尽可能地进行线性插值我不想做任何样条拟合只是线性插值我可以想出两种使用现有的 akima 包来做到这一点的方法通过将二维数据
身份验证错误：无法响应以下任何质询：{} Android - 401 Unauthorized

身份验证错误无法响应以下任何质询 Android 401 Unauthorized 我已从此链接参考在 Android 上使用 HttpPost 和 DefaultHttpClient 时出现身份验证错误 https stackoverf
如何使用TortoiseSVN更改密码？

我需要更改我的 SVN 密码我正在使用 TortoiseSVN 客户端我找不到密码更改或添加用户选项是否可以是否有任何解决方法或命令行语法来创建 SVN 用户或编辑用户更改访问 Subversion 的密码通常这将由您的 Sub
html 表单在表单提交时发送 GET 而不是 POST

请原谅我的网络技能但我有一个非常基本的问题我有这个 html 表单理想情况下应该用 post 调用我的 login url 但由于某种原因它总是向该 url 发送 get 请求并失败我不明白这是怎么发生的这是我的 html 表单
编程 Jersey 资源中的路径参数

我正在使用 Jersey 的编程 API 描述here https jersey github io documentation latest resource builder html在运行时从配置文件动态创建配置资源我创建这些资源的代
如何使用 Neon SIMD 将无符号字符转换为有符号整数

如何转换变量的数据类型uint8 t to int32 t使用霓虹灯我找不到执行此操作的任何内在因素假设您想要将 16 x 8 位整数的向量转换为 4 个 4 x 32 位整数的向量您可以通过首先解压缩为 16 位然后再次解压缩为
如何使用plotly包绘制用一种缩放颜色着色的饼图

我有这个示例数据框 gt Data Produits Pourcentages 1 Cr me de jour 27 10 2 s rum 14 50 3 Cr me de nuit 13 80 4 masque 8 82 5 d maqu
使用 openopenPanel() 方法打开 matAutocomplete

我正在使用 Angular Material 的垫自动完成 https material angular io components autocomplete overview组件并根据docs https material angula
使用 ThreeJS 获取球体纹理上的点击位置

目前我有一个带有纹理的球体它绕 y 轴旋转我还有在 3D 空间中单击的位置以及球体上的旋转位置我认为目标获取纹理上的位置例如我想获取我点击的图像的哪个方块参见示例球体和下图在实践中我不会使用此图像但我觉得这将是一个
无法在 Linux 中阻止从命名管道 (FIFO) 读取

很奇怪我似乎无法完成这项工作这是我的架构我有一个命名管道它将在永远运行 root读取器进程和多个应用程序编写器进程读者进程必须是blocking当作家们在nonblocking 因此这就是我在阅读器进程中所做的该进程将运行ro
SQL 错误：1452：无法添加或更新子行：外键约束失败

我的数据库中有两个表 order course order有一个专栏courseid哪个参考列id of the course桌子每当我尝试做的时候saveAll in CakePHP以上SQL将显示错误并且不会保存数据听起来是在数据库
Java 中字节数组的位移操作

如何将字节数组向右移动 n 个位置例如将 16 字节数组右移 29 个位置我在某处读到可以使用 long 来完成会使用这样的长工作 Long k1 0 到 7 的字节数组 Long k2 8 到 15 的字节数组然后使用 Long
如何交替两个数组中的字符？

我需要帮助弄清楚如何组合两个字符数组然后让元素在新数组中交替给定的数组可以是不同的长度例如 char1 B D char2 c R 5 输出应为 char3 B c D r 5 char ch3 new char ch1 length
在 ASP NET MVC 6 项目中使用 System.Net.Mail

我在 ASP NET 5 项目中创建简单的模拟邮件发送器时遇到问题这里的方法 public static Task SendMail string Email string Subject string Body SmtpClient c
为什么定义接口的方法和属性前面没有修饰符（public、private、protected）？ [复制]

这个问题在这里已经有答案了可能的重复是否有原因无法在方法或接口中定义访问修饰符 https stackoverflow com questions 1652123 is there a reason you can not define
如何处理 R 包中具有 UTF-8 标记字符串的示例数据

我想包括一个示例数据集 Twitter推文和metadata in an R我正在写的包我使用下载了一个示例 data frameTwitter API并将其另存为 RData 与相应的 R数据描述文件在我的包中当我跑步时R CMD检

如何处理 R 包中具有 UTF-8 标记字符串的示例数据

如何处理 R 包中具有 UTF-8 标记字符串的示例数据 的相关文章

随机推荐

热门标签

如何处理 R 包中具有 UTF-8 标记字符串的示例数据的相关文章