使用 tidytext 包,我想将我的 tibble 转换为每行每文档一个令牌。我将小标题的文本列从因子转换为字符,但仍然遇到相同的错误。
text_df <- tibble(line = 1:3069, text = text)
我的小标题看起来像这样,以一列作为字符:
# A tibble: 3,069 x 2
line text$text
<int> <chr>
但是,当我尝试应用 unnest_tokens 时:
text_df %>%
unnest_tokens(word, text$text)
我总是遇到同样的错误:
check_input(x) 中的错误:
输入必须是任意长度的字符向量或字符列表
向量,每个向量的长度为 1。
我的代码有什么问题?
PS:我看过有关该主题的不同帖子,但没有运气。
谢谢
至少部分问题是变量名包含“$”。您在代码中有效执行的操作是尝试从对象“text”中获取元素“text”,这可能是函数graphics::text 并且不可子集化。
更改“text$text”的名称或将其用反引号括起来:
text_df %>%
unnest_tokens(word, `text$text`)
一般来说,您应该避免在变量名中使用特殊字符,因为它只会导致像这样的错误。
如果您的问题仍然存在,请提供一个最小的可重现示例:如何制作一个出色的 R 可重现示例 https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)