用户评论 - R 中的主题建模或意图检测

2024-01-21

我正在 R 中进行社交媒体分析 - 类似于查看特定业务的用户反馈并尝试将用户评论区分为类别/主题。 例如:查找用户评论是否谈论邻里或犯罪等。 如何找到给定文本的意图?为了训练模型,我没有任何预先确定的主题和标题。我正在进行一个未知的主题分析。 主题建模(LDA)可以为我们提供多个主题(或每个主题的高频术语),但识别评论中提到的主题很困难。我的意思是,可能有几个与某个主题相关的单词/词汇,但我如何理解用户评论正是在谈论一个名为“邻居”的主题。有什么想法吗?谢谢!


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用户评论 - R 中的主题建模或意图检测 的相关文章

  • 如何让 print() 将参数传递给 R 中用户定义的打印方法?

    我在 R 中定义了一个 S3 类 它需要自己的打印方法 当我创建这些对象的列表并打印它时 R 按其应有的方式对列表中的每个元素使用我的打印方法 我想对打印方法实际显示的数量进行一些控制 因此 我的类的 print 方法需要一些额外的参数 但
  • 从 R 中的向量中选择所有可能的元组

    我正在尝试用 R 编写一个程序 当给定一个向量时 将返回所有可能的tuples http en wikipedia org wiki Tuples该向量中的元素 例如 元组 c a b c c a b c 出租车 c a c c b c c
  • 如何在 bertopic 建模中获取每个主题的所有文档

    我有一个数据集并尝试使用 berTopic 建模将其转换为主题 但问题是 我无法获取主题的所有文档 berTopic 每个主题仅返回 3 个文档 topic model BERTopic verbose True embedding mod
  • 如何在R中计算文本中的句子数?

    我使用 R 将文本读入readChar 功能 我的目的是测试文本句子中字母 a 出现次数与字母 b 出现次数一样多的假设 我最近发现了 stringr 包 它帮助我对文本做很多有用的事情 例如计算字符数以及整个文本中每个字母出现的总数 现在
  • 基于服务器中的条件逻辑呈现闪亮的用户输入

    我正在尝试设置一个闪亮的导航栏面板页面 其中用户控制我根据一组单选按钮中所做的初始选择来显示更改 我直接在 ui 中渲染单选按钮 然后在 Server r 中的 观察到的 逻辑控制结构内构建条件控件 弹出错误是因为我的初始 if 语句计算结
  • R::bigmemory - 如何创建角色big.matrix?

    我尝试使用bigmemory封装在R我一开始就陷入困境 我愿意 temp lt matrix paste a 1 10 5 2 并得到一个字符矩阵 没关系 但后来我尝试 x lt as big matrix temp type char 我
  • 如何对同一列上的数据帧列表中的所有数据帧进行排序?

    我有一个数据框列表dataframes list 举个例子 我把dput dataframes list 在底部 我想对列列表中的所有数据框进行排序enrichment 我可以对一个数据框进行排序 first dataframe lt da
  • 如何在for循环中引用变量?

    我正在循环访问不同的 data tables 和 data table 中的变量 但我在引用内部变量时遇到问题for loop dt1 lt data table a1 c 1 2 3 a2 c 4 5 2 dt2 lt data tabl
  • 使用 broom 和 tidyverse 总结 r 平方游戏

    我发布了一个问题here https stackoverflow com questions 48627287 getting adjusted r squared value for each line in a geom smooth
  • 在 R 中创建一个运行计数变量?

    我有一个足球比赛结果的数据集 我希望通过创建一组类似于世界足球 Elo 公式的运行评级来学习 R 我遇到了麻烦 在 Excel 中看似简单的事情在 R 中并不完全直观 例如 4270 个观察中的前 15 个具有必要的变量 date t 1
  • 删除ggplot2中的负图区域[重复]

    这个问题在这里已经有答案了 如何删除 ggplot2 中 x 轴和 y 轴下方的绘图区域 请参见下面的示例 我尝试了几个主题元素 panel border panel margin plot margin 但没有任何运气 p lt ggpl
  • R中的一元加/减是什么?

    来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面 定义了以下一元和二元运算符 他们被列出 在优先级组中 从最高
  • 纵向序列数据的三次样条方法?

    我有一个串行数据 格式如下 time milk Animal ID 30 25 6 1 31 27 2 1 32 24 4 1 33 17 4 1 34 33 6 1 35 25 4 1 33 29 4 2 34 25 4 2 35 24
  • 使用 purrr 迭代替换数据帧列中的字符串

    我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能 这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
  • 如何在 scikit-learn 的 SVM 中使用非整数字符串标签? Python

    Scikit learn 具有相当用户友好的用于机器学习的 python 模块 我正在尝试训练用于自然语言处理 NLP 的 SVM 标记器 其中我的标签和输入数据是单词和注释 例如 词性标记 而不是使用双精度 整数数据作为输入元组 1 2
  • 通过间接引用列来修改数据框中的某些值

    我正在整理一些数据 我们将失败的数据分类到垃圾箱中 并按批次计算每个分类箱的有限产量 我有一个描述排序箱的元表 这些行按升序测试顺序排列 一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
  • 在 R 中绘制 Likert 变量的堆积条形图

    假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个 这些问题需要按照 4 分李克特量表进行回答 例如 批准 表示 1 稍微批准 表示 2
  • Purrr::map_df() 删除 NULL 行

    使用时purrr map df 我偶尔会传递一个数据框列表 其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框 我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
  • 以引用透明的方式从函数的省略号参数中提取符号

    事情又发生了 我正要按下发布答案按钮的问题被删除了 我正在寻找一种方法来从函数的省略号参数中提取绑定到符号的对象的值以及符号 也就是说 我试图以引用透明的方式从省略号中提取符号 我尝试过使用替代品和lazy dots 但没有成功 funct
  • 使用 R 选择第一个非 NA 值

    df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量 它是每个单独 ID 测试的第一个非 NA 值 对于只有NA的个体

随机推荐

  • p:commandbutton 执行与我要求相反的操作

    我一直在尝试禁用按钮 直到操作完成 然后这应该启用该按钮 按钮的代码
  • Tomcat 7 java.lang.NoClassDefFoundError:javax / el / ELManager [重复]

    这个问题在这里已经有答案了 我想将我的应用程序部署到版本 7 中的 tomcat 但出现以下异常java lang NoClassDefFoundError javax el ELManager但如果我尝试将此应用程序部署到 tomcat
  • PHP 将 iTXt 注释添加到 PNG 图像

    我到处都在寻找这个 我知道可以使用 net 中的一些库来完成 但我真的希望我的脚本生成 标记 图像 原因是我们是论坛主办方 和主题制作公司合作 主题制作公司希望我们能够追踪任何非法分发的主题 我在 GCHQ CanYouCrackIt 练习
  • 如何通过回调从 C# 方法创建 F# 异步?

    假设我有一些需要回调的 C 代码 void DoSomething Action
  • 检查鼠标是否在元素的边界内

    javascript 有没有办法检查鼠标位置当前是否位于元素的边界内 您有什么可以建议的功能或快速的方法吗 if document mouse x gt ele offsetLeft document mouse x lt ele offs
  • 打印错误消息的正确方法

    这一行是在 Bash 中打印错误消息的最佳方法吗 echo Error banana gt 2 我需要更新数十个 Bash 脚本 这些脚本使用所有不同的方式记录错误 我不妨选择 正确 的方式来执行此操作并遵守我所做的标准 在我的 bash
  • 如何将base64编码的图像传递给Tensorflow预测?

    我有一个 google cloud ml 模型 我可以通过传递 float32 的 3 维数组来运行预测 instances input 0 0 0 5 0 8 然而 这不是传输图像的有效格式 所以我想传递 base64 编码的 png 或
  • 在Notepad++中如何找到字符串的第n次出现

    我有一个巨大的文本文件 其中的记录由字符串 MSH 标识 我需要找到第 200 条记录 我希望在 Notepad 中可以使用一个正则表达式 它可以让我找到字符串 MSH 第 200 次出现的位置 如果您的文件只是一个由字符串 MSH 分隔的
  • 从 cert 文件到 pfx 文件的转换

    是否可以将 cert 文件转换为 pfx 文件 我尝试将我的 cerf 文件导入 IE 但它从未显示在 个人 选项卡下 因此我无法在那里导出 我正在寻找是否有可用的替代方案 仅供参考 cerf 文件是通过使用 keytool 创建的 然后导
  • 模块构建失败(来自 ./node_modules/mini-css-extract-plugin/dist/loader.js):ReferenceError:文档未定义

    好的 基本上我们在部署之前使用 webpack 来捆绑我们的资源 然而 现在我们还想通过 webpack 捆绑我们的 sass 文件 因为它简化了我们的构建过程 一切进展顺利 但现在bundle js太大而无法在生产中部署 所以我想拆分bu
  • SPA(单页应用程序)是否适合针对移动设备的网站?

    我计划创建一个主要针对手机的网站 其中包含大约 20 个不同的视图 页面 如果我想专注于在页面之间切换时使用户体验非常灵敏 如快速 那么将网站创建为单页应用程序是一个好主意吗 我知道您可以采取许多技巧来提高移动网站的整体性能 http ww
  • 如何通过Axios JavaScript HTTP请求发送JSON或Form数据到FastAPI后端?

    我有一个 FastAPI 后端配置如下 app post engines completions async def read completions engine id str prompt Optional str None max t
  • 如何使用 MapStruct 将字符串转换为映射?

    I have Story我的 Spring Boot 应用程序中的实体 它有String field storyInfo其中包含 title random title description random description For m
  • Java REST 实现:Jersey 与 CXF [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 您认为这两个库之间的优点 缺点是什么 这两个哪个最适合生产环境 顺便说一句 我将使用 JSON 而不是 XML 我还想知道哪个库最受社
  • 在自定义上下文菜单中实现“粘贴”

    这是我试图解决的问题 我不确定这是否可能 我有一个网络应用程序 我需要启用从该应用程序到该应用程序的数据复制 粘贴 但我在粘贴时遇到问题 如果我使用 CTRL V 快捷键过去 我可以使用以下命令从剪贴板获取数据 e originalEven
  • OpenCV 2.4.5 中的访问冲突读取

    我尝试了有关匹配许多图像的示例代码OpenCV 2 4 5我修改了该代码 我找到了错误代码 Unhandled exception at 0x585a7090 in testing exe 0xC0000005 Access violati
  • Javascript扩展对象问题

    我有以下代码 this myObject key1 val1 key2 val2 this aMethod function newObject 这里我想要一个新对象 可能继承自this myObject 包含所有内容this myObje
  • 给定一个 nxn 邻接矩阵,如何计算图中三角形的数量(Matlab)?

    我编写了一个函数 给定 n 生成随机 nxn 邻接矩阵 我想知道是否有一种方法可以计算矩阵表示的图中三角形的数量 The i j 中的元素n 邻接矩阵的幂A计算长度路径的数量n开始于i并结束于j 三角形是一条长度为 3 起始点和终止点相同的
  • Spark读取不同版本的Parquet文件

    我使用 Version1 架构生成了一年多的镶木地板文件 随着最近的架构更改 较新的镶木地板文件具有 Version2 架构额外列 因此 当我从旧版本和新版本一起加载镶木地板文件并尝试过滤更改的列时 我得到一个异常 我希望 Spark 读取
  • 用户评论 - R 中的主题建模或意图检测

    我正在 R 中进行社交媒体分析 类似于查看特定业务的用户反馈并尝试将用户评论区分为类别 主题 例如 查找用户评论是否谈论邻里或犯罪等 如何找到给定文本的意图 为了训练模型 我没有任何预先确定的主题和标题 我正在进行一个未知的主题分析 主题建