fastText 中的精确度和召回率？

2024-02-25

我实现了 fastText 进行文本分类，链接https://github.com/facebookresearch/fastText/blob/master/tutorials/supervised-learning.md https://github.com/facebookresearch/fastText/blob/master/tutorials/supervised-learning.md我想知道 precision@1 或 P@5 是什么意思？我做了二元分类，但我测试了不同的数字，我不明白结果：

haos-mbp:fastText hao$ ./fasttext test trainmodel.bin train.valid 2
N   312
P@2 0.5
R@2 1
Number of examples: 312
haos-mbp:fastText hao$ ./fasttext test trainmodel.bin train.valid 1
N   312
P@1 0.712
R@1 0.712
Number of examples: 312
haos-mbp:fastText hao$ ./fasttext test trainmodel.bin train.valid 3
N   312
P@3 0.333
R@3 1
Number of examples: 312

精度是相关结果数与程序检索到的结果总数的比率。假设一个文档搜索引擎检索到 100 个文档，其中 90 个与查询相关，则精度为 90 / 100 (0.9)。由于我们已经用 100 个结果计算了精度，因此这是 P@100。

召回率是算法检索到的相关结果与所有相关结果总数的比率。与上面的示例相同，如果相关文档的总数为 110，则召回率为 90 / 110。

简而言之，召回率有助于评估信息检索程序在获取相关结果方面的完整性；精度有助于评估结果的准确性。

请检查 fasttext 中的二元分类，https://github.com/facebookresearch/fastText/issues/93 https://github.com/facebookresearch/fastText/issues/93

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

fastText 中的精确度和召回率？的相关文章

给定文档，选择相关片段

当我在这里提出问题时自动搜索返回的问题的工具提示给出了问题的前一点但其中相当一部分没有给出任何比理解问题更有用的文本标题有谁知道如何制作一个过滤器来删除问题中无用的部分我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子例如
如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP？

老实说我想弄清楚如何转换数据集格式 pandasDataFrame或 numpy 数组转换为简单文本分类张量流模型可以训练用于情感分析的形式我使用的数据集类似于 IMDB 包含文本和标签正面或负面我看过的每个教程要么以不同的方式
Java 和 SQL Server 中的精度噩梦

我一直在与 Java 和 SQL Server 中的精确噩梦作斗争直到我不再知道了就我个人而言我理解这个问题及其根本原因但向地球另一端的客户解释这一点是不可行的至少对我来说情况是这样的我在 SQL Server 中有两列 Qt
使用 Pandas 读取 CSV 时如何删除 .0

我有一个 CSV 文件正在读入 pandas 数据帧所有数字都没有任何小数位但是当我将其读入 dframe 时它会在带小数的数字中添加尾随零 1205 变为 1205 0 如何在 pd read csv 期间去掉 0 我知道我可以在
Java文本输出中的UTF-8编码问题

我一直致力于测试高棉语 Unicode Wordbreaker 的各种解决方案高棉语单词之间没有空格这使得拼写检查和语法检查变得困难以及从旧高棉语转换为高棉语 Unicode 我得到了一些源代码现在在线 http www white
如何使用FeatureUnion转换PipeLine中的多个特征？

我有一个 pandas 数据框其中包含有关用户发送的消息的信息对于我的模型我感兴趣的是预测消息的缺失收件人即给定消息的收件人 A B C 我想预测还有谁应该成为收件人的一部分我正在使用 OneVsRestClassifier 和
在 LINQ 中确定具有分钟精度的日期时间值的相等性

我需要使用分钟精度比较两个日期时间值以确定相等完全相同这是最好的方法吗我的日期可能有秒和毫秒但我只想考虑到分钟 where Math Abs datetime1 Subtract datetime2 TotalMinutes 0 检
分类报告 - 精度和 F 分数定义不明确

我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met
scala.math.BigDecimal ：1.2 和 1.20 相等

将 Double 或 String 转换为 scala math BigDecimal 时如何保持精度和尾随零用例在 JSON 消息中属性的类型为 String 值为 1 20 但是在 Scala 中读取这个属性并将其转换为 BigD
Java 中的自然语言处理 (NLP) [重复]

这个问题在这里已经有答案了可能的重复 Java 有没有好的自然语言处理库 https stackoverflow com questions 870460 java is there a good natural language pro
FastText - 由于 C++ 扩展未能分配内存，无法加载 model.bin

我正在尝试使用 FastText Python APIhttps pypi python org pypi fasttext https pypi python org pypi fasttext虽然据我所知此 API 无法加载较新的
对产品列表进行分类的算法？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个代表或多或少相同的产品的列表例如在下面的列表中它们都是希捷硬盘希捷硬盘 500Go 适用于笔记本电脑的希捷硬盘 120
文本摘要评估 - BLEU 与 ROUGE

根据两个不同摘要系统 sys1 和 sys2 的结果和相同的参考摘要我使用 BLEU 和 ROUGE 对它们进行了评估问题是 sys1 的所有 ROUGE 分数均高于 sys2 ROUGE 1 ROUGE 2 ROUGE 3 ROUGE
如何将句子或文档转换为向量？

我们有将单词转换为向量的模型例如 word2vec 模型是否存在类似的模型可以使用为单个单词学习的向量将句子文档转换为向量 1 跳克法以及使用它的工具谷歌 word2vec https code google com p wor
Python NLP 英式英语与美式英语

我目前正在用Python 进行NLP 工作然而在我的语料库中既有英式英语也有美式英语实现实现我正在考虑将英式英语转换为美式英语但是我没有找到一个好的工具包来做到这一点有什么建议么我也找不到包但试试这个请注意我必须
分词统计方法

我想解决分词问题从没有空格的长字符串中解析单词例如我们想要从中提取单词somelongword to some long word 我们可以通过字典的动态方法来实现这一点但我们遇到的另一个问题是解析歧义 IE orcore gt or
使用 NLTK 生成字典以将推文分类为预定义类别

我有一个 Twitter 用户 screen names 列表我需要根据他们的兴趣领域将他们分为 7 个预定义类别教育艺术体育商业政治汽车技术我用 Python 提取了用户的最后 100 条推文并在清理推文后为每个用户创
如何改进 NLTK 中的荷兰语 NER 词块划分器

感谢这个伟大的答案我使用 NLTK 和 Conll2002 语料库训练自己的荷兰语 NE 词块划分器有了一个良好的开端 NLTK 荷兰语命名实体识别 https stackoverflow com questions 11293149
在Python中表示语料库句子的一种热门编码

我是 Python 和 Scikit learn 库的初学者我目前需要从事一个 NLP 项目该项目首先需要通过 One Hot Encoding 来表示一个大型语料库我已经阅读了 Scikit learn 关于 preprocessi
Keras：binary_crossentropy 和 categorical_crossentropy 混淆

使用 TensorFlow 一段时间后我阅读了一些 Keras 教程并实现了一些示例我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数我想binary crossentro

随机推荐

从 Android for work 应用程序访问 SD 卡数据

我的 EMM 是 VMWare Airwatch 我已成功设置 Android 工作环境并在我的 Nexus 5x 设备上安装了工作配置文件但我的工作应用程序无法访问 SD 数据或存储在外部存储上的文件我尝试过创建并安装 Android
如何在没有 CMD Msiexec 命令的情况下以静默模式运行创建的 MSI

当用户启动 msi 设置时如何以静默模式完全没有 UI 实现 MSI 关键是 QN 开关 in the msiexec exe 命令行 http msdn microsoft com en us library aa367988 v v
触发错误时回滚事务

我正在尝试检查要插入系统的房间在该日期是否已出租我已经考虑过计算与房间号和日期匹配的行然后回滚事务但即使我更改了代码以引发用户定义的异常我仍收到以下错误 ERROR cannot begin end transactions in
调用返回类型必须参数化为 Call 或 Call 异常

以下是我使用过的依赖项 implementation com squareup retrofit2 retrofit 2 0 2 implementation com squareup retrofit2 converter gson 2
当插入 FormData 时，Safari 将 File 转换为 [object Object]。怎么修？

我正在使用新的 FormData 界面在 Javascript 中发布一个文件当我使用 Safari 5 1 5 使用 multipart form data 发送文件时 Safari 会将文件强制转换为字符串而不是发送实际的文件内容
如何在 C#.NET 应用程序卸载时删除文件夹？

我有一个名为 XYZ 的窗口 net 应用程序在安装后使用我的应用程序时我创建了一个名为 ABC 的自定义文件夹文件夹可能位于应用程序路径以外的任何位置当我卸载应用程序时所有文件夹都将被删除但 ABC 文件夹仍保留在那里如何删
为什么 kafka-python 无法连接到 Bluemix 消息中心服务？

我正在尝试连接到 Bluemix Message Hub 实例http bluemix net http bluemix net 这个简单的脚本 usr bin env python from kafka import KafkaProdu
从 Codeigniter 中的帮助程序访问数据库配置变量

是否可以从 Codeigniter 中的助手获取 database php 变量值方法是这样的一般情况下是用不到的 this在助手中所以你必须使用get instance 我给出了主机名的示例您可以使用您需要的配置名称 func
Eclipse 新插件项目：不可选

只是一个简单的问题但我在这个美妙的万维网上找不到任何答案我只想创建一个新的插件项目基于日食赫利俄斯通常此功能应该随此版本一起提供版本 Helios Service Release 2 Build id 20110301 1815 但
pandas DataFrame 上的就地逐行操作

假设我有这个 gt gt gt x pandas DataFrame 1 0 2 0 3 0 3 4 5 columns A B C gt gt gt print x A B C 0 1 2 3 1 3 4 5 现在我想正常化x按行即将每
使用react-bootstrap-typeahead对多个数据集进行分组

我正在尝试使用旧的 jQuery typeahead 和react bootstrap typeahead 来复制搜索字段它查询使用多个异步数据源并显示按此类源的返回分组的结果例如如图所示通过输入字母 b 它会查询地址数据库以及用
将 HttpRequestMessage 转换为 OwinRequest 并将 OwinResponse 转换为 HttpResponseMessage

我有一个 Web API 消息处理程序MyHandler我想作为中间件在 OWIN 管道中运行所以像这样配置处理程序 public class Startup public void Configuration IAppBuilder a
MySQL中如何通过多列主键选择多行？

我有一个带有多列主键城市州日期和更多数据列的表我正在寻找每个城市州的最新数据我如何干净高效地做到这一点现在我可以通过执行第一个查询来获取我尝试获取的所有行的列表然后执行带有大量 WHERE 子句的第二个查询 SELEC
在 EitherT 和 Validation 之间切换以累积误差或遍历

假设我有以下功能 def getRemoteThingy id Id EitherT Future NonEmptyList Error Thingy Given a List Id 我可以轻松地检索List Thingy 通过使用Trav
Hibernate 搜索排序

Hibernate 搜索根据相关性对结果进行排序这是正常的除此之外如果两个文档具有相同的分数则它们按主键排序例如 book1 id 1 bookTitle 通过示例进行休眠搜索 book2 id 2 bookTitle 休眠搜索实
突出显示 Visual Studio Code C++ 扩展中的错误语法

是否可以使用 Visual Studio Code C 扩展来检查语法错误例如以下错误语法将突出显示 std vectorr vec Yes 微软C C https marketplace visualstudio com items
在 Cordova 中使用相机后，iOS 收到内存警告

当我拍照时我开始不断收到内存警告我正在使用 Cordova 3 5 和带有这些设置的相机插件 var config var pictureSource var destinationType sets the format of ret
Aiohttp 在浏览器正常打开的某些网站上引发证书错误

代码示例 import aiohttp import asyncio async def main url async with aiohttp ClientSession as session async with session get
使用 OAuth2 保护 Nodejs / sailsjs API

我使用 sailsjs 开发了一个 REST API 我想添加 OAuth2 授权来保护此 API 我对 OAuth 很陌生不知道从哪里开始我发现了几个可用于此目的的模块例如 oauth2orize 及其用法示例https githu
fastText 中的精确度和召回率？

我实现了 fastText 进行文本分类链接https github com facebookresearch fastText blob master tutorials supervised learning md https git

fastText 中的精确度和召回率？

fastText 中的精确度和召回率？ 的相关文章

随机推荐

热门标签

fastText 中的精确度和召回率？的相关文章