Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
fastText 中的精确度和召回率?
我实现了 fastText 进行文本分类 链接https github com facebookresearch fastText blob master tutorials supervised learning md https git
NLP
Classification
precision
fasttext
如何将 Scikit Learn 分类器应用于大图像中的图块/窗口
给出的是 scikit learn 中经过训练的分类器 例如ARandomForestClassifier 分类器已经过对大小样本的训练 例如25x25 如何轻松地将其应用于大图像 例如 640x480 中的所有图块 窗口 What I c
python
machinelearning
scikitlearn
Classification
scikitimage
如何在java中使用StringToWordVector(weka)?
这是我的arff文件 relation hamspam attribute text string attribute class ham spam data good ham very good ham bad spam very bad
Java
Classification
Weka
arff
处理训练和测试数据中的不同因子水平
我有一个 20 列的训练数据集 所有这些都是我必须用于训练模型的因素 我已经获得了测试数据集 我必须在该数据集上应用我的模型进行预测并提交 我正在进行初始数据探索 只是出于好奇检查了训练数据和测试数据级别 因为我们正在处理所有类别变量 令我
r
machinelearning
Classification
RandomForest
categoricaldata
如何计算sklearn中交叉验证的每个模型中的特征重要性
我在用RandomForestClassifier with 10 fold cross validation如下 clf RandomForestClassifier random state 42 class weight balanc
python
machinelearning
scikitlearn
Classification
crossvalidation
将分类数据从 CSV 加载到 Scikit-Learn 以进行机器学习
我正在学习 Scikit Learn 对推文进行一些分类 我有一个 csv 其中一列包含推文 下一列包含 0 11 的班级 我经历了本教程来自 Scikit Learn 网站 http scikit learn org stable tut
python
csv
machinelearning
scikitlearn
Classification
识别任意日期字符串[关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我需要能够识别日期字符串 如果我无法区分月份和日期 例如 12 12 10 也没关系 我只需将字符串分
Java
date
Classification
如何在 scikit-learn 中正确地将数字特征与文本(词袋)结合起来?
我正在为网页编写一个分类器 因此我混合了数字特征 并且我还想对文本进行分类 我正在使用词袋方法将文本转换为 大 数值向量 代码最终是这样的 from sklearn feature extraction text import CountV
python
scikitlearn
Classification
textclassification
解析 HTML:成人分类系统
我正在研究网络上使用的不同且 有时已过时 的评级 分类标准 IE PICS http www w3 org PICS POWDER http www w3 org 2007 powder ICRA http www fosi org icr
c
htmlparsing
Classification
powder
scikit-learn中predict与predict_proba的区别
假设我创建了一个模型 并且我的目标变量是0 1 or 2 看来如果我使用predict 答案是 0 1 或 2 但是如果我使用predict proba 我得到一行 每行 3 列 如下所示 例如 model Classifier It co
python
machinelearning
scikitlearn
Classification
Prediction
sklearn多类SVM函数
我有多个类标签 想要计算模型的准确性 我有点困惑我需要使用哪个 sklearn 函数 据我了解 以下代码仅用于二元分类 dividing X y into train and test data X train X test y train
machinelearning
scikitlearn
Classification
SVM
PCA
随机森林中什么是袋外错误? [关闭]
Closed 这个问题需要多问focused help closed questions 目前不接受答案 随机森林中什么是袋外错误 它是在随机森林中找到正确数量的树的最佳参数吗 我将尝试解释一下 假设我们的训练数据集由 T 表示 并且假设数
languageagnostic
machinelearning
Classification
RandomForest
使用输入 fn 在 Tensorflow 估计器中进行预测
我使用来自的教程代码https github com tensorflow tensorflow blob r1 3 tensorflow examples learn wide n deep tutorial py https githu
tensorflow
Classification
Predict
如何在 weka 中表示用于分类的文本?
您能告诉我如何在 weka 中表示文本分类的属性或类吗 我可以使用什么属性进行分类 词频还是仅词 ARFF 格式的可能结构是什么 你能给我几行该结构的例子吗 预先非常感谢您 最简单的替代方法之一是从 ARFF 文件开始解决二类问题 例如 r
Java
machinelearning
Classification
Weka
arff
为 Twitter 情绪分析项目寻找 C# 中的开源朴素贝叶斯分类器 [已关闭]
就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
c
twitter
Bayesian
Classification
如何将 RGB 或 HEX 颜色代码分组为更大的颜色组集?
我正在分析大量图像并提取主要颜色代码 我想将它们分组为通用颜色名称范围 例如绿色 深绿色 浅绿色 蓝色 深蓝色 浅蓝色等 我正在寻找一种与语言无关的方式来自己实现一些东西 如果有我可以研究的例子来实现这一点 我将非常感激 在机器学习领域 你
imageprocessing
ComputerVision
Classification
Scikit-learn 从分段时间序列创建标记数据集
INTRO 我有一个 Pandas DataFrame 代表分段的不同用户 即 user1 和 user2 的时间序列 我想使用上述 DataFrame 训练 scikit learn 分类器 但我无法理解必须创建的 scikit lear
python
pandas
Dataset
scikitlearn
Classification
您将如何使用 Sklearn 的 VotingClassifier 进行 RandomizedSearchCV ?
我正在尝试调整我的投票分类器 我想在 Sklearn 中使用随机搜索 但是 由于我当前使用两种算法 不同的树算法 如何为我的投票分类器设置参数列表 我是否必须单独运行随机搜索并稍后在投票分类器中将它们组合在一起 有人可以帮忙吗 代码示例将受
machinelearning
scikitlearn
Classification
Gridsearch
Python OpenCV SVM 实现
因此 我有一个包含样本图像的矩阵 全部转换为向量 该矩阵通过 PCA LDA 运行 还有一个向量表示每个图像所属的类 现在我想使用 OpenCV SVM 类来训练我的 SVM 我使用的是 Python OpenCV 2 3 1 但我在定义参
python
opencv
Classification
SVM
处理不平衡问题后,数据高度倾斜,准确性下降
在对数据进行预处理 例如缺失值替换和异常值检测 后 我使用随机化方法对数据进行分区 并使用 WEKA 删除百分比过滤器 我的数据集是一个高度倾斜的数据集 不平衡比为 6 1 对应于负类和正类 如果我使用朴素贝叶斯分类器对数据进行分类 而不处
Classification
Weka
«
1
2
3
4
5
6
7
8
...11
»