Classification

如何处理分类中的低频样本？

我面临一个文本分类问题我需要将示例分类为 34 组问题是 34组的训练数据大小不平衡对于某些组我有 2000 多个示例而对于某些组我只有 100 多个示例对于一些小群体分类准确率相当高我想这些群体可能有特定的关键词来识别和

machinelearning Classification

ROC曲线和libsvm

给定一条 ROC 曲线plotroc m see here http www csie ntu edu tw cjlin libsvmtools roc curve for binary svm 理论问题如何选择要使用的最佳阈值编程问题

MATLAB Classification SVM Libsvm ROC

朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu

r machinelearning Classification textmining

Keras：binary_crossentropy 和 categorical_crossentropy 混淆

使用 TensorFlow 一段时间后我阅读了一些 Keras 教程并实现了一些示例我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数我想binary crossentro

python tensorflow Keras Classification crossentropy

神经网络 - 我的网络似乎训练得很好，但在分类报告中它是完全随机的

我正在训练一个模型来对 3 种类型的车辆进行分类一切看起来都很顺利直到我尝试用我的模型预测任何事情预测结果是完全随机的我使用 3 个类别的 15000 张图像每个类别 5000 个进行训练并使用 3 个类别的 6000 个图像

Keras deeplearning Classification convneuralnetwork tensor

理解高斯混合模型的概念

我试图通过阅读在线资源来理解 GMM 我已经使用 K 均值实现了聚类并且正在了解 GMM 与 K 均值的比较以下是我的理解如有错误请指出 GMM 类似于 KNN 在这两种情况下都实现了聚类但在 GMM 中每个簇都有自己独立的均值和

MATLAB machinelearning Classification clusteranalysis mixturemodel

使用 to_categorical 转换 np.array 时出现内存问题

我有一个像这样的 numpy 数组 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 我这样改造它以减少内存需求 x val x val asty

python NumPy machinelearning Keras Classification

如何使用WordNet或与wordnet相关的类别来实现基于类别的文本标记？

如何使用wordnet按单词类别标记文本 java作为接口 Example 考虑以下句子 1 计算机需要键盘显示器 CPU才能工作 2 汽车使用齿轮和离合器现在我的目标是例句必须标记为第 1 句话电脑电子键盘电子中央处理器电

Java machinelearning NLP Classification WordNet

使用 scikit-learn 在朴素贝叶斯分类器中混合类别数据和连续数据

我正在使用 Python 中的 scikit learn 开发分类算法来预测某些客户的性别除此之外我想使用朴素贝叶斯分类器但我的问题是我混合了分类数据例如在线注册接受电子邮件通知等和连续数据例如年龄长度会员资格等

python machinelearning datamining Classification scikitlearn

使用 CNN 和 pytorch 计算每个类别的准确度

我可以使用此代码计算每个时期后的准确性但是我想最后计算每个班级的准确性我怎样才能做到这一点我有两个文件夹 train 和 val 每个文件夹有 7 个不同类别的 7 个文件夹 train 文件夹用于训练否则 val 文件夹用于测试

Pytorch Classification trainingdata convneuralnetwork loss

批量大小不适用于带有deploy.prototxt的caffe

我正在努力让我的分类过程更快一些我想增加我的deploy prototxt中的第一个input dim 但这似乎不起作用甚至比对每张图像进行分类还要慢一点部署 prototxt input data input dim 128 inp

neuralnetwork Classification deeplearning caffe pycaffe

如何使用 lstm 执行多类多输出分类

I have multiclass multioutput classification see https scikit learn org stable modules multiclass html https scikit lear

python Keras scikitlearn Classification LSTM

为什么我的精确率-召回率和 ROC 曲线不平滑？

我有一些标记为 0 或 1 的数据我正在尝试使用随机森林来预测这些类别每个实例都标有 20 个用于训练随机森林的特征约 30 000 个训练实例和约 6000 个测试实例我使用以下代码绘制精确召回率和 ROC 曲线 precisio

python machinelearning scikitlearn Classification RandomForest

增量决策树 C++ 实现

有谁知道决策树分类器的增量实现吗这样当您将新实例添加到训练集中时它可以根据现有决策树分类器以低计算量并尽可能快地生成最佳决策树分类器换句话说我有一个最优决策树分类器集A 其中命名为T 1 现在我想添加实例X to set A并找到

c Algorithm Classification

敏感性特异性图 python

我正在尝试重现类似于此的灵敏度特异性图其中 X 轴是阈值但我还没有找到如何做到这一点一些 skalern 指标如 ROC 曲线会返回真阳性和假阳性但我还没有找到任何选项来制作此图我试图将概率与实际标签进行比较以保持计数我得到

python machinelearning scikitlearn Classification

使用决策树

我知道 tl dr 我将尝试解释我的问题而不会用大量蹩脚的代码来打扰您我正在做一项学校作业我们有蓝精灵的图片我们必须通过前景背景分析来找到它们我有一个 Java 决策树其中包含所有数据 HSV 直方图 1 一个节点然后尝试找到

ID3和C4.5：“增益比”如何标准化“增益”？

ID3算法使用信息增益度量 C4 5 使用增益比度量即信息增益除以SplitInfo 然而SplitInfo对于记录在不同结果之间平均分配的分割该值较高否则较低我的问题是这如何帮助解决信息增益偏向于具有多种结果的分裂的问题

Math statistics computerscience datamining Classification

车辆分割和跟踪

我已经从事一个项目一段时间了目的是在无人机捕获的视频中检测和跟踪移动车辆目前我正在使用 SVM 该 SVM 接受了从车辆和背景图像中提取的局部特征的特征袋表示的训练然后我使用滑动窗口检测方法来尝试定位图像中的车辆然后我想要跟踪

opencv tracking Classification imagesegmentation objectdetection

分类报告 - 精度和 F 分数定义不明确

我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met

python machinelearning scikitlearn Classification

Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获

python machinelearning scikitlearn Classification supervisedlearning