Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何处理分类中的低频样本?
我面临一个文本分类问题 我需要将示例分类为 34 组 问题是 34组的训练数据大小不平衡 对于某些组 我有 2000 多个示例 而对于某些组 我只有 100 多个示例 对于一些小群体 分类准确率相当高 我想这些群体可能有特定的关键词来识别和
machinelearning
Classification
ROC曲线和libsvm
给定一条 ROC 曲线plotroc m see here http www csie ntu edu tw cjlin libsvmtools roc curve for binary svm 理论问题 如何选择要使用的最佳阈值 编程问题
MATLAB
Classification
SVM
Libsvm
ROC
朴素贝叶斯分类器仅基于先验概率做出决策
我试图根据推文的情绪将推文分为三类 买入 持有 卖出 我正在使用 R 和包 e1071 我有两个数据框 一个训练集和一组需要预测情绪的新推文 训练集数据框 text sentiment this stock is a good buy Bu
r
machinelearning
Classification
textmining
Keras:binary_crossentropy 和 categorical_crossentropy 混淆
使用 TensorFlow 一段时间后 我阅读了一些 Keras 教程并实现了一些示例 我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数 我想binary crossentro
python
tensorflow
Keras
Classification
crossentropy
神经网络 - 我的网络似乎训练得很好,但在分类报告中它是完全随机的
我正在训练一个模型来对 3 种类型的车辆进行分类 一切看起来都很顺利 直到我尝试用我的模型预测任何事情 预测结果是完全随机的 我使用 3 个类别的 15000 张图像 每个类别 5000 个 进行训练 并使用 3 个类别的 6000 个图像
Keras
deeplearning
Classification
convneuralnetwork
tensor
理解高斯混合模型的概念
我试图通过阅读在线资源来理解 GMM 我已经使用 K 均值实现了聚类 并且正在了解 GMM 与 K 均值的比较 以下是我的理解 如有错误请指出 GMM 类似于 KNN 在这两种情况下都实现了聚类 但在 GMM 中 每个簇都有自己独立的均值和
MATLAB
machinelearning
Classification
clusteranalysis
mixturemodel
使用 to_categorical 转换 np.array 时出现内存问题
我有一个像这样的 numpy 数组 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 我这样改造它以减少内存需求 x val x val asty
python
NumPy
machinelearning
Keras
Classification
如何使用WordNet或与wordnet相关的类别来实现基于类别的文本标记?
如何使用wordnet按单词类别标记文本 java作为接口 Example 考虑以下句子 1 计算机需要键盘 显示器 CPU才能工作 2 汽车使用齿轮和离合器 现在我的目标是 例句必须标记为 第 1 句话 电脑 电子键盘 电子中央处理器 电
Java
machinelearning
NLP
Classification
WordNet
使用 scikit-learn 在朴素贝叶斯分类器中混合类别数据和连续数据
我正在使用 Python 中的 scikit learn 开发分类算法来预测某些客户的性别 除此之外 我想使用朴素贝叶斯分类器 但我的问题是我混合了分类数据 例如 在线注册 接受电子邮件通知 等 和连续数据 例如 年龄 长度 会员资格 等
python
machinelearning
datamining
Classification
scikitlearn
使用 CNN 和 pytorch 计算每个类别的准确度
我可以使用此代码计算每个时期后的准确性 但是 我想最后计算每个班级的准确性 我怎样才能做到这一点 我有两个文件夹 train 和 val 每个文件夹有 7 个不同类别的 7 个文件夹 train 文件夹用于训练 否则 val 文件夹用于测试
Pytorch
Classification
trainingdata
convneuralnetwork
loss
批量大小不适用于带有deploy.prototxt的caffe
我正在努力让我的分类过程更快一些 我想增加我的deploy prototxt中的第一个input dim 但这似乎不起作用 甚至比对每张图像进行分类还要慢一点 部署 prototxt input data input dim 128 inp
neuralnetwork
Classification
deeplearning
caffe
pycaffe
如何使用 lstm 执行多类多输出分类
I have multiclass multioutput classification see https scikit learn org stable modules multiclass html https scikit lear
python
Keras
scikitlearn
Classification
LSTM
为什么我的精确率-召回率和 ROC 曲线不平滑?
我有一些标记为 0 或 1 的数据 我正在尝试使用随机森林来预测这些类别 每个实例都标有 20 个用于训练随机森林的特征 约 30 000 个训练实例和约 6000 个测试实例 我使用以下代码绘制精确召回率和 ROC 曲线 precisio
python
machinelearning
scikitlearn
Classification
RandomForest
增量决策树 C++ 实现
有谁知道决策树分类器的增量实现吗 这样 当您将新实例添加到训练集中时 它可以根据现有决策树分类器以低计算量并尽可能快地生成最佳决策树分类器 换句话说 我有一个最优决策树分类器集A 其中命名为T 1 现在我想添加实例X to set A并找到
c
Algorithm
Classification
敏感性特异性图 python
我正在尝试重现类似于此的灵敏度特异性图 其中 X 轴是阈值 但我还没有找到如何做到这一点 一些 skalern 指标 如 ROC 曲线 会返回真阳性和假阳性 但我还没有找到任何选项来制作此图 我试图将概率与实际标签进行比较以保持计数 我得到
python
machinelearning
scikitlearn
Classification
使用决策树
我知道 tl dr 我将尝试解释我的问题 而不会用大量蹩脚的代码来打扰您 我正在做一项学校作业 我们有蓝精灵的图片 我们必须通过前景背景分析来找到它们 我有一个 Java 决策树 其中包含所有数据 HSV 直方图 1 一个节点 然后尝试找到
ID3和C4.5:“增益比”如何标准化“增益”?
ID3算法使用 信息增益 度量 C4 5 使用 增益比 度量 即信息增益除以SplitInfo 然而SplitInfo对于记录在不同结果之间平均分配的分割 该值较高 否则较低 我的问题是 这如何帮助解决信息增益偏向于具有多种结果的分裂的问题
Math
statistics
computerscience
datamining
Classification
车辆分割和跟踪
我已经从事一个项目一段时间了 目的是在无人机捕获的视频中检测和跟踪 移动 车辆 目前我正在使用 SVM 该 SVM 接受了从车辆和背景图像中提取的局部特征的特征袋表示的训练 然后 我使用滑动窗口检测方法来尝试定位图像中的车辆 然后我想要跟踪
opencv
tracking
Classification
imagesegmentation
objectdetection
分类报告 - 精度和 F 分数定义不明确
我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met
python
machinelearning
scikitlearn
Classification
Scikit-learn:如何获得 True Positive、True Negative、False Positive 和 False Negative
我的问题 我有一个数据集 它是一个很大的 JSON 文件 我读取它并将其存储在trainList多变的 接下来 我对其进行预处理 以便能够使用它 完成后 我开始分类 我用kfold交叉验证方法以获得平均值 准确性并训练分类器 我做出预测并获
python
machinelearning
scikitlearn
Classification
supervisedlearning
1
2
3
4
5
6
...11
»