Python（scikit learn）lda 崩溃为单一维度

2024-01-26

总的来说，我对 scikit learn 和机器学习非常陌生。

I am currently designing a SVM to predict if a specific amino acid sequence will be cut by a protease. So far the the SVM method seems to be working quite well:

我想可视化两个类别（剪切和未剪切）之间的距离，因此我尝试使用线性判别分析，它类似于主成分分析，使用以下代码：

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
lda = LinearDiscriminantAnalysis(n_components=2)
targs = np.array([1 if _ else 0 for _ in XOR_list])
DATA = np.array(data_list)
X_r2 = lda.fit(DATA, targs).transform(DATA)
plt.figure()
for c, i, target_name in zip("rg", [1, 0],["Cleaved","Not Cleaved"]):
    plt.scatter(X_r2[targs == i], X_r2[targs == i], c=c, label=target_name)
plt.legend()
plt.title('LDA of cleavage_site dataset')

然而，LDA 只给出一维结果

In: print X_r2[:5]
Out: [[ 6.74369996]
 [ 4.14254941]
 [ 5.19537896]
 [ 7.00884032]
 [ 3.54707676]]

然而，PCA 分析将根据我输入的数据给出 2 个维度：

pca = PCA(n_components=2)
X_r = pca.fit(DATA).transform(DATA)
print X_r[:5]
Out: [[ 0.05474151  0.38401203]
 [ 0.39244191  0.74113729]
 [-0.56785236 -0.30109694]
 [-0.55633116 -0.30267444]
 [ 0.41311866 -0.25501662]]

编辑：这里是两个带有输入数据的谷歌文档的链接。我没有使用序列信息，只是使用后面的数字信息。文件分为阳性和阴性对照数据。输入数据：file1 https://drive.google.com/file/d/0B9fhTraU6SUkT0toQnFMQmFHVjQ/view?usp=sharing file2 https://drive.google.com/file/d/0B9fhTraU6SUkZkdkbm0wa18wZG8/view?usp=sharing

LDA 不是一种降维技术。 LDA 是一个分类器，人们可视化的事实决策函数只是一个副作用，并且 - 不幸的是对于您的用例 - 二元问题（2类）的决策函数是1维。您的代码没有任何问题，这就是线性二元分类器的每个决策函数的样子。

一般来说，对于 2 个类别，您最多可以获得 1 维投影，而对于 K>2 类别，您最多可以获得 K 维投影。使用其他分解技术（例如 1 vs 1），您可以达到 K(K-1)/2，但同样，仅限于 2 个以上的类。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python（scikit learn）lda 崩溃为单一维度的相关文章

如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
scikit学习逻辑回归方程

我已经在 iris 数据集上运行了逻辑回归直到这段代码我才清楚之后我想形成方程来对测试数据进行评分该怎么做我知道我可以使用预测函数对测试进行评分但是我想查看参数和各自的权重能否请你帮忙 from sklearn import d
如何使用 lstm 执行多类多输出分类

I have multiclass multioutput classification see https scikit learn org stable modules multiclass html https scikit lear
scikit-learn LinearRegression 的意外交叉验证分数

我正在尝试学习使用 scikit learn 来完成一些基本的统计学习任务我认为我已经成功创建了适合我的数据的线性回归模型 X train X test y train y test cross validation train test
如何在 keras 模型中使用张量流度量函数？

使用Python 3 5 2张量流RC 1 1 我正在尝试在 keras 中使用张量流度量函数所需的功能接口似乎是相同的但调用 import pandas import numpy import tensorflow contrib k
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
使用 array.reshape(-1, 1) 重塑数组

我有一个名为的数据框data我试图从中找出任何异常价格数据帧头如下所示 Date Last Price 0 29 12 2017 487 74 1 28 12 2017 422 85 2 27 12 2017 420 64 3 22 12
深度学习和传统的人工神经网络机器学习有什么区别？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案您能否简要解释一下两者之间的差异深度学习 https developer nvidia com deep learning和利用神经网
为什么反向传播神经网络中必须使用非线性激活函数？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我一直在阅读一些有关神经网络的内容并且了解单层神经网络的一般原理我理解需要额外的层但为什么要使用非线性激活函数这个问题后面跟着这个
训练多维高斯过程回归的超参数

这是一个简单的代码工作实现我在 Python 的 scikit learn 中使用高斯过程回归 GPR 和二维输入即网格x1 and x2 和一维输出 y import numpy as np from matplotlib impor
在逻辑回归中使用排名数据

当我努力学习这些概念时我将对此给予最大赏金我正在尝试在逻辑回归中使用一些排名数据我想使用机器学习来制作一个简单的分类器来判断网页是否好这只是一个学习练习所以我不期望有很好的结果只是希望学习过程和编码技术我已将数据放入 c
sklearn：如何在 sknn 中重置回归器或分类器对象

我定义了一个回归器如下所示 nn1 Regressor layers Layer Rectifier units 150 Layer Rectifier units 100 Layer Linear regularize L2 dropo
如何解决错误：PyTorch 中预期输入批量大小与目标批量大小不匹配？

我尝试通过 PyTorch 在 CIFAR10 数据集上创建逻辑模型但是我收到错误 ValueError 预期输入batch size 900 与目标batch size 300 匹配我认为正在发生的事情是 3 100 是 300 所以
地图应用的聚类算法

我正在研究地图上的聚类点纬度经度对于快速且可扩展的合适算法有什么建议吗更具体地说我有一系列纬度经度坐标和一个地图视口我正在尝试将靠近的点聚集在一起以消除混乱我已经有了解决问题的方法 see here http bouldr
Scikit - 结合比例和网格搜索

我是 scikit 的新手在结合数据规模和网格搜索时遇到两个小问题高效洁牙机考虑使用 Kfolds 进行交叉验证我希望每次我们在 K 1 折叠上训练模型时数据缩放器例如使用 preprocessing StandardScale
ValueError：未知标签类型：“连续”

我看过其他帖子讨论过这个问题但其中任何一个都可以帮助我我在 Windows x6 机器上使用带有 Python 3 6 0 的 jupyter 笔记本我有一个很大的数据集但我只保留其中的一部分来运行我的模型这是我使用的一段代码 d
提高SVM分类器准确率的技术

我正在尝试使用 UCI 数据集构建一个分类器来预测乳腺癌我正在使用支持向量机尽管我尽最大努力提高分类器的准确性但仍无法超过 97 062 我尝试过以下方法 1 Finding the most optimal C and gamma
如何在 python 中使用 libSVM 计算精度、召回率和 F 分数

我想计算precision recall and f score using libsvm在Python中但我不知道如何我已经发现这个网站 http www csie ntu edu tw cjlin libsvmtools eval
不使用 graphviz/web 可视化决策树

由于某些限制我无法使用 graphviz webgraphviz com 可视化决策树工作网络与另一个世界是封闭的问题是否有一些替代实用程序或一些 Python 代码用于至少非常简单的可视化可能只是决策树的 ASCII 可视化 py
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch

随机推荐

PEP572 中的海象运算符示例

中给出的示例之一PEP572 https www python org dev peps pep 0572 is Reuse a value that s expensive to compute y f x y 2 y 3 目前在 pyt
变换后的子项在 Safari 中被父项背景剪裁，与 z-index 无关。为什么？

我有这个加载器在所有内容中都渲染得很好但 Safari 除外 pageLoader min height 100vh min width 100vw background color white z index 2 position f
更新 /.pub-cache 中的 flutter 依赖项

我在文件夹里删除了 pub cache hosted pub dartlang org this plugin 更新里面的依赖的命令是什么pubsec yaml 我相信是的颤振包获取下的文件夹 pub cache仍然不是最新的注意有
当视图模型没有域模型那么多的字段时，如何忽略/保留 MVC 中的值？

我有一个网站我正在使用 FluentNhibernate 和 Asp net MVC 我有一个编辑视图允许用户编辑该记录对象的 10 个属性中的 8 个当您提交表单和模型绑定时两个不可编辑的字段将作为空字符串或默认日期时间值返回
提取边界内的图像区域

我必须使用 2D CT 图像做一个项目并使用 Matlab 仅对其中的肝脏和肿瘤进行分割最初我必须单独分割肝脏区域我使用区域生长进行肝脏分割它获取种子点作为输入输出是具有肝脏区域边界的图像现在我需要仅由边界包围的区域我的程序
java.lang.IndexOutOfBoundsException: setSpan (N ... N) 结束长度超出 10500

当我打电话时我得到这个异常EditText setSelection java lang IndexOutOfBoundsException setSpan N N ends beyond length 10500 N 可以是任意数字例如
jqGrid 字体设置被 jQueryUI 选项卡设置覆盖

我有类似的问题this one https stackoverflow com questions 7282130 wrong font size when using jqgrid inside jqueryui tab 我使用 jQue
删除 PANDAS 中的第二行标题

我在 PANDAS 中有一个数据框其中有两行标题如何删除第二行例如我有以下内容 AA BB CC DD A B C D Index 1 1 2 3 4 2 5 6 7 8 3 9 1 2 3 我想要得到这样的东西 AA BB CC
“自动化错误：调用的对象已与其客户端断开连接”

我明白了尼克的建议以下是我收到的错误号和描述 2147417848 80010108 自动化错误调用的对象有与客户断开连接我调试时突出显示的代码行是 Rows Lst Insert Shift xlDown 我以为我在这个或另一个论
ReactJS 使用动态键及其数据迭代状态数组

我有一个像这样的数组 data key1 key val1 data1 key val2 data2 key val3 data3 key val4 data4 key2 key val1 data1 key val2 data2 key
Maven依赖groovy

我正在运行一个依赖于 groovy 1 7 beta 1 的项目 gmaven 插件使用 groovy 版本 1 6 作为依赖项在我的 pom 中我在依赖管理部分将 grooyv all 版本指定为
这个 Sql 语句可以重构为不使用 RANK/PARTITION 吗？

我有以下 sql 语句它运行得很好我希望看到如何重构它这样它就不需要使用 RANK PARTITION 如果可能的话 SELECT LogEntryId FileId CreatedOn EventTypeId FROM SELECT
过早离开常规脚本的最佳方法是什么（system.exit(0) 除外）

过早留下常规脚本的最佳方法是什么 groovy 脚本从给定的信息文件中读取一行然后进行一些验证工作如果验证失败数据不一致脚本需要提前离开流程然后系统将再次调用脚本来读取同一信息文件的下一行代码示例 read a row try
抛出 Google Awareness API SecurityException

我在用着检测到的活动栅栏 https developers google com android reference com google android gms awareness fence DetectedActivityFence
为什么这个关键字在java接口中使用，它指的是什么？

我只是想我可以使用this中的关键字interface So if this关键字代表当前classa 中的对象引用class 那么它代表什么interface interface InterfaceOne default void dis
如何在 ruby on Rails 应用程序中使用 CSS？

如何将 CSS 与 RoR 结合使用当我链接到外部时我永远无法看到这些文件我将 css 文件复制到我能想到的每个文件夹中视图控制器模板但似乎没有任何效果我需要做什么才能使用 Rails 应用程序启用外部 CSS 文件我是
我如何显式清除字节[]

我正在创建新的字节数组这些数组不被 GC 收集并且存在于内存中并增加私有字节下面的代码每 10 秒执行一次使用完变量后如何显式清除该变量 byte outputMessage new byte 10000 Do some work
Django：当通过 ModelForm 创建帖子时如何将用户与创建的帖子相关联

我创建了一个普通的 Django 帖子应用程序它基本上让用户创建帖子及其内容现在的问题是我将创建帖子表单实现为ModelForm在 forms py 中现在如果不是ModelForm只是一个 html 表单我会使用request P
如果我使用“CreateObject()”设置变量，使用后是否需要通过将其设置为“Nothing”来清理它？

如果我使用设置变量CreateObject 我是否需要通过将其设置为来清理它Nothing使用后 Dim foo Set foo CreateObject SomeAssembly foo Bar Set foo Nothing 我刚刚发现
Python（scikit learn）lda 崩溃为单一维度

总的来说我对 scikit learn 和机器学习非常陌生 I am currently designing a SVM to predict if a specific amino acid sequence will be cut b

Python（scikit learn）lda 崩溃为单一维度

Python（scikit learn）lda 崩溃为单一维度 的相关文章

随机推荐

热门标签

Python（scikit learn）lda 崩溃为单一维度的相关文章