如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

2024-01-29

我正在跟进Python 中的主成分分析 https://stackoverflow.com/questions/1730600/principal-component-analysis-in-python在Python下使用PCA，但我很难确定which可供选择的特征（即我的哪些列/特征具有最佳方差）。

当我使用scipy.linalg.svd，它会自动对我的奇异值进行排序，所以我无法分辨它们属于哪一列。

示例代码：

import numpy as np
from scipy.linalg import svd
M = [
     [1, 1, 1, 1, 1, 1],
     [3, 3, 3, 3, 3, 3],
     [2, 2, 2, 2, 2, 2],
     [9, 9, 9, 9, 9, 9]
]
M = np.transpose(np.array(M))
U,s,Vt = svd(M, full_matrices=False)
print s

在不对奇异值进行排序的情况下，是否有其他方法可以解决此问题？

Update:看起来这可能是不可能的，至少根据 Matlab 论坛上的这篇文章：http://www.mathworks.com/matlabcentral/newsreader/view_thread/241607 http://www.mathworks.com/matlabcentral/newsreader/view_thread/241607。如果有人知道其他情况，请告诉我:)

我对 PCA 的印象是错误的特征选择，而相反特征提取.

相反，PCA 创建了一系列新的特征，每个特征都是输入特征的组合。

来自 PCA，如果你真的想做的话特征选择，您可以查看输入特征在 PCA 创建的特征上的权重。例如，matplotlib.mlab.PCA库提供属性中的权重（有关图书馆的更多信息 http://www.clear.rice.edu/comp130/12spring/pca/pca_docs.shtml#a):

from matplotlib.mlab import PCA
res = PCA(data)
print "weights of input vectors: %s" % res.Wt

听起来像特征提取不过，route 是使用 PCA 的方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？的相关文章

Pandas apply 与 np.vectorize 从现有列创建新列的性能

我正在使用 Pandas 数据框并希望创建一个新列作为现有列的函数我还没有看到关于之间速度差异的很好的讨论df apply and np vectorize 所以我想我会在这里问熊猫apply 功能很慢根据我的测量在一些实验中如下
DataFrame 在函数内部修改

我面临一个我以前从未观察到的函数内数据帧修改的问题有没有一种方法可以处理这个问题以便初始数据帧不被修改 def test df df tt np nan return df dff pd DataFrame data 现在当我打印时d
KFold 和 ShuffleSplit CV 有什么区别？

看起来 KFold 每次迭代对象时都会生成相同的值而 Shuffle Split 每次都会生成不同的索引它是否正确如果是这样其中一个相对于另一个有什么用处 cv cross validation KFold 10 n folds 2
为什么 tkinter / window.update 在我的程序中随着时间的推移变得更慢？

我发现当我调用 window update 时当向窗口写入的内容较少时它的运行速度会更快但后来当我向窗口写入更多元素时 window update 需要更长的时间请参阅下面的我的代码您可以看到它在更新窗口之前一次向屏幕 100
Python 遍历目录树的方法是什么？

我觉得分配文件和文件夹并执行 item 部分有点黑客有什么建议么我正在使用Python 3 2 from os import from os path import def dir contents path contents list
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
将 API 数据存储到 DataFrame 中

我正在运行 Python 脚本来从 Interactive Brokers API 收集金融市场数据连接到API后终端打印出请求的历史数据如何将数据保存到数据帧中而不是在终端中流式传输 from ibapi wrapper impor
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
错误：无法访问文件“$libdir/plpython2”：没有这样的文件或目录

我正在运行 postgresql 9 4 PostgreSQL 9 4 4 on x86 64 unknown linux gnu compiled by gcc GCC 4 1 2 20070626 Red Hat 4 1 2 14 64
如何从 Python 中指定运行程序的输入文件？

我正在编写一个外部脚本以通过笔记本电脑上的 Python mrjob 模块而不是在 Amazon Elastic Compute Cloud 或任何大型集群上运行 mapreduce 作业我读自mrjob文档 http packag
在Python中删除带有重音符号的字符串中的所有非字母字符

我正在尝试使用 Python 3 7 从包含重音符号的字符串中删除所有非字母字符空格除外我尝试了以下方法 import re text 29 1981 4 2008 clean text re sub W d text print cl
pip 安装软件包两次

不幸的是我无法重现它但我们已经见过几次了 pip 将一个软件包安装两次如果卸载第一个第二个就会可见并且也可以被卸载我的问题如果一个包安装了两次如何用 python 检查背景我想编写一个测试来检查这一点 devOp Updat
Spark中的count和collect函数抛出IllegalArgumentException

当我使用时抛出此异常时我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效我试图搜索这个问题但没有找到原因看来RDD的分区有问题有任何想法吗先感谢您 sc stop sc Spark
如何强制 Y 轴仅使用整数

我正在使用 matplotlib pyplot 模块绘制直方图我想知道如何强制 y 轴标签仅显示整数例如 0 1 2 3 等而不显示小数例如 0 0 5 1 1 5 2 等我正在查看指导说明并怀疑答案就在附近matplotlib
最小硬币找零问题——回溯

我正在尝试用最少数量的硬币解决硬币找零问题采用回溯法我实际上已经完成了它但我想添加一些选项按其单位打印硬币数量而不仅仅是总数这是我下面的Python代码 def minimum coins coin list change mi
在游戏中实现功能

我在完成这部分作业时遇到了麻烦我必须宣布游戏的获胜者然后输入到函数中输入所有 if 语句后我必须创建一个函数def playGame 这必须包括 showRules user getUserChoice computer getCo
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client

随机推荐

运行 paramiko 时 Python 模块 ecdsa 错误

我正在尝试安装 paramiko 模块它失败并出现以下错误 python test py Traceback most recent call last File test py line 30 in
为什么当我为 CABasicAnimation 设置较低的持续时间值时，它会跳跃？

示例项目 http cl ly 1W3V3b0D2001 http cl ly 1W3V3b0D2001 我在用着CABasicAnimation创建一个类似于饼图的进度指示器类似于iOS 7应用程序下载动画动画设置如下 void dr
在 Cloud Firestore 安全规则中将字符串转换为 Int

I am 来自这个问题 https stackoverflow com q 48795711 6509751 我想过开始对它进行赏金因为它已经几个月没有受到任何关注而且随着时间的推移我没有看到任何答案但我认为我的愿望有点不同如果有一
使用 addTextTrack() 动态更改 videojs 字幕

我正在尝试构建一些类似视频库的东西您可以通过单击缩略图来选择要显示的视频现在我正处于为所选视频加载适当字幕的阶段感谢谷歌我了解到 videojs 有一个名为 addTextTrack 的方法来帮助我但不幸的是没有一个好的示例或文档
JRuby - Warbler 不保留符号链接

使用 warbler 打包应用程序时符号链接会丢失符号链接指向的实际内容将打包为 WAR 的一部分就我而言我有一个从 public images upload 到 var myproject upload 的符号链接在 tomca
删除网络推送通知

有没有办法在显示后删除网络推送通知要将其从设备上的通知列表中删除或将其标记为已读我认为这不能从服务器完成并且我一直在寻找 Javascript API 但我没有找到任何东西我试图解决的更广泛的问题是如何在多个屏幕浏览器设备上
背后的概念是什么：类型-元素-镜子

我正在使用 Java 6 的注释处理即可以在其中找到什么javax annotation processing 不是 Java 5 的 APT 我想知道各种之间的概念差异是什么Element Type and Mirror类群岛由于我不太
使用 python 处理 ember.js 标记的 html

我有以下场景我们正在使用web2py http www web2py com在服务器端我们正在服务一些ember js http emberjs com pages 目前这些 ember js 页面位于 iframe 内因为ember
docker：如何显示两个图像之间的差异

我有一个 Dockerfile 其中包含一系列执行 apt get install 的 RUN 指令例如几行 RUN apt get install y tree RUN apt get install y git 执行 docker
Windows Azure 存储（Blob、表、队列）是否针对 Windows Azure 角色的访问进行了优化？

我目前正在考虑在 Windows Azure 上托管弹性搜索 http www elasticsearch org 执行加载应用程序并在 Java 下运行它并不那么困难现在 ElasticSearch仅支持亚马逊的S3 http ela
Jetpack Compose 使用 CoroutineScope 滚动 LazyColumn 结果错误 A MonotonicFrameClock 在此 CoroutineContext 中不可用

退房这个例子 https developer android com codelabs jetpack compose layouts 5使用状态和协程滚动列表 Composable fun ScrollingList val listSi
使用一次更新设置多列

如何在mysql中使用更新查询设置表的多列只需添加参数用逗号分隔 UPDATE tablename SET column1 value1 column2 value2 也可以看看 mySQL 更新手册 http dev mysql co
如何在 VS2010 Express 中使静态库独立于发布/调试？

我正在编写一个应用程序并链接 SDL 和 OpenGL 在我的代码中我有以下几行 pragma comment lib sdl lib pragma comment lib sdlmain lib pragma comment lib o
根据方法参数生成唯一的缓存键

我有一个基本的存储库框架它最终执行查询并将结果映射回对象例如 public SomeEntity Get id return base GetItem
如何在 iOS 中正确变形文本？

我拼命地想改变smallLabel into a bigLabel By morphing 我的意思是转换一个标签的以下属性以匹配另一个标签的相应属性并具有平滑的动画字体大小字体粗细框架即边界和位置所需的效果应该类似于使用大标题
在 2.6 上合并 n 字典并添加值的最快方法[重复]

这个问题在这里已经有答案了我有一个字典列表我想将其组合成一个字典并添加列表中每个字典中的值例如 ds 1 1 2 0 3 0 1 2 2 1 3 0 1 3 2 2 3 1 4 5 最终结果应该是一个字典 merged 1 6 2
PHP：$_POST 全局变量的总长度是多少？

我想知道是否有人知道全球邮政的总长度例如 POST formInput hello world how long can I be 我正在创建一个网站有人会在其中输入未知数量的字符textarea 因此可能是一个 Word 文档的 2
重定向 ip6tables 中的端口

如何使用 ip6tables 将一个端口重定向到另一个本地端口例如像这样的东西 ip6tables t nat A 预路由 j 重定向 p tcp dport 443 to ports 8443 嗯这是一个老问题但因为我需要做同样的事
Android 模拟 Espresso 测试的 Dagger2 注入依赖项

我注入了严重的依赖项 dagger2 应用我想经营一个浓缩咖啡测试无需测试浏览整个应用程序并登录到应用程序我想开始我的 teleActivity 并模拟登录管理器然而在任何 test 函数中当我们调用 onCreate 时我们已
如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

我正在跟进Python 中的主成分分析 https stackoverflow com questions 1730600 principal component analysis in python在Python下使用PCA 但我很难确定

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？ 的相关文章

随机推荐

热门标签

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？的相关文章