从 SciPy 稀疏矩阵填充 Pandas SparseDataFrame

2023-12-06

我注意到熊猫现在有支持稀疏矩阵和数组。目前，我创建DataFrame()像这样：

return DataFrame(matrix.toarray(), columns=features, index=observations)

有没有办法创建一个SparseDataFrame() with a scipy.sparse.csc_matrix() or csr_matrix()？转换为密集格式会严重消耗 RAM。谢谢！

ATM 不支持直接转换。欢迎贡献！

试试这个，在内存上应该没问题，因为 SpareSeries 很像 csc_matrix （对于 1 列）而且空间利用率很高

In [37]: col = np.array([0,0,1,2,2,2])

In [38]: data = np.array([1,2,3,4,5,6],dtype='float64')

In [39]: m = csc_matrix( (data,(row,col)), shape=(3,3) )

In [40]: m
Out[40]: 
<3x3 sparse matrix of type '<type 'numpy.float64'>'
        with 6 stored elements in Compressed Sparse Column format>

In [46]: pd.SparseDataFrame([ pd.SparseSeries(m[i].toarray().ravel()) 
                              for i in np.arange(m.shape[0]) ])
Out[46]: 
   0  1  2
0  1  0  4
1  0  0  5
2  2  3  6

In [47]: df = pd.SparseDataFrame([ pd.SparseSeries(m[i].toarray().ravel()) 
                                   for i in np.arange(m.shape[0]) ])

In [48]: type(df)
Out[48]: pandas.sparse.frame.SparseDataFrame

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

scipy

pandas

sparsematrix

从 SciPy 稀疏矩阵填充 Pandas SparseDataFrame 的相关文章

如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

如何通过运行应用程序在 Tomcat 上部署 Web 应用程序

我想开发更新程序应用程序可以说我有运行Tomcat 在 Tomcat 上运行更新程序应用程序在同一个 Tomcat 上运行旧版本的应用程序我想停止旧应用程序取消部署旧应用程序部署新版本的应用程序假设我在更新程序应用程序资源中
当我在棒棒糖 5.1 中单击浏览器上的共享时，我的应用程序不显示

当您单击任何网络链接上的共享时我尝试打开我的应用程序我该怎么做我需要广告任何许可吗我已添加下面的代码但我在共享列表中没有看到我的应用程序我怎样才能让它发挥作用我真的很感谢任何帮助显现
自定义注释 JSF

我想制作自定义注释来检查 JSF Web 应用程序某些功能的安全性为了安全起见我将 Tomcat 安全性与 JaaS 结合使用因此我没有可用的应用程序管理安全性实际上想要做的是在 Spring Security Secured ro
如果无法继承QSlider，如何为滑块添加刻度线

我有一个 Qt 对话框里面有一个滑块当对话框初始化时滑块将被设置一个值为了提醒用户默认值是什么我想给滑块添加一个标记只需在手柄上方画一条线或一个三角形即可这里滑块应该是QSlider类型这意味着我无法实现从QSlider派
Neo4j 强制索引的问题

我遇到了一个问题我在 Cypher 批量查询中强制使用索引 UNWIND rows AS row MATCH s Entity USING INDEX s Entity uuid WHERE s uuid row source MATCH
如何在postgresql中查找任意大小的数组的所有组合（子集）[重复]

这个问题在这里已经有答案了给定一个数组如何在 postgresql 中查找特定大小的元素的所有组合子集例如给定一个数组 1 2 3 4 大小为 3 的所有组合都是 1 2 3 1 2 4 1 3 4 2 3 4 组合中的顺序并不重
NSURLSession：如何增加 URL 请求的超时时间？

我正在使用iOS 7的新功能NSURLSessionDataTask检索数据如下 NSURLSession session NSURLSession sharedSession NSURLSessionDataTask dataTask s
游戏中的卡牌等级

我是一名 Java 初学者因此任何帮助将不胜感激我设计了一个卡片类和甲板类我将在我创建的游戏中使用它们到目前为止我的游戏似乎运行得很好但问题出在我的 Cards 类上我想利用 getRank 方法为玩家拥有的牌无论花色如何
如何在数据表列标题的过滤框中添加占位符文本

我有一个素数面孔数据表其中只有几列并且所有列都有 filteryBy 属性如何添加占位符或水印来为用户提供提示任何建议将不胜感激
函数数组<可选> -> 可选<数组>

这是我想做的 extension Array
Woocommerce 禁用自动订单状态更改挂起->处理

我想禁用这个选项每当有人在我的网站上制作和订购并且付款成功时订单状态会自动从待处理但是我不想要此功能已启用相反我想在处理订单时手动执行此操作我在 woocommerce 中发现了此功能这使得此功能成为可能我不想直接在那里更
Gem 安装 ruby-audio 失败

我已经克隆了一个现有的存储库并且现在正在运行bundle install 由于某种原因它在 ruby audio gem 上失败了 Installing ruby audio 1 6 1 with native extensions Ge
重新格式化列中的日期

我在 SQLite DB 中有一些以下形式的数据 id column1 date 111 280 1 1 2014 114 275 1 2 2014 日期字段的类型为 TEXT 我已被告知 https www sqlite org lang
docker 如何使用带引号的新命令提交 docker

在制作 docker 的过程中我必须将其命令从 bin sh 更改为nginx g daemon off 正是如此 I wrote docker commit change EXPOSE 80 change CMD nginx g dae
MongoDB：按日期查询

在 MongoDB 数据库中我有一个项目集合每个项目都存储其创建日期我需要按日期查询这个集合我试过 db items findOne date new Date 1285947037 1000 但它没有返回任何东西我使用 PHP
FreeType 如何渲染 ü ä ö 等特殊字符？

我一直坚持使用 FreeType 渲染文本尤其是非ascii字符让我头疼经过一番尝试和错误后我设法呈现一些文本但我的变音符号没有显示 std string text Hauptmen for std string iterator
MVC C# 下拉列表在模型上显示 System.Web.SelectListItem 并且不能盲视控制器

请帮我我的下拉列表显示System Web SelectListItem在调试模式下但不显示我在列表中定义的实际文本任何人都可以帮忙吗如何使控制器具有我在列表中定义的文本而且我的下拉列表在选择时并不盲目请帮我这是它的样子请看
将 JComponent 重置为默认值

例如如果组件是一个复选框则必须设置为 false 或者它是一个文本字段则必须清除文本我正在尝试编写一种重置所有组件的方法JPanel 它必须像 HTML 表单中的重置功能一样工作如何重置JComponent到默认值作为一名优秀的
当目录名称包含方括号“[ ]”等特殊字符时，Glob 不起作用

当路径目录带有方括号时我在使用 glob 函数时遇到问题 Example 1 working path temp DIRECTORY SEPARATOR dir name files glob path DIRECTORY SEPARAT
从 SciPy 稀疏矩阵填充 Pandas SparseDataFrame

我注意到熊猫现在有支持稀疏矩阵和数组目前我创建DataFrame 像这样 return DataFrame matrix toarray columns features index observations 有没有办法创建一个Spar

从 SciPy 稀疏矩阵填充 Pandas SparseDataFrame

从 SciPy 稀疏矩阵填充 Pandas SparseDataFrame 的相关文章

随机推荐

热门标签