为什么创建 SparseDataFrame (Python pandas) 需要这么长时间？

2024-02-20

给出以下代码（在 Jupyter 笔记本中执行）：

In [1]: import pandas as pd
        %time df=pd.SparseDataFrame(index=range(0,1000), columns=range(0,1000));

CPU times: user 3.89 s, sys: 30.3 ms, total: 3.92 s
Wall time: 3.92 s

为什么创建稀疏数据框需要这么长时间？

请注意，如果我增加行的维度，这似乎是无关紧要的。但是当我将列数从 1000 增加到 10000 时，代码似乎要花很长时间，我总是不得不中止它。

将其与 scipy 的稀疏矩阵进行比较：

In [2]: from scipy.sparse import lil_matrix
        %time m=lil_matrix((1000, 1000))

CPU times: user 1.09 ms, sys: 122 µs, total: 1.21 ms
Wall time: 1.18 ms

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

scipy

jupyter

为什么创建 SparseDataFrame (Python pandas) 需要这么长时间？的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

Bootstrap 4从右到左自定义文件输入

我正在尝试使上传文件输入方向从 bootstrap 4 从右到左但到目前为止我尝试过的都不起作用我还尝试改变不同标签的方向 div class form group div class col md 4 div class custom
我需要有关 NoSQL/MongoDb 和数据/模型结构的建议

最近我正在探索NoSQL 数据库我需要关于如何针对给定问题以最优化最有效的方式存储数据的建议我现在的目标是 MongoDB 不过它应该与 CouchDB 相同假设我们有这 3 个模型 Story id title User id
字符串到二进制，反之亦然：扩展 ASCII

我想通过将字符串放入字节数组中将其转换为二进制 String getBytes 然后存储每个字节的二进制字符串 Integer toBinaryString bytearray 在 String 中然后我想通过转换回普通字符串Byte p
如何获取用户输入的名称并在 edittext 中搜索相应位置

我可以将 Google 地图放入我的 Android 手机中我设置了谷歌地图的搜索选项如果用户给出位置并单击按钮搜索意味着它会在谷歌地图中找到该位置现在我想当用户在 Edittext 中给出位置名称时显示相对位置请给我任何参考 i
用于图像过滤的 3d CUDA 内核索引？

我有一个图像特征矩阵A是n m 31矩阵用于过滤的填充我有B作为对象过滤器k l 31 我想获得一个输出矩阵 C 为 p r 31 其大小为图像 A 的大小无填充我尝试编写 CUDA 代码来在 A 上运行过滤器 B 并获得 C 我假设
Python：s3 中的递归 glob

我试图从 s3 获取子目录和子目录的子目录等等内的 parquet 文件路径列表如果它是我的本地文件系统我会这样做 import glob glob glob C Users user info parquet recursive
在 .Net 中为 64 位计算机创建快捷方式 - 仅编译为 64 位应用程序 [重复]

这个问题在这里已经有答案了可能的重复在目录中创建应用程序快捷方式 https stackoverflow com questions 234231 creating application shortcut in a directory
ActionView::Template::错误：缺少要链接的主机！请提供 :host 参数，设置 default_url_options[:host]，或设置 :only_path 为 true

我的 ruby on Rails 动作邮件程序在开发环境中运行良好但在生产环境中它不断抛出 ActionView Template Error Missing host to link to Please provide the hos
Kubernetes 持久卷声明无限期处于待处理状态

我创建了一个来自 Google Compute Engine 永久磁盘的 PersistentVolume 我已经对其进行了格式化并配置了数据 Kubernetes 表示 PersistentVolume 可用 kind Persisten
如何以编程方式添加地图片段

我想以编程方式将此 xml 片段添加到其他片段是否可以
如何创建带圆角的条纹按钮

是否可以创建一个带有条纹背景和圆角的按钮我知道如何使用制作条纹背景对角线条纹 http www stripegenerator com http www stripegenerator com 和使用tileMode repeat 的位
JUnit 5 中的ExternalResource 和TemporaryFolder 等价物是什么？

根据JUnit 5 用户指南 http junit org junit5 docs current user guide migrating from junit4 rulesupport JUnit Jupiter 为某些 JUnit 4
重定向输出时 Windows 编码发生变化

你好我有以下 python 文件 test py import sys print sys stdout encoding sys stdout reconfigure encoding utf 8 print sys stdout en
基于角色的jwt授权

我正在尝试使用 JSON Web 令牌对 Node js API 进行身份验证我可以生成令牌来验证用户身份现在我需要根据用户角色保护我的 API 以下是我如何路由中间件来验证和检查令牌 var app express var apiRo
如何在其他流的基础上过滤Apache flink流？

我有两个流一个是 Int 另一个是 json 在 json Schema 中有一个键是一些 int 所以我需要通过与另一个整数流的键比较来过滤 json 流那么在 Flink 中是否可能是的您可以使用 Flink 进行这种流处理
在画布上画一条弯曲的路径？

如何绘制二次曲线或三角曲线例如sin x on a Canvas http developer android com reference android graphics Canvas html 像你一样我需要从point x1 y1
C++跨平台蓝牙库

是否有任何用 C 编写的跨平台库可以知道连接到这台电脑的设备列表这里有一些额外的库但没有一个真正适合生产 https github com OpenBluetoothToolbox SimpleBLE https github com
获取嵌入表中最里面的行

我有一个带有嵌套表的表问题是在鼠标事件侦听器中我想抓取最深的行我发现了this https stackoverflow com questions 18874829 how do i highlight only the innerm
JSON简单：整数解析

我在 REST 服务中解析 JSON 整数时遇到问题解析 String 和 double 类型效果很好 Working JSONParser parser new JSONParser Object obj null try obj pa
为什么创建 SparseDataFrame (Python pandas) 需要这么长时间？

给出以下代码在 Jupyter 笔记本中执行 In 1 import pandas as pd time df pd SparseDataFrame index range 0 1000 columns range 0 1000 CPU

为什么创建 SparseDataFrame (Python pandas) 需要这么长时间？

为什么创建 SparseDataFrame (Python pandas) 需要这么长时间？ 的相关文章

随机推荐

热门标签

为什么创建 SparseDataFrame (Python pandas) 需要这么长时间？的相关文章