我有一个包含 250.000 行但 140 列的数据框,我正在尝试构建一个对图。的变量。
我知道子图的数量很大,而且绘制图所需的时间也很多。 (我在 3.4 GHZ 和 32 GB RAM 的 i5 上等待了一个多小时)。
记得 scikit learn 允许并行构建随机森林,我正在检查这对于 seaborn 是否也可行。
然而,我什么也没找到。源代码似乎为每个图像调用 matplotlib 绘图函数。
这不能并行吗?如果是,从这里开始的好方法是什么?
您可以减少采样,而不是并行化DataFrame
也就是说,如果确实存在速度瓶颈,则可以快速查看 1000 行。通常,1000 分足以大致了解正在发生的情况。
i.e. sns.pairplot(df.sample(1000))
.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)