连接两个big pandas.HDFStore HDF5文件

2023-11-26

这个问题在某种程度上与“连接大量HDF5文件”.

我有几个巨大的 HDF5 文件（压缩后约 20GB），无法容纳 RAM。每个都存放几个pandas.DataFrame格式相同且索引不重叠。

我想将它们连接起来，形成一个 HDF5 文件，并正确连接所有 DataFrame。一种方法是逐块读取它们，然后保存到单个文件中，但实际上这会花费相当多的时间。

是否有任何特殊的工具或方法可以在不迭代文件的情况下执行此操作？

请参阅文档here为了odo项目（以前的into）。请注意，如果您使用into库，那么参数顺序已被切换（这就是更改名称的动机，以避免混淆！）

你基本上可以这样做：

from odo import odo
odo('hdfstore://path_store_1::table_name',
    'hdfstore://path_store_new_name::table_name')

执行多个这样的操作将附加到 rhs 存储中。

这将自动为您执行块操作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

HDF5

pytables

连接两个big pandas.HDFStore HDF5文件的相关文章

在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

未弃用的相当于

我想达到同样的目标 window open lalala php lalala 但我想发送 HTTP POST 请求而不是 HTTP GET 请求因此我使用以下内容
收到错误“超出可用参数键空间”？

在我的 Rails 应用程序中表单发布后出现错误exceeded available parameter key space 表单内的表单字段太多这是错误的原因吗有什么看法吗如果您确实非常需要它请尝试增加key space lim
`if [-e file.txt]` 在 bash 中不起作用

我正在尝试使用 bash 检查文件是否存在这是我的代码 if e file txt then echo file exists else echo file doesn t exist fi 但是当我运行它时我得到 test sh lin
更改 rmarkdown 保存 r 代码生成的图像的位置

我有一个 rmarkdown 文档我正在将此文件转换为 md 文档我的问题是我希望将绘图创建的图片放置在文件同一目录中名为 Images 的文件夹中假设我有这个文档 title my test author daniel date 1
MapView 在触摸时添加图钉

我设法让地图显示在屏幕上现在用户将在地图上移动并按下它按下一个点后我需要在屏幕上按下的位置添加一个图钉如果用户决定去另一个点当按下所选点时第一个图钉将消失并且将在新位置绘制一个新图钉我确实是这样的 public class
是否可以在 symfony2 中动态设置路由的默认参数值？

我使用注释在 symfony2 控制器中定义了一条路由例如 Route year name show list for user defaults year 2012 是否可以使默认年份动态化也许从服务对象中读取年份您可以在Reque
计算碰撞后的角速度

我已经相对较好地降低了碰撞分辨率的线性部分但我不太清楚如何对角度部分做同样的事情从我读到的内容来看这就像 torque point of collision x linear velocity 交叉产品我尝试合并我发现的例子进入我的
Scenekit 一些纹理具有红色调

我有一个包含许多对象的场景这些对象都有不同的纹理由于某种原因两个对象具有红色色调即使它们的纹理没有红色您仍然可以在纹理中看到图案只是红色有不同的深浅在模拟器上这两个对象具有黑白纹理在设备上具有红色阴影有人知道为什么会发生
EWS：约会 Item.Id.UniqueId 不是常量

在将 EWS Managed API 2 0 与 Exchange Server 2007 SP3 一起使用时我遇到了一个奇怪的问题当我创建约会并保存它时我使用以下代码获取其 ID appointment Save SendInvit
为什么 mypy 不认为一个类具有 __len__ 和 __getitem__ 但没有 __iter__ 是可迭代的

我正在玩mypy以及 Python 中的一些基本迭代并编写了以下代码库 from typing import Iterator from datetime import date timedelta class DateIterator d
3d 点云中的平面拟合

我正在尝试使用回归公式在 3d 点云中查找平面Z aX bY C 我实现了最小二乘法和 ransac 解决方案但 3 参数方程将平面拟合限制为 2 5D 该公式不能应用于平行于 Z 轴的平面我的问题是我怎样才能将平面拟合推广到全 3d
在 Java 应用程序中保存数据的最佳方式？

我正在尝试找到保存简单应用程序状态的最佳方法从数据库的角度来看有 4 5 的表带有日期字段和关系因为该应用程序很简单并且我希望用户可以选择移动数据 USB 笔保管箱等所以我想将所有数据放在一个文件中执行此操作的最佳方法库是什
NAnt 和 VS2008 (.NET 3.5) - 不支持文件 Solution.sln 的解决方案格式

我正在尝试让 NAnt 0 86b1 与 VS2008 SP1 和 x64 XP 一起运行我有一个基本的构建文件如下它给出了错误不支持文件 Solution sln 的解决方案格式
当我们将 div 置于可见状态时，隐藏 div 内的 TinyMCE 不会显示为已启用

我在使用tinyMCE 所见即所得编辑器时遇到问题我实际上是在 HTML 元素如 DIV 中添加文本区域该元素当前具有样式属性 display none 当我将 DIV 显示样式更改为可见时 tinyMCE 编辑器显示为禁用重要提
EF 5 Code First 迁移批量 SQL 数据播种

我将 EF5 与 MVC4 结合使用问题是我的数据库中有大量数据我已经从旧数据库导入了这些数据我想在模型更改时加载该数据的种子我的问题是如何播种数据库中已有的大量数据 internal sealed class Configurat
数组中的默认值

像这样的数组的默认值是什么 char c 20 顺便说一句有吗如果在命名空间范围内声明则c将具有静态存储范围并且将是零初始化所以 c 的每个元素都有值 0 如果在函数中声明则c不会被初始化元素的初始值c将不定
将 difftime 时间转换为年、月和日

如何准确换算产品的乘积单位为天 difftime以下为年月和日 difftime Sys time 1931 04 10 difftime Sys time 2012 04 10 这确实是年和日但我怎么能包括几个月呢 yd conv
为什么 Visual Studio 2013 可以识别 CSS3 显示：flexbox，但不能识别 flex？

在我的 CSS 页面上 Visual Studio 无法识别 flex 声称它无效 div display flex display inline flex 但它确实可以识别 flexbox div display flexbox disp
自定义对话框大小以匹配 Theme.Holo.Light.Dialog

如果我有一个活动的主题设置为Theme Holo Light Dialog 规模会很大在纵向模式下它几乎会完全填满手机的屏幕但在横向模式下它不会过度拉伸例如在 Google 的这张图片中您可以看到该对话框没有填满整个屏幕它也
连接两个big pandas.HDFStore HDF5文件

这个问题在某种程度上与连接大量HDF5文件我有几个巨大的 HDF5 文件压缩后约 20GB 无法容纳 RAM 每个都存放几个pandas DataFrame格式相同且索引不重叠我想将它们连接起来形成一个 HDF5 文件并正确连接

连接两个big pandas.HDFStore HDF5文件

连接两个big pandas.HDFStore HDF5文件 的相关文章

随机推荐

热门标签

连接两个big pandas.HDFStore HDF5文件的相关文章