连接两个big pandas.HDFStore HDF5文件

2023-11-26

这个问题在某种程度上与“连接大量HDF5文件”.

我有几个巨大的 HDF5 文件(压缩后约 20GB),无法容纳 RAM。每个都存放几个pandas.DataFrame格式相同且索引不重叠。

我想将它们连接起来,形成一个 HDF5 文件,并正确连接所有 DataFrame。一种方法是逐块读取它们,然后保存到单个文件中,但实际上这会花费相当多的时间。

是否有任何特殊的工具或方法可以在不迭代文件的情况下执行此操作?


请参阅文档here为了odo项目(以前的into)。请注意,如果您使用into库,那么参数顺序已被切换(这就是更改名称的动机,以避免混淆!)

你基本上可以这样做:

from odo import odo
odo('hdfstore://path_store_1::table_name',
    'hdfstore://path_store_new_name::table_name')

执行多个这样的操作将附加到 rhs 存储中。

这将自动为您执行块操作。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

连接两个big pandas.HDFStore HDF5文件 的相关文章

随机推荐

  • 未弃用的相当于

    我想达到同样的目标 window open lalala php lalala 但我想发送 HTTP POST 请求而不是 HTTP GET 请求 因此 我使用以下内容
  • 收到错误“超出可用参数键空间”?

    在我的 Rails 应用程序中 表单发布后出现错误exceeded available parameter key space 表单内的表单字段太多 这是错误的原因吗 有什么看法吗 如果您确实非常需要它 请尝试增加key space lim
  • `if [-e file.txt]` 在 bash 中不起作用

    我正在尝试使用 bash 检查文件是否存在 这是我的代码 if e file txt then echo file exists else echo file doesn t exist fi 但是当我运行它时我得到 test sh lin
  • 更改 rmarkdown 保存 r 代码生成的图像的位置

    我有一个 rmarkdown 文档 我正在将此文件转换为 md 文档 我的问题是我希望将绘图创建的图片放置在文件同一目录中名为 Images 的文件夹中 假设我有这个文档 title my test author daniel date 1
  • MapView 在触摸时添加图钉

    我设法让地图显示在屏幕上 现在 用户将在地图上移动并按下它 按下一个点后 我需要在屏幕上按下的位置添加一个图钉 如果用户决定去另一个点 当按下所选点时 第一个图钉将消失 并且将在新位置绘制一个新图钉 我确实是这样的 public class
  • 是否可以在 symfony2 中动态设置路由的默认参数值?

    我使用注释在 symfony2 控制器中定义了一条路由 例如 Route year name show list for user defaults year 2012 是否可以使默认年份动态化 也许从服务对象中读取年份 您可以在Reque
  • 计算碰撞后的角速度

    我已经相对较好地降低了碰撞分辨率的线性部分 但我不太清楚如何对角度部分做同样的事情 从我读到的内容来看 这就像 torque point of collision x linear velocity 交叉产品 我尝试合并我发现的例子进入我的
  • Scenekit 一些纹理具有红色调

    我有一个包含许多对象的场景 这些对象都有不同的纹理 由于某种原因 两个对象具有红色色调 即使它们的纹理没有红色 您仍然可以在纹理中看到图案 只是红色有不同的深浅 在模拟器上 这两个对象具有黑白纹理 在设备上具有红色阴影 有人知道为什么会发生
  • EWS:约会 Item.Id.UniqueId 不是常量

    在将 EWS Managed API 2 0 与 Exchange Server 2007 SP3 一起使用时 我遇到了一个奇怪的问题 当我创建约会并保存它时 我使用以下代码获取其 ID appointment Save SendInvit
  • 为什么 mypy 不认为一个类具有 __len__ 和 __getitem__ 但没有 __iter__ 是可迭代的

    我正在玩mypy以及 Python 中的一些基本迭代并编写了以下代码库 from typing import Iterator from datetime import date timedelta class DateIterator d
  • 3d 点云中的平面拟合

    我正在尝试使用回归公式在 3d 点云中查找平面Z aX bY C 我实现了最小二乘法和 ransac 解决方案 但 3 参数方程将平面拟合限制为 2 5D 该公式不能应用于平行于 Z 轴的平面 我的问题是我怎样才能将平面拟合推广到全 3d
  • 在 Java 应用程序中保存数据的最佳方式?

    我正在尝试找到保存简单应用程序状态的最佳方法 从数据库的角度来看 有 4 5 的表带有日期字段和关系 因为该应用程序很简单 并且我希望用户可以选择移动数据 USB 笔 保管箱等 所以我想将所有数据放在一个文件中 执行此操作的最佳方法 库是什
  • NAnt 和 VS2008 (.NET 3.5) - 不支持文件 Solution.sln 的解决方案格式

    我正在尝试让 NAnt 0 86b1 与 VS2008 SP1 和 x64 XP 一起运行 我有一个基本的构建文件 如下 它给出了错误 不支持文件 Solution sln 的解决方案格式
  • 当我们将 div 置于可见状态时,隐藏 div 内的 TinyMCE 不会显示为已启用

    我在使用tinyMCE 所见即所得编辑器 时遇到问题 我实际上是在 HTML 元素 如 DIV 中添加文本区域 该元素当前具有样式属性 display none 当我将 DIV 显示样式更改为可见时 tinyMCE 编辑器显示为禁用 重要提
  • EF 5 Code First 迁移批量 SQL 数据播种

    我将 EF5 与 MVC4 结合使用 问题是我的数据库中有大量数据 我已经从旧数据库导入了这些数据 我想在模型更改时加载该数据的种子 我的问题是如何播种数据库中已有的大量数据 internal sealed class Configurat
  • 数组中的默认值

    像这样的数组的默认值是什么 char c 20 顺便说一句 有吗 如果在命名空间范围内声明 则c将具有静态存储范围并且将是零初始化所以 c 的每个元素都有值 0 如果在函数中声明则c不会被初始化 元素的初始值c将不定
  • 将 difftime 时间转换为年、月和日

    如何准确换算产品的乘积 单位为天 difftime以下为年 月和日 difftime Sys time 1931 04 10 difftime Sys time 2012 04 10 这确实是年和日 但我怎么能包括几个月呢 yd conv
  • 为什么 Visual Studio 2013 可以识别 CSS3 显示:flexbox,但不能识别 flex?

    在我的 CSS 页面上 Visual Studio 无法识别 flex 声称它无效 div display flex display inline flex 但它确实可以识别 flexbox div display flexbox disp
  • 自定义对话框大小以匹配 Theme.Holo.Light.Dialog

    如果我有一个活动的主题设置为Theme Holo Light Dialog 规模会很大 在纵向模式下 它几乎会完全填满手机的屏幕 但在横向模式下 它不会过度拉伸 例如 在 Google 的这张图片中 您可以看到该对话框没有填满整个屏幕 它也
  • 连接两个big pandas.HDFStore HDF5文件

    这个问题在某种程度上与 连接大量HDF5文件 我有几个巨大的 HDF5 文件 压缩后约 20GB 无法容纳 RAM 每个都存放几个pandas DataFrame格式相同且索引不重叠 我想将它们连接起来 形成一个 HDF5 文件 并正确连接