在 PyTables 中，如何创建可变长度的嵌套数组？

2024-01-09

我正在使用 PyTables 2.2.1 w/ Python 2.6，我想创建一个包含可变长度嵌套数组的表。

我搜索了 PyTables 文档和教程示例（PyTables 教程 3.8 http://www.pytables.org/docs/manual/ch03.html#id332794）展示了如何创建长度= 1的嵌套数组。但是对于这个例子，我如何向数据“info2/info3/x”和“info2/info3/y”添加可变行数？

为了也许更容易理解表结构，这是我自己开发的示例：

"""Desired Pytable output:

DIEM    TEMPUS  Temperature             Data
5       0       100         Category1 <--||-->  Category2
                         x <--| |--> y          z <--|
                        0           0           0
                        2           1           1
                        4           1.33        2.67
                        6           1.5         4.5
                        8           1.6         6.4
5       1       99
                        2           2           0   
                        4           2           2
                        6           2           4
                        8           2           6
5       2       96
                        4           4           0
                        6           3           3
                        8           2.67        5.33


Note that nested arrays have variable length.
"""

import tables as ts

tableDef =      {'DIEM': ts.Int32Col(pos=0),
                'TEMPUS': ts.Int32Col(pos=1), 
                'Temperature' : ts.Float32Col(pos=2),
                'Data': 
                    {'Category1': 
                        {
                        'x': ts.Float32Col(), 
                        'y': ts.Float32Col()
                        }, 
                    'Category2': 
                        {
                        'z': ts.Float32Col(), 
                        }
                    }
                }

# create output file
fpath = 'TestDb.h5'
fh = ts.openFile(fpath, 'w')
# define my table
tableName = 'MyData'
fh.createTable('/', tableName, tableDef)
tablePath = '/'+tableName
table = fh.getNode(tablePath)

# get row iterator
row = table.row
for i in xrange(3):
    print '\ni=', i
    # calc some fake data
    row['DIEM'] = 5
    row['TEMPUS'] = i
    row['Temperature'] = 100-i**2

    for j in xrange(5-i):
        # Note that nested array has variable number of rows
        print 'j=', j,
        # calc some fake nested data
        val1 = 2.0*(i+j)
        val2 = val1/(j+1.0)
        val3 = val1 - val2

        ''' Magic happens here...
        How do I write 'j' rows of data to the elements of 
        Category1 and/or Category2?

        In bastardized pseudo-code, I want to do:

        row['Data/Category1/x'][j] = val1
        row['Data/Category1/y'][j] = val2
        row['Data/Category2/z'][j] = val3
        '''

    row.append()
table.flush()

fh.close()

我在 PyTables 文档中没有发现任何迹象表明这种结构是不可能的......但如果这种结构实际上是不可能的，那么我对可变长度嵌套列的替代方案是什么？

电子阵列？ VL 数组？如果是这样，如何将这些数据类型集成到上述结构中？
还有其他想法吗？

非常感谢任何帮助！

编辑附加信息：看来 PyTables 专家已经解决了“这样的结构是否可能”的问题：

PyTables 邮件论坛 - 分层数据集 http://sourceforge.net/mailarchive/message.php?msg_id=18598716

那么有人找到了创建类似 PyTable 数据结构的方法吗？

再次感谢！

我有一个类似的任务：用可变长度的数组转储固定大小的数据。

我首先尝试使用固定大小的 StringCol(64*1024) 字段来存储可变长度数据（它们始终

经过几天的调查，我最终得出以下解决方案：

（剧透：我们将数组字段存储在单独的 EArray 实例中，每个数组字段一个 EArray）

我将固定大小的数据存储在常规 pytables 表中。

我向这些表添加了 2 个附加字段：arrFieldName_Offset and arrFieldName_Length:

class Particle(IsDescription):
   idnumber  = Int64Col()
   ADCcount  = UInt16Col()
   TDCcount  = UInt8Col()
   grid_i    = Int32Col()
   grid_j    = Int32Col()
   pressure  = Float32Col()
   energy    = FloatCol()
   buffer_Offset = UInt32() # note this field!
   buffer_Length = UInt32() # and this one too!

我还为每个数组字段创建一个 EArray 实例：

datatype = StringAtom(1)
buffer = h5file.createEArray('/detector', 'arr', datatype, (0,), "")

然后我添加与固定大小数据相对应的行：

row['idnumber'] = ...
...
row['energy'] = ...
row['buffer_Offset'] = buffer.nrows
# my_buf is a string (I get it from a stream)
row['buffer_Length'] = len(my_buf)
table.append(row)

哒哒！将缓冲区添加到数组中。

buffer.append(np.ndarray((len(my_buf),), buffer=my_buf, dtype=datatype))

这就是窍门。在我的实验中，这种方法比存储不规则的固定大小数组（如 StringAtom(HUGE_NUMBER)）快 2-10 倍，并且生成的数据库小几倍（2-5 倍）

获取缓冲区数据很容易。假设row是您从数据库中读取的一行：

# Open array for reading
buffer = h5file.createEArray('/detector', 'Particle.buffer', datatype, (0,), "")
...
row = ...
...
bufferDataYouNeed = buffer[ row['buffer_Offset'] : row['buffer_Offset'] + row['buffer_Length']]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pytables

在 PyTables 中，如何创建可变长度的嵌套数组？的相关文章

如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
Python PAM 模块的安全问题？

我有兴趣编写一个 PAM 模块该模块将利用流行的 Unix 登录身份验证机制我过去的大部分编程经验都是使用 Python 进行的并且我正在交互的系统已经有一个 Python API 我用谷歌搜索发现pam python http pa
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

当 Cocoa 应用程序中的主线程被阻塞时，UI 不会更新

当我运行整个方法时我在主线程中使用 NSProgressIndicator 来更新进度现在当我最终从不同的类文件调用一个对象并等待该对象返回到我的主线程的值时我注意到 NSProgressIndicator 将消失我明白这是因为
如何填充 Woocommerce 手动订单的元字段

我为我的 Woocommerce 订单定义了两个自定义字段我用了WooCommerce 管理员自定义订单字段扩展 https docs woocommerce com document woocommerce admin custom o
枚举 configs.hasMoreElements() 给出 false

我正在 Android 中开发一个基于语音的应用程序遇到一些问题请参阅下面的代码 Java文件1 文件 wav 文件 public static AudioInputStream getAudioInputStream File fil
可以在 NetBeans 中查看方法/函数文档吗？

支持 Python 的 NetBeans 6 5 在自动完成时在弹出窗口中提供函数方法的文档字符串文档但是还有其他方法来查看文档字符串吗也许通过将鼠标悬停在函数方法名称上或单击某处来实现我似乎能做的最好的事情就是右键单击菜单中的
Java+jackson解析错误无法识别的字符转义

我需要使用 HttpClient 执行 POST json 字符串以下是我的代码从另一端 Json 被映射到一个对象 HttpClient client HttpClientBuilder create build HttpPost p
如何获取 T 函数中使用的属性名称字符串

我有一个场景我必须获取一个字符串数组这些字符串表示 Func 参数中使用的每个属性名称这是一个示例实现 public class CustomClass
Java中子类的排序

假设一个Superclass implements Comparable
将 ContextMenu 的 MenuItem 可见性绑定到 ListView 选择

我有一个带有 ListView 的用户控件其中包含 ObservableCollection 中的简单项目我希望该 ListView 的 ContextMenu 包含根据 ListView 中选择的内容的项目如果未选择任何项目则某些
Firebase 计划函数是否会在模拟器上自动运行？

我正在尝试使用模拟器在 Firebase 上构建计划功能我已按所示进行设置并已验证 PubSub 是否正在我的模拟器上运行然而什么也没有发生我有以下功能 exports scheduledFunction functions pu
Objective-C 中的静态 NSString

我经常在类实例方法中看到这样的代码片段 static NSString myString This is a string 我似乎不明白为什么这会起作用这是否只是 objc 等价于仅限于方法范围的 define 我认为我理解变量的静态
数组上的“each”/“map”会导致 create_time_zone_conversion_attribute 中的“当您没有预料到时，您有一个 nil 对象”？

我有一个按钮它通过 XHR 向 Rails 服务器中的特定操作发送 get 请求此操作调用我在模型类别中定义的函数该函数执行类似 x Category subcategories 的操作并在下一行中执行类似 x map id 或
如何将绘图保存到PDF文件中，周围没有大边距[重复]

这个问题在这里已经有答案了如果我打印一个情节EPS http en wikipedia org wiki Encapsulated PostScript格式时 EPS 文件的内容完全被绘图占据但如果我打印一个情节PDF http en
如何选择*加上另一列[重复]

这个问题在这里已经有答案了我试图从一个表中选择所有值然后选择仅运行这些列之一的函数的输出并将所有这些显示为我的 SQL 查询输出我这样做的目标是从 Geometry 列创建可用的 WKT 输出并将其包含在查询结果中这样我就可以在
FabricInvalidAddressException：尝试从 .NET Core 应用程序连接时出现 NamedEndpoint“V2Listener”

我正在尝试使用以下方式连接到 Service Fabric 应用程序ServiceProxy像这样的类 return ServiceProxy Create
php和mysql将记录从一个表复制到另一个表

我想通过将记录从一个表移动到另一个表来对学生进行存档这是我尝试使用的代码
您相信 ASP.Net MVC 已准备好投入生产吗？

我真的很喜欢 Microsoft 承诺将 MVC 引入 Web 为此我对将我现有的 ASP NET 应用程序之一转换为 MVC 感到兴奋并想知道我是否操之过急虽然这个网站正在使用 MVC 但它在技术上仍处于测试阶段您有什么想法从
Google 容器引擎：访问云存储

我无法让应用程序默认凭据在 Google 容器引擎中工作文档说它们适用于 App Engine 和 Compute Engine 但我被告知它们应该透明地传递到在 Container Engine 上运行的容器这是失败的代码 crede
iOS 7 状态栏与导航栏发生冲突

我的应用程序中有一个视图控制器在故事板中拖动了一个导航栏它在 iOS 6 中运行良好但在 iOS 7 中它看起来像这样状态栏和导航栏不应相互冲突我在堆栈溢出上看到过很多这样的问题但它们对我没有太大帮助有些问题说我应该使用这个
asp.net core 检查中间件中的路由属性

我正在尝试构建一些 ASP Net core 中间件需要查看当前路由是否标记为授权 eg public async Task Invoke HttpContext context if context Request Path Valu
在 PyTables 中，如何创建可变长度的嵌套数组？

我正在使用 PyTables 2 2 1 w Python 2 6 我想创建一个包含可变长度嵌套数组的表我搜索了 PyTables 文档和教程示例 PyTables 教程 3 8 http www pytables org docs ma

在 PyTables 中，如何创建可变长度的嵌套数组？

在 PyTables 中，如何创建可变长度的嵌套数组？ 的相关文章

随机推荐

热门标签

在 PyTables 中，如何创建可变长度的嵌套数组？的相关文章