使用 Python 频繁更新数值实验的存储数据 [关闭]

2024-01-11

我正在运行一个需要多次迭代的数值实验。每次迭代之后，我想将数据存储在 pickle 文件或类似 pickle 的文件中，以防程序超时或数据结构被利用。最好的继续方式是什么。这是骨架代码：

data_dict = {}                       # maybe a dictionary is not the best choice
for j in parameters:                 # j = (alpha, beta, gamma) and cycle through
    for k in number_of_experiments:  # lots of experiments (10^4)
        file = open('storage.pkl', 'ab')
        data = experiment()          # experiment returns some numerical value
                                     # experiment takes ~ 1 seconds, but increase
                                     # as parameters scale
        data_dict.setdefault(j, []).append(data)
        pickle.dump(data_dict, file)
        file.close()

问题：

搁置在这里是更好的选择吗？或者其他一些我不知道的Python库？
我使用数据字典是因为如果我需要在做更多实验时进行更改，它更容易编码并且更灵活。使用预先分配的数组会带来巨大的优势吗？
打开和关闭文件会影响运行时间吗？我这样做是为了除了我设置的文本日志之外我还可以检查进度。

谢谢你的帮助！

假设您正在使用numpy对于您的数值实验，而不是pickle http://www.benfrederickson.com/2014/02/12/dont-pickle-your-data.html我建议使用numpy.savez http://docs.scipy.org/doc/numpy/reference/generated/numpy.savez.html.
保持简单，仅当您觉得脚本运行时间太长时才进行优化。
打开和关闭文件确实会影响运行时间，但无论如何进行备份会更好。

我会用collections.defaultdict(list)而不是普通的dict and setdefault.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pickle

numericalmethods

使用 Python 频繁更新数值实验的存储数据 [关闭] 的相关文章

Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
在Python中获取文件描述符的位置

比如说我有一个原始数字文件描述符我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

从 Scala 中的 JsValue 中删除键

这可能是一个非常简单的问题但我很难找到一个干净有效的解决方案我只想从我拥有的 json 对象中删除一个字段假设我有 val body Option JsValue request body asJson 身体看起来像 url www
提高将行追加到 data.table 的性能

我正在解析一堆具有类似表格数据的 XML 并希望将它们连接到一个 data table 中以便随后进行计算我用XML用于解析的包大约有 10 000 个 xml 文件需要解析每个文件内有 15 150 行具体数字我事先不知道我目前
通过 OpenERP-7 中的按钮调用树视图

我想知道如何通过按钮调用树视图不同记录的因为返回表单视图很容易但是当我尝试对树视图执行精确操作时它仅显示一个列表场景是我有一个搜索产品表单现在当生成搜索时将在该字段中填写记录域我想添加一个按钮来调用树视图向我显示该域中存
node-config 可以在不重新启动 Node 的情况下重新加载配置吗？

我在用着节点配置 https github com lorenwest node config用于我的 Node 应用程序中的配置我正在管理的配置之一是超级秘密密码即使我也不允许知道为了解决这个问题我实现了一个网络应用程序用户可以
在 ROOTLESS podman 设置中，如何在不同 pod 中的容器之间进行通信

我阅读了我能找到的所有内容但有关此场景的文档很少或不清楚podman 我有以下人为的 ROOTLESS podman setup pod 1 名称 pod1 容器名称位于pod1 p1c1 这也是它被分配的hostname within
iOS：Objective-C：Firebase：是否可以先读取缓存数据以供参考？

描述我的数据已经存在于某个端点 friends list 所以这是我的参考 https xxxxxx firebaseio com friends list https xxxxxx firebaseio com friends list
VirtualBox Ubuntu 来宾上的 nginx 提供过时的内容 [已关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我不知道这是 Ubuntu VirtualBox 还是 nginx 的问题我在 Ubuntu 上运行 nginx 它是 Windows 7 上的 V
如何在模块的 Spring Boot 配置类中使用 @AutoConfigureOrder

在我的 Spring Boot 项目中我使用一个模块它提供了 Configuration班级配置是通过导入的 Import ConfigurationFromModule class in Application class 模块的配
为什么 Java 编译器为包私有超类型中定义的公共方法添加可见性桥接方法？

我想知道为什么Java编译器会为foo方法在这里 public class Outer class SuperClass public void foo public class SubClass extends SuperClass Th
如何通过 WebAssembly 使用向量（C++ STL）

include
Rails Observer 4.0 的替代方案

正式与观察员从 Rails 4 0 中删除 https github com rails rails observers 我很好奇其他开发人员在他们的位置使用什么除了使用提取的 gem 之外虽然观察者肯定被滥用并且有时很容易变得笨拙但
对 char* 进行相等性测试 std::string，operator==() 总是安全的吗？

STL 运算符和重载用于std string意味着可以安全使用operator 比较一个char 反对std string 没有限制 LHS RHS 是哪一个不这不安全无限制限制是 the char 不能是空指针指向的字符序列cha
MinGW GCC：析构函数和非虚拟thunk的多重定义

我正在尝试在最近进行一些更改后构建元素库但无法使其链接我的工具链带 MCF 线程的 GCC 9 2 1 CMake 3 16 4 破坏构建的提交 https github com cycfi elements commit 104ce
如何保存 Tidymodels Lightgbm 模型以供重复使用

我有以下代码用于创建tidymodels工作流程与lightgbm模型但是当我尝试保存到 rds对象和预测 library AmesHousing library treesnip library lightgbm library ti
如何使用 CSS 来设计表单组件的样式？

Vaadin 如何使用纯粹为 HTML 元素编写的 CSS 例如 body h1 等元素的样式和布局并在 Vaadin 中使用确切的 CSS 样式是否需要对 CSS 进行更改以映射到相应的 Vaadin 元素或者可以按原样使用该 CS
如何在asp.net mvc中的客户端Kendo UI网格中实现服务器端分页

谁能告诉我如何使用客户端 Kendo UI Grid 实现服务器端分页更新我们有released http blogs telerik com kendoui posts 14 01 02 kendo ui open sources d
HM土地登记处SPARQL查询多个邮政编码[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我有英格兰和威尔士每个太阳能发电场的大约 900 个邮政编码列表我想找到每个邮政编码的房价看看太阳能发电场实施后房价
Apache2 运行良好一段时间，然后停止提供内容，重新启动时出错

我的系统 Apache2 在 Debian 7 Wheezy 上运行它是一台具有一个 IPv4 地址和多个虚拟主机的物理服务器网络应用程序 Polaric Redmine phpMyAdmin 等 PHP 信息在这里 http trac
使用 Spring 注解注入父类依赖的正确方法

我有以下代码 Dao java Component public class Dao extends NamedParameterJdbcDaoSupport dbContext xml
使用 Python 频繁更新数值实验的存储数据 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在运行一个需要多次迭代的数值实验每次迭代之后我想将数据存储在 pickle 文件或类似 pickle 的文件中以防程序超时或数据结构被

使用 Python 频繁更新数值实验的存储数据 [关闭]

使用 Python 频繁更新数值实验的存储数据 [关闭] 的相关文章

随机推荐

热门标签