Python将文本文件解析为嵌套字典

2024-05-23

考虑以下数据结构：

[HEADER1]
{
   key value
   key value
   ...
   [HEADER2]
   {
      key value
      ...
   }
   key value
   [HEADER3]
   {
      key value
      [HEADER4]
      {
         key value
         ...
      }
   }
   key value
}

原始数据中没有缩进，但为了清楚起见，我在此处添加了缩进。键值对的数量未知，“...”表示可能还有更多在每个 [HEADER] 块内。 [HEADER] 块的数量也是未知的。

请注意，该结构是嵌套的，因此在此示例中，标头 2 和 3 位于标头 1 内部，标头 4 位于标头 3 内部。

可以有更多（嵌套）标头，但我保持示例简短。

我如何将其解析为嵌套字典结构？每个 [HEADER] 都应该是大括号内后续内容的关键。

最终结果应该是这样的：

dict = {'HEADER1': 'contents of 1'}
contents of 1 = {'key': 'value', 'key': 'value', 'HEADER2': 'contents of 2', etc}

我猜我需要某种递归函数，但我对 Python 很陌生，不知道从哪里开始。

对于初学者，我可以按如下方式拉出所有 [HEADER] 键：

path = 'mydatafile.txt'
keys = []

with open (path, 'rt') as file:
   for line in file:
      if line.startswith('['):
         keys.append(line.rstrip('\n'))

for key in keys:
   print(key)

但那又怎么样，也许这根本不需要？

有什么建议么？

您可以通过使用一些正则表达式预先格式化文件内容，然后将其传递给json.loads

您可以一一进行这些正则表达式替换：

#1 \[(\w*)\]\n https://regex101.com/r/IK8hwl/2 -> "$1":

#2 \}\n(\w) https://regex101.com/r/wRT2tr/1 -> },$1

#3 (\w*)\s(\w*)\n([^}]) https://regex101.com/r/qpplZC/3 -> $1:$2,$3

#4 (\w*)\s(\w*)\n\} https://regex101.com/r/ukbysd/1 -> $1:$2}

然后最后将最终的字符串传递给json.loads:

import json
d = json.loads(s)

这会将其解析为字典格式。

解释：

1. \[(\w*)\]\n：代替[HEADERS]\n with "HEADERS":

2. \}\n(\w)：替换所有右大括号，即}在他们之后有任何价值，与},

3. (\w*)\s(\w*)\n([^}])：代替key value\n with key:value,对于具有任何下一个元素的行

4. (\w*)\s(\w*)\n\}：代替key value\n with key:value对于没有下一个元素的行

因此，通过对这些正则表达式进行少量修改，您将能够将其解析为字典格式，基本概念是将文件内容重新格式化为可以轻松解析的格式。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

Dictionary

Python将文本文件解析为嵌套字典的相关文章

将字符串转换为带有毫秒和时区的日期时间 - Python

我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
XSD 嵌套元素
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

'' aria-label='从检查元素隐藏 '''> 从检查元素隐藏 ''

我有这个 HTML 和 PHP 联系表
单值上下文中的多值错误

我在编译 GO 代码时遇到此错误 multiple value fmt Println in single value context 我正在尝试创建一个函数该函数接受可变数量的整数并将每个变量打印在一行上 GO package main
混合模型优先和代码优先

我们使用模型优先方法创建了一个 Web 应用程序一名新开发人员进入该项目并使用代码优先方法使用数据库文件创建了一个新的自定义模型这这是代码第一个数据库上下文 namespace WVITDB DAL public class D
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
如何删除日期对象的亚秒部分

当 SQL 数据类型为时间戳时 java util Date 存储为 2010 09 03 15 33 22 246 如何在存储记录之前将亚秒设置为零例如在本例中为 246 最简单的方法是这样的 long time date getTi
如何向 Mono.ZeroConf 注册服务？

我正在尝试测试 ZeroConf 示例http www mono project com Mono Zeroconf http www mono project com Mono Zeroconf 我正在运行 OpenSuse 11 和 M
Chosen.js 样式不符合 Bootstrap3 样式

我使用 selected js v1 0 并在我的 Bootstrap 3 项目中使用它但我的选择框的样式根本不符合 Bootstrap 3 样式我做错了什么吗我只是使用调用选择框 select input chosen right
Mat-自动完成表单控件名称

我在 Mat Autocomplete 上使用 formControlName 时遇到问题我不知道为什么但我的 formControlName 不会发送数据我是否写错了当我尝试从 HTML 中删除 formControl 时它总是
ECONNREFUSED：无法连接到集群内默认端口上的 RabbitMQ pod

我的本地集群中有一个运行 RabbitMQ 的 pod 我已经将其配置为 apiVersion v1 kind Service metadata name service rabbitmq spec selector app service
带有图像的 UITableView 滚动非常慢[重复]

这个问题在这里已经有答案了可能的重复带图像的表格视图加载和滚动缓慢 https stackoverflow com questions 4071497 table view with images slow load and scro
通过 appassembler-maven-plugin 生成的脚本无法在 Spring Boot 应用程序中找到主类

我使用 appassembler maven plugin 生成的启动脚本有问题我有一个基本的 spring boot 应用程序只有一个类 SpringBootApplication public class ScriptDemoApp
Rails has_many 到 has_many 具有多个模型

模拟以下情况的最佳方法是什么 Word belongs to wordable polymorphic gt true Phrase has many words as gt workable belongs to story Line h
UIImageWriteToSavedPhotosAlbum 选择器语法问题

努力让 UIImageWriteToSavedPhotosAlbum 快速工作https developer apple com library ios documentation UIKit Reference UIKitFunction
Python代码没有抛出错误，但所需的输出不一样

无法接收 python 代码的输出我尝试通过打印每一行来调试代码 def get sum metrics predictions metrics for i in range 0 3 metrics append lambda x x i
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
在 javascript 中实现固定位置会导致 Safari 滚动时出现抖动

固定位置不适用于我的用例因为它固定在浏览器窗口上您可能会处于文本在屏幕右侧之外且无法到达的状态无论如何我尝试使用绝对定位然后调整javascript中的顶部它在 Firefox 和 Chrome 中运行良好但在 Safari
Android NDK 代码中的 SIGILL

我在市场上有一个 NDK 应用程序并获得了有关以下内容的本机崩溃报告 SIGILL信号我使用 Google Breakpad 生成本机崩溃报告以下是详细信息我的应用程序是为armeabi v7a with霓虹灯支持它在 NVIDI
如何在 Chrome 中获取 div 上的 keydown 事件？

我想在 div 上获取 keydown 事件我使用 JQuery keydown 很简单但是它不适用于 Chrome 为了在 chrome 上工作我必须设置 tabindex 0 如果我这样做 Chrome 会在我的 div 周围放
Java、Spring：使用 Mockito 测试 DAO 的 DataAccessException

我正在尝试增加测试覆盖率所以我想知道您将如何测试 DAO 中抛出的 DataAccessExceptions 例如在一个简单的 findAll 方法中该方法仅返回数据源中的所有数据就我而言我使用 Spring JdbcTempla
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进

Python将文本文件解析为嵌套字典

Python将文本文件解析为嵌套字典 的相关文章

随机推荐

热门标签

Python将文本文件解析为嵌套字典的相关文章