从 reStructuredText 中提取字段列表

2023-11-22

假设我有以下剩余输入：

Some text ...

:foo: bar

Some text ...

我想最终得到的是这样的字典：

{"foo": "bar"}

我尝试使用这个：

tree = docutils.core.publish_parts(text)

它确实解析了字段列表，但我最终得到了一些伪 XMLtree["whole"]?:

<document source="<string>">
    <docinfo>
        <field>
            <field_name>
                foo
            <field_body>
                <paragraph>
                    bar

自从treedict 不包含任何其他有用的信息，这只是一个字符串，我不知道如何从其余文档中解析字段列表。我该怎么做呢？

您可以尝试使用类似以下代码的内容。而不是使用publish_parts我用过的方法publish_doctree，获取文档的伪 XML 表示形式。然后我将其转换为 XML DOM 以提取所有field元素。然后我得到第一个field_name and field_body每个的元素field元素。

from docutils.core import publish_doctree

source = """Some text ...

:foo: bar

Some text ...
"""

# Parse reStructuredText input, returning the Docutils doctree as
# an `xml.dom.minidom.Document` instance.
doctree = publish_doctree(source).asdom()

# Get all field lists in the document.
fields = doctree.getElementsByTagName('field')

d = {}

for field in fields:
    # I am assuming that `getElementsByTagName` only returns one element.
    field_name = field.getElementsByTagName('field_name')[0]
    field_body = field.getElementsByTagName('field_body')[0]

    d[field_name.firstChild.nodeValue] = \
        " ".join(c.firstChild.nodeValue for c in field_body.childNodes)

print d # Prints {u'foo': u'bar'}

The xml.dom模块不是最容易使用的（为什么我需要使用.firstChild.nodeValue而不仅仅是.nodeValue例如），所以您可能希望使用xml.etree.ElementTree模块，我发现它更容易使用。如果您使用 lxml，您还可以使用 XPATH 表示法来查找所有field, field_name and field_body元素。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从 reStructuredText 中提取字段列表的相关文章

尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

某些 HTML 标记中的“生成”属性有何用途？

我看到它在 HTML 标签中使用但我感觉它可以与大多数 HTML 标签一起使用我大概能猜出这是什么意思但我更好奇使用它有什么好处我试图用谷歌搜索一些有关它的参考资料但找不到任何资料所以我来找你们专家谢谢 Example
Android ACTION_IMAGE_CAPTURE 意图

我们正在尝试使用本机相机应用程序让用户拍摄新照片如果我们省略了它就可以正常工作EXTRA OUTPUT extra并返回小位图图像然而如果我们putExtra EXTRA OUTPUT 在启动之前一切都会正常进行直到您尝试点击相
JasperReports 的最小依赖关系

我希望在我的一个项目中使用 JasperReports 4 5 0 并且想知道仅生成 PDF 的最小依赖项是什么我尝试浏览他们的网站和自述文档但一无所获我也遇到过这个安装维基这看起来非常过时版本 1 2 2 是否有所需 jar 的最
删除无效/不完整的多字节字符

我在用户输入上使用以下代码时遇到一些问题 htmlentities string ENT COMPAT UTF 8 当检测到无效的多字节字符时 PHP 会抛出一个通知 PHP 警告 htmlentities path to file php
“原子”和“cstdatomic”有什么区别？

有人可以澄清一下包含选项之间的区别吗 include
原型中的函数列表

我希望能够获取不同 JavaScript 对象的函数列表特别是 String 和其他基元我以为我能够以某种方式使用 String prototype 并神奇地获得原型中的函数列表但没有骰子有任何想法吗我也尝试过使用下划线例如 f
根据谓词从列表中删除元素

我想从列表中删除一个元素使得该元素包含 X or N 我必须申请大型基因组这是一个例子 input codon AAT XAC ANT TTA 预期输出 codon AAT TTA 出于基础目的 gt gt gt x for x in
如何使用命令行在 VSCode 中安装多个扩展

如何使用 cli 在 VSCode 中安装多个扩展我试过 code install extension xyz local history jock svg 但它只安装第一个扩展xyz local history Installing e
OneDrive 上的 Visual Studio 解决方案

我可以将我的 Visual Studio 解决方案放入 OneDrive 中并从那里工作吗还是会以某种方式导致数据丢失无论我身在何处我都想随身携带我的项目而不是每次都担心将它们放在闪存驱动器上我不会推荐它 OneDrive 和其他
不兼容的字符编码：ASCII-8BIT 和 UTF-8

我使用 Ruby 1 9 2 和 Rails 3 0 5 我有以下错误不兼容的字符编码 ASCII 8BIT 和 UTF 8 我认为这与数据库无关错误发生在视图中的这一行只是 div haml 调用 content 全栈 Action
Scaffold-DbContext 在 .net core 中抛出错误“无法找到程序集”

我正在使用 net core 和实体框架 core 1 1 0 在尝试以下命令时包管理器控制台 Scaffold DbContext Server MyServer MyInstance Database MyDB user MyUsern
ADFS 作为 OAuth2 提供者/身份验证服务器可能吗？

我们想要设置 ADFS 3 0 以启用基于 OAuth2 的身份验证我已经阅读了大量文档但仍不清楚这是否受支持 ADFS 是否可以用作 oauth 的授权服务器或者 ADFS 中的 oauth2 支持仅意味着充当另一个授权服务器的客户
查找位置：Google Play 位置服务或 Android 平台位置 API

我正在尝试获取我的新导航应用程序的用户位置我想经常检查用户的位置并且它必须准确我使用示例中的以下代码来获取位置 public class MainActivity extends Activity implements Locatio
打印网页时如何隐藏元素？

我的网页上有一个用于打印网页的链接但是该链接在打印输出本身中也可见当我单击打印链接时是否有 javascript 或 HTML 代码会隐藏链接按钮 Example Good Evening Print click Here To P
RabbitMQ / AMQP：单个队列，同一消息的多个消费者？

我刚刚开始使用 RabbitMQ 和 AMQP 我有一个消息队列我有多个消费者我想用它们做不同的事情相同的消息大多数 RabbitMQ 文档似乎都专注于循环即单个消息由单个消费者消费负载分布在每个消费者之间这确实是我亲眼所见的行
如何获取 geotiff 中单元格的坐标？

我有一个包含地理信息的 tif 使用 gdal 我可以将光栅文件转换为数组 numpy 如何获取该数组中一项的坐标使用仿射变换矩阵将像素坐标映射到世界坐标例如使用affine包裹还有其他方法可以使用简单的数学来完成相同的任务 fr
constexpr 和 std::cout 适用于函数，但不适用于 lambda

Why constexpr不适用于std cout 但适用于printf include
转义正则表达式换行符

我如何在正则表达式中进行 n 匹配我希望实际的两个 ASCII 值 92 和 110 能够匹配作为字符串我正在使用 PHP 的 preg 谢谢您可以转义第一个斜杠 n 或者将第一个斜杠括在中 n
TypeScript 可选类型和类型的区别 |不明确的

我正在努力理解将字段定义为string undefined and string 我们当前的代码使用如下类型定义 class Foo public bar string undefined 当通过 TSLint 运行此代码时它会注意到并抱
从 reStructuredText 中提取字段列表

假设我有以下剩余输入 Some text foo bar Some text 我想最终得到的是这样的字典 foo bar 我尝试使用这个 tree docutils core publish parts text 它确实解析了字段列表但我

从 reStructuredText 中提取字段列表

从 reStructuredText 中提取字段列表 的相关文章

随机推荐

热门标签

从 reStructuredText 中提取字段列表的相关文章