对 .xml 文件中

内的句子进行编号?

2023-12-09

我是一名初学者程序员,我陷入了这个可能很简单的问题:我想自动将数字添加到 .xml 文件的 P 标签中包含的句子中。因此 .xml 文件中的示例段落如下所示:

<P>Sentence1. Sentence2. Sentence3.</P>

我想把它改造成:

<P><SUP>1</SUP>Sentence1.<SUP>2</SUP> Sentence2.<SUP>3</SUP> Sentence3.</P>

然而,只有包含至少 2 个句子的 P 标签才应该编号,如果它只包含 1 个句子,我想保持不变。

这是我迄今为止使用正则表达式提出的方法:

\.\s.*
# Reliably finds the second sentence, Insert <SUP>2</SUP> after it.
<P>[^>]*<SUP>2
# Finds the beginning of the first sentence if a second sentence exists.

然而,我觉得这是一种非常尴尬的方法,我真的不知道如何扩展包含 20 个或更多句子的段落,或包含许多段落的 .xml 文档。是否有更好的正则表达式来实现此目的或比正则表达式更好的(Python)工具?


像这样的东西(未经测试)可能会起作用

import xml.etree.ElementTree as ET
tree = ET.parse(XML_FILE)
root = tree.getroot()


for p in root.iter('p'):
   sentences = p.text.split('.')
   p.text = ".".join([("<sup>%i<sup>" % count) + sentence for count, sentence in enumerate(sentences)])

tree.write(XML_FILE)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

对 .xml 文件中

内的句子进行编号? 的相关文章

随机推荐

  • AngularJS 路由有什么意义?

    我正在创建一个网站 我选择在 AJ 中进行 我有两个文件夹 网关 gt 一些从 mysql 数据库检索数据并将数据作为 json 回显的 php 文件 Views gt 部分 html 文件 基本上是每个页面的模板 例如用户 项目等 然后我
  • 将参数括在括号中时,Ruby Kernel.raise 方法会引发错误

    我喜欢用括号括起来的方法参数 这是对 Pascal 的怀念 在清理代码时 如果我发现没有它的方法参数 我会立即将它们括起来 今天 它导致我的工作代码抛出错误 尽管根据文档我的语法看起来没问题 Kernel raise 的文档具有以下格式 O
  • C# 数据连接最佳实践?

    好吧 这是一种固执己见的话题 但根据你的知识 观点和当前的实践 设置以下场景的最佳方法是什么 我正在构建一个广泛的数据输入应用程序 我所说的广泛是指我只完成了基本设置 其中包含整个程序的大约 15 25 并且我有大约 15 个部分设置的表单
  • 将日历与闪亮的散点图链接起来

    如果可能的话 我希望您帮助我将我的日历链接到我想做的一些散点图 我要解释一下 我的想法是 当该人在日历上选择 01 01 2021 选项时 他会生成一个散点图 其中包含每个类别的第一个点 即 D1 DR01 DR02 DR03 和 DR04
  • stackoverflow错误:检查数字是偶数还是奇数,没有%或/运算符[重复]

    这个问题在这里已经有答案了 在没有 或 运算符的情况下检查数字是偶数还是奇数 public class EvenOrOdd public static int CheckEvenOrOdd int num if num gt 2 int n
  • 有人可以非常详细且易于理解地向我解释 SharedPreferences 在 Android 中的工作原理吗?

    我是 Android 开发新手 现在我真的很想学习共享首选项 我用谷歌搜索了很多次 但我认为我还没有完全掌握它 我相信此共享首选项将帮助我在登录屏幕活动中存储用户名和密码 感谢您 我制作了一些关于此的视频作为工作试镜 他们帮助我得到了这份工
  • 带 cookie 的 iPhone NSData/NSUrl

    我正在尝试播放 流式传输网站上托管的 mp3 该网站需要设置 cookie 标头 但我在设置该标头或让容器为我执行此操作时遇到困难 NSURL sampleUrl NSURL URLWithString http domain files
  • R - 使用任何其他列中的值填充列

    我有一个 5 列的数据框 4 列有值 1 列为空 我想用 4 列中任意一列中的任意值填充空列 假设这是我的数据框df Col1 Col2 Col3 Col4 Col5 11 11 2 2 2 23 4 4 15 15 我希望我的结果看起来像
  • 如何在 url asp.net mvc 4 中添加扩展名 .html?

    我有网址 http localhost 1714 Message Index 我想展示 http localhost 1714 Message Index html 我该怎么做 您需要修改 Web config 以将对 HTML 文件的请求
  • YouTube API 返回带有空列表的 nextPageToken

    这个问题与 YouTube API 500 1000 无关有意义的结果问题 我认为 YouTube API nextPageTokens 的工作方式是 一旦没有更多结果可返回 它们将为 null 但是 我看到一开始就返回了结果 但有时即使只
  • 如何将指针分配给矩阵的对角线?

    我有一个矩阵说REAL 8 MATRIX 100 100 我想仅从主对角线或上三角形创建一个指针 怎么做 目的是以干净的 命名 方式轻松访问这些元素 对于主对角线 请小心 您可以执行以下操作 PROGRAM diagonal IMPLICI
  • 过滤嵌套字典[重复]

    这个问题在这里已经有答案了 所以我有这本字典 Filme 1 Titel 20 Jahr 2 Wertung 6 Preis 50 Schauspielern a b c 2 Titel 30 Jahr 3 Wertung 7 Preis
  • 如何确定 TypeScript.Expression 对象的结果类型?

    使用 TypeScript 抽象语法树时 如何确定 TypeScript Expression 对象的结果类型 我正在使用 TSLint 并尝试查找不传递 Function 类型的对象作为第一个参数的 setTimeout 调用 例如 在下
  • 将同步调用包装在 Task.Run() 中以使其异步是否有益?

    我提出这个问题的动机是因为我正在创建一个 net Web API 项目 该项目将使用具有同步方法的现有 Neo4j Rest API 客户端 我想通过使用异步方法来利用一些性能提升 但我想避免进入 neo4j api 库并重构同步方法以返回
  • 如何在node.js服务器中自动重新连接mongo?

    假设我有一个连接到 mongoDB 的 Node js 服务器 然后 mongoDB 死亡或断开连接 当然 node js 服务器会失去连接 即使我重新启动 mongoDB node js 服务器也不会自动连接到新的 mongodb 即使它
  • 系统找不到Android Studio指定的文件

    每当我尝试运行 Android 应用程序时 我都会收到一条错误消息 Error C Users zeshan gradle caches 2 14 1 scripts remapped build 6xj57zedh3l90p9pnawvv
  • 如何在 JavaScript 中创建选项卡?

    我一直在尝试用 JavaScript 创建选项卡 当点击一个new tab the 活跃班应适用于它及其相关的面板内容应该显示 但是 那活跃班单击另一个选项卡时不会应用panels也没有改变 它们只是相互堆叠 const tabs docu
  • WPF 如何显示 Image.Source (BitmapSource) 像素位置?

    假设我有一个以缩放方式显示其来源的图像 我如何使用 MouseMove 事件在标签或文本块中显示光标所在的像素位置 我需要像素坐标而不是图像相对于其大小的坐标 提前致谢 您可以从 ImageSource 中找到实际像素的高度和宽度 Imag
  • Android 中的自动增长 ListView

    我确实搜索了与我要问的问题相关的各种问题 我只是想以清晰简单的方式提出问题 并希望得到一个清晰简单的答案 我有一个List我想向用户展示的数百个项目ListView小部件 最初 我想从 50 个项目开始 当用户滚动到底部附近时 我想添加另外
  • 对 .xml 文件中

    内的句子进行编号?

    我是一名初学者程序员 我陷入了这个可能很简单的问题 我想自动将数字添加到 xml 文件的 P 标签中包含的句子中 因此 xml 文件中的示例段落如下所示 p Sentence1 Sentence2 Sentence3 p 我想把它改造成 p