对 .xml 文件中
内的句子进行编号？

2023-12-09

我是一名初学者程序员，我陷入了这个可能很简单的问题：我想自动将数字添加到 .xml 文件的 P 标签中包含的句子中。因此 .xml 文件中的示例段落如下所示：

<P>Sentence1. Sentence2. Sentence3.</P>

我想把它改造成：

<P><SUP>1</SUP>Sentence1.<SUP>2</SUP> Sentence2.<SUP>3</SUP> Sentence3.</P>

然而，只有包含至少 2 个句子的 P 标签才应该编号，如果它只包含 1 个句子，我想保持不变。

这是我迄今为止使用正则表达式提出的方法：

\.\s.*
# Reliably finds the second sentence, Insert <SUP>2</SUP> after it.
<P>[^>]*<SUP>2
# Finds the beginning of the first sentence if a second sentence exists.

然而，我觉得这是一种非常尴尬的方法，我真的不知道如何扩展包含 20 个或更多句子的段落，或包含许多段落的 .xml 文档。是否有更好的正则表达式来实现此目的或比正则表达式更好的（Python）工具？

像这样的东西（未经测试）可能会起作用

import xml.etree.ElementTree as ET
tree = ET.parse(XML_FILE)
root = tree.getroot()


for p in root.iter('p'):
   sentences = p.text.split('.')
   p.text = ".".join([("<sup>%i<sup>" % count) + sentence for count, sentence in enumerate(sentences)])

tree.write(XML_FILE)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

对 .xml 文件中
内的句子进行编号？的相关文章

Gunicorn 工作人员无论如何都会超时

我正在尝试通过gunicorn运行一个简单的烧瓶应用程序但是无论我做什么我的工作人员都会超时无论是否有针对应用程序的活动工作人员在我设置任何内容后总是会超时timeout值到是什么导致它们超时当我发出请求时请求成功通过但工作
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
在virtualenv中下载sqlite3

我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m

随机推荐

AngularJS 路由有什么意义？

我正在创建一个网站我选择在 AJ 中进行我有两个文件夹网关 gt 一些从 mysql 数据库检索数据并将数据作为 json 回显的 php 文件 Views gt 部分 html 文件基本上是每个页面的模板例如用户项目等然后我
将参数括在括号中时，Ruby Kernel.raise 方法会引发错误

我喜欢用括号括起来的方法参数这是对 Pascal 的怀念在清理代码时如果我发现没有它的方法参数我会立即将它们括起来今天它导致我的工作代码抛出错误尽管根据文档我的语法看起来没问题 Kernel raise 的文档具有以下格式 O
C# 数据连接最佳实践？

好吧这是一种固执己见的话题但根据你的知识观点和当前的实践设置以下场景的最佳方法是什么我正在构建一个广泛的数据输入应用程序我所说的广泛是指我只完成了基本设置其中包含整个程序的大约 15 25 并且我有大约 15 个部分设置的表单
将日历与闪亮的散点图链接起来

如果可能的话我希望您帮助我将我的日历链接到我想做的一些散点图我要解释一下我的想法是当该人在日历上选择 01 01 2021 选项时他会生成一个散点图其中包含每个类别的第一个点即 D1 DR01 DR02 DR03 和 DR04
stackoverflow错误：检查数字是偶数还是奇数，没有%或/运算符[重复]

这个问题在这里已经有答案了在没有或运算符的情况下检查数字是偶数还是奇数 public class EvenOrOdd public static int CheckEvenOrOdd int num if num gt 2 int n
有人可以非常详细且易于理解地向我解释 SharedPreferences 在 Android 中的工作原理吗？

我是 Android 开发新手现在我真的很想学习共享首选项我用谷歌搜索了很多次但我认为我还没有完全掌握它我相信此共享首选项将帮助我在登录屏幕活动中存储用户名和密码感谢您我制作了一些关于此的视频作为工作试镜他们帮助我得到了这份工
带 cookie 的 iPhone NSData/NSUrl

我正在尝试播放流式传输网站上托管的 mp3 该网站需要设置 cookie 标头但我在设置该标头或让容器为我执行此操作时遇到困难 NSURL sampleUrl NSURL URLWithString http domain files
R - 使用任何其他列中的值填充列

我有一个 5 列的数据框 4 列有值 1 列为空我想用 4 列中任意一列中的任意值填充空列假设这是我的数据框df Col1 Col2 Col3 Col4 Col5 11 11 2 2 2 23 4 4 15 15 我希望我的结果看起来像
如何在 url asp.net mvc 4 中添加扩展名 .html？

我有网址 http localhost 1714 Message Index 我想展示 http localhost 1714 Message Index html 我该怎么做您需要修改 Web config 以将对 HTML 文件的请求
YouTube API 返回带有空列表的 nextPageToken

这个问题与 YouTube API 500 1000 无关有意义的结果问题我认为 YouTube API nextPageTokens 的工作方式是一旦没有更多结果可返回它们将为 null 但是我看到一开始就返回了结果但有时即使只
如何将指针分配给矩阵的对角线？

我有一个矩阵说REAL 8 MATRIX 100 100 我想仅从主对角线或上三角形创建一个指针怎么做目的是以干净的命名方式轻松访问这些元素对于主对角线请小心您可以执行以下操作 PROGRAM diagonal IMPLICI
过滤嵌套字典[重复]

这个问题在这里已经有答案了所以我有这本字典 Filme 1 Titel 20 Jahr 2 Wertung 6 Preis 50 Schauspielern a b c 2 Titel 30 Jahr 3 Wertung 7 Preis
如何确定 TypeScript.Expression 对象的结果类型？

使用 TypeScript 抽象语法树时如何确定 TypeScript Expression 对象的结果类型我正在使用 TSLint 并尝试查找不传递 Function 类型的对象作为第一个参数的 setTimeout 调用例如在下
将同步调用包装在 Task.Run() 中以使其异步是否有益？

我提出这个问题的动机是因为我正在创建一个 net Web API 项目该项目将使用具有同步方法的现有 Neo4j Rest API 客户端我想通过使用异步方法来利用一些性能提升但我想避免进入 neo4j api 库并重构同步方法以返回
如何在node.js服务器中自动重新连接mongo？

假设我有一个连接到 mongoDB 的 Node js 服务器然后 mongoDB 死亡或断开连接当然 node js 服务器会失去连接即使我重新启动 mongoDB node js 服务器也不会自动连接到新的 mongodb 即使它
系统找不到Android Studio指定的文件

每当我尝试运行 Android 应用程序时我都会收到一条错误消息 Error C Users zeshan gradle caches 2 14 1 scripts remapped build 6xj57zedh3l90p9pnawvv
如何在 JavaScript 中创建选项卡？

我一直在尝试用 JavaScript 创建选项卡当点击一个new tab the 活跃班应适用于它及其相关的面板内容应该显示但是那活跃班单击另一个选项卡时不会应用panels也没有改变它们只是相互堆叠 const tabs docu
WPF 如何显示 Image.Source (BitmapSource) 像素位置？

假设我有一个以缩放方式显示其来源的图像我如何使用 MouseMove 事件在标签或文本块中显示光标所在的像素位置我需要像素坐标而不是图像相对于其大小的坐标提前致谢您可以从 ImageSource 中找到实际像素的高度和宽度 Imag
Android 中的自动增长 ListView

我确实搜索了与我要问的问题相关的各种问题我只是想以清晰简单的方式提出问题并希望得到一个清晰简单的答案我有一个List我想向用户展示的数百个项目ListView小部件最初我想从 50 个项目开始当用户滚动到底部附近时我想添加另外
对 .xml 文件中
内的句子进行编号？

我是一名初学者程序员我陷入了这个可能很简单的问题我想自动将数字添加到 xml 文件的 P 标签中包含的句子中因此 xml 文件中的示例段落如下所示 p Sentence1 Sentence2 Sentence3 p 我想把它改造成 p

对 .xml 文件中 内的句子进行编号？

对 .xml 文件中 内的句子进行编号？ 的相关文章

随机推荐

热门标签

对 .xml 文件中
内的句子进行编号？

对 .xml 文件中
内的句子进行编号？的相关文章