Python“非规范化”unicode 组合字符

2024-05-16

我正在寻找标准化 python 中的一些 unicode 文本。我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的“非规范化”形式？例如如果我有序列u'o\xaf' (i.e. latin small letter o其次是combining macron), 得到 ō (latin small letter o with macron）。很容易走另一条路：

o = unicodedata.lookup("LATIN SMALL LETTER O WITH MACRON")
o = unicodedata.normalize('NFD', o)

正如我所评论的，U+00AF 不是一个组合宏。但您可以使用 NFKD 变换将其转换为 U+0020 U+0304。

>>> unicodedata.normalize('NFKD', u'o\u00af')
u'o \u0304'

然后您可以删除空格并通过 NFC 获取 ō。

（请注意，NFKD 在分解方面非常激进，可能会丢失一些语义 - 任何“兼容”的内容都将被分离出来。

'½'(U+008D) ↦'1' '⁄'(U+2044)'2';
'²'(U+00B2) ↦'2'
'①'(U+2460) ↦'1'

etc.)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

Python“非规范化”unicode 组合字符的相关文章

使用“iloc”时出现“尝试在 DataFrame 切片的副本上设置值”错误

Jupyter 笔记本返回此警告 C anaconda lib site packages pandas core indexing py 337 SettingWithCopyWarning A value is trying to be
如何将字典转换为字符串

我正在尝试使用提供的解决方案here https stackoverflow com questions 5192753 how to get the number of occurrences of each character usin
SQLAlchemy 关系错误：对象没有属性“c”

I used sql自动编码 https code google com p sqlautocode 生成我的模型和所有关系我正在尝试做一个简单的查询例如 obj session query Venue filter Venue sym
在numpy中，[:,None]选择有什么作用？

我正在学习 Udacity 的深度学习课程我遇到了以下代码 def reformat dataset labels dataset dataset reshape 1 image size image size astype np flo
如何向未知用户目录读取/写入文件？

我正在尝试从用户目录 C Users USERNAME Test Source 读取和写入文件但我未能成功找到任何有关如何自动检测用户名的资源其中的 USERNAME上面的例子或者无论如何我可以让它读取和写入目录而不需要知道用户名
在 Java 中对多语言环境字符串进行排序

我正在尝试按字符串字段国家地区对对象列表进行排序每个国家地区都使用其母语阿根廷澳大利亚奥地利例如我想要做的是让出现在 A 国家之后因为字母对应于拉丁语 B 我正在尝试使用默认的 Collat er 但非拉丁名称仍然
Python 2.7从非默认目录打开多个文件（对于opencv）

我在 64 位 win7 上使用 python 2 7 并拥有 opencv 2 4 x 当我写 cv2 imread pic 时它会在我的默认 python 路径中打开 pic 即C Users Myname 但是我如何设法浏览不同的目
如何使用列表理解从列表中删除重复的项目？ [复制]

这个问题在这里已经有答案了如何使用列表理解从列表中删除重复的项目我有以下代码 a 1 2 3 3 5 9 6 2 8 5 2 3 5 7 3 5 8 b b item for item in a if item not in b 但它不
如何获取一个类的所有实例

我是一名初学者正在学习 Python 我想创建一个课程Person 在构造函数中我想将我创建的每个实例放入一个名为实例的集合中然后我希望实例方法返回所有实例我怎样才能做到这一点 class Person Type annota
计算两个节点之间的最长路径 NetworkX

我正在尝试使用 Networkx 制作甘特图网络中的所有节点都是完成项目所需执行的任务使用 Networkx 可以轻松计算项目的总时间但是制作甘特图我需要每个节点的最新启动 NetworkX 包含一个函数 dag longest p
如何在 django admin 中使用自定义字段进行搜索

我有一个模型并已注册到管理员并且我已使用自定义字段在列表中显示 class ReportsAdmin admin ModelAdmin def investment self inst return models OrderDetail
使用 Python 将 Json 转换为换行 Json 标准

我有一个获取嵌套对象并删除所有嵌套的代码使对象平坦 def flatten json y param y Unflated Json return Flated Json out def flatten x name if type x
使用字符串迭代 url - python

我现在完全被我的代码困住了首先我尝试从 volkskrant 的存档页面检索所有网址这是我被打击的第一步某一特定日期的 url 如下所示 http www volkskrant nl archief detail 01012016
Python 结构的 PHP 替代品

我很高兴在我的 Python 项目中使用 Fabric 进行部署现在我正在从事一个更大的 PHP 项目想知道是否有类似 PHP 的 Fabric 之类的东西唔为什么这有关系 Fabric 只是 python 脚本所以它与项目语言无
如何在 django-rest-framework 查询集响应中添加注释数据？

我正在为查询集中的每个项目生成聚合 def get queryset self from django db models import Count queryset Book objects annotate Count authors
在 Django 中使用 path() 找不到 404

我刚刚查看 django 并尝试通过视图列出书籍id作为 URL 的参数books urls py 但出现 404 页面未找到错误当我在浏览器中输入此网址时我没有发现网址有什么问题 http 192 168 0 106 8000 boo
在 Django 中删除特定用户的所有会话的最优化方法？

我正在运行 Django 1 3 使用会话中间件和身份验证中间件 settings py SESSION ENGINE django contrib sessions backends db Persist sessions to DB S
Mxnet - 缓慢的数组复制到 GPU

我的问题我应该如何在 mxnet 中执行快速矩阵乘法我的具体问题数组复制到 GPU 的速度很慢对此我们能做些什么呢我创建随机数组将它们复制到上下文中然后相乘 import mxnet as mx import mxnet nd
Python 3d 金字塔

我是 3D 绘图新手我只想用 5 个点建造一个金字塔并通过它切出一个平面我的问题是我不知道如何填充两侧 points np array 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 fig plt figure ax fi
网站可以检测您何时将 Selenium 与 chromedriver 结合使用吗？

我一直在使用 Chromedriver 测试 Selenium 我注意到有些页面可以检测到您正在使用 Selenium 即使根本没有自动化即使我只是通过 Selenium 使用 Chrome 手动浏览 Xephyr https en wi

随机推荐

C++中的类要具备什么条件才能成为容器？

我是 C 编程新手偶然发现了这个术语containers举例如下vector deque map etc 一个企业的最低要求应该是什么class应该满足被称为container in C 我将从范围这个概念开始 Range 只有两个方
按一个字段聚合，选择另一个字段最大值的文档作为集合

使用聚合框架获取每个分组的字段最大值的文档的最佳方法是什么因此使用下面的集合我希望具有为每个具有最新日期的 group id 返回一个文档的功能第二个清单显示了所需的结果 group id date 1 11 1 12 1 11 2
网格布局：创建 CSS，以便元素在调整相邻元素大小时保持位置

我想在网格布局中构建一个简单的图像库并且我正在使用类似的东西悬停时缩放 http www javascript fx com navigation imagezoom general help help html缩放悬停图像但我宁愿使用
具有 JPA 持久性的 Spring 状态机 - 存储库使用

我试图弄清楚如何轻松使用 Spring 状态机包括使用 JPA 进行持久化这是我正在处理的问题不兼容的数据类型工厂和持久性在程序的某个时刻我想使用连接到用户的状态机有用于此目的的存储库项目spring statemachin
为 Windows Phone 7 创建自定义 InputScope

在哪里可以找到创建自定义 InputScope 的教程我想创建一个自定义键盘在屏幕键盘上仅显示数字 1 9 无符号您无法创建自定义输入范围以下是支持的范围输入范围名称值枚举 http msdn microsoft com en us
如何使用 Perl CGI 脚本提供图像？

我的 Google fu 让我失望了如何使用 Perl 提供已生成的图像 Example img src getimage pl getimage pl 里有什么干得好 usr bin perl w my file inner nav
在VS2015中构建项目：“csc.exe”退出，代码为-1073741571

我使用的是Visual studio 2013 昨天我安装了VS2015 企业更新3 我的解决方案的构建过程在 VS2015 中的一个项目中崩溃了 VS2017 RC 也会出现同样的异常该解决方案在 VS2013 中成功构建该解决方案
为什么函数声明在不同浏览器中的处理方式不同？

虽然我在谷歌中找不到对此的引用但我熟悉这样一个事实在 javascript 中全局函数声明在执行任何代码之前都会被解释换句话说这工作得很好 f function f 但是我注意到 chrome 和 firefox 对全局函数声明
Javascript：我应该隐藏我的实现吗？

作为一名 C 程序员我有一个习惯将可以而且应该私有的东西设为私有当 JS 类型向我公开其所有私有部分时我总是有一种奇怪的感觉而且这种感觉并没有被唤起假设我有一个类型draw方法内部调用drawBackground and d
活动组代码示例

有人可以给我一些使用活动组的示例代码吗我的应用程序中有一些按钮我想将活动应用于这些按钮目前我正在使用 setVisibility 但我被告知活动组将是更好的选择这是另一个ActivityGroup 示例项目 http richipa
修改 Twitter 帖子上可编辑 Div 的内容

我正在编写一个 chrome 扩展它可以帮助用户在 Twitter 上输入内容当在 twitter 上写推文时 twitter 会打开一个可编辑的 div 容器当用户输入内容时 twitter 大概正在使用某些网络框架会生成子 di
通过 r markdown 中的循环创建代码片段

如同如何使用R中的knitr创建一个包含代码块和文本的循环 https stackoverflow com questions 36373630 how to create a loop that includes both a code
内置和可加载模块的 __init 和 __exit 宏用法

我正在阅读有关linux内核开发的内容我刚刚读了一些我不明白的文字以下段落讨论了模块的 init 和 exit 宏这演示了内核 2 2 及更高版本的一个功能注意变化在 init 和 cleanup 函数的定义中 init 宏导致
Android 发布到 facebook 墙，stream.publish 几天来就中断了

我有很多使用 FB android sdk 发布的应用程序 github com facebook facebook android sdk 我所有使用 FB 的应用程序几天后就停止工作了这必然是 FB 方面的更改或错误因为我的应用程序
Node 不断恢复到旧版本

每次我在控制台中重新启动 vagrant 时它都会询问我的登录详细信息然后说Now using node v7 10 0 npm v4 2 0 当我做run nvm install node I get v13 11 0 is alre
为什么我收到“无法进行二进制日志记录”的信息。在我的 MySQL 服务器上？

当我今天启动 MySQL 服务器并尝试使用以下命令进行一些更改时用于 MySQL 的 Toad http www quest com toad for mysql 我收到此消息 MySQL 数据库错误无法进行二进制日志记录消息交易级别
Struts 1 到 Spring 迁移 - 策略

我有一个legacy银行应用程序编码为Struts 1 JSP现在的要求是迁移后端目前为 MVC to Springboot MVC 后续UI JSP 将迁移到angular Caveats 1 后端不是无状态的 2 会话对象中存储了大量
SQL 查询将文本数据存储在 Varbinary(max) 中

有没有办法让 varbinary 在 SQL Server 中接受文本数据这是我的情况我有相当大量的 XML 我计划以压缩格式存储它们这意味着 Varbinary 但是当我进行调试时我希望能够翻转配置开关并以纯文本形式存储以
具有多个谓词的 C++11 算法

功能如std find if来自algorithmheader 确实很有用但对我来说一个严重的限制是我只能为每次调用使用 1 个谓词count if 例如给定一个像这样的容器std vector我想同时应用相同的迭代find if 多个
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette

Python“非规范化”unicode 组合字符

Python“非规范化”unicode 组合字符 的相关文章

随机推荐

热门标签

Python“非规范化”unicode 组合字符的相关文章