为什么 `'↊'.isnumeric()` 为 false？

2024-01-09

根据官方 Unicode 联盟代码表 http://www.unicode.org/charts/PDF/U2150.pdf，所有这些都是数字：

⅐   ⅑   ⅒   ⅓   ⅔   ⅕   ⅖   ⅗   ⅘   ⅙   ⅚   ⅛   ⅜   ⅝   ⅞   ⅟
Ⅰ   Ⅱ   Ⅲ   Ⅳ   Ⅴ   Ⅵ   Ⅶ   Ⅷ   Ⅸ   Ⅹ   Ⅺ   Ⅻ   Ⅼ   Ⅽ   Ⅾ   Ⅿ
ⅰ   ⅱ   ⅲ   ⅳ   ⅴ   ⅵ   ⅶ   ⅷ   ⅸ   ⅹ   ⅺ   ⅻ   ⅼ   ⅽ   ⅾ   ⅿ
ↀ   ↁ   ↂ   Ↄ   ↄ   ↅ   ↆ   ↇ   ↈ   ↉   ↊   ↋

然而，当我要求 Python 告诉我哪些是数字时，它们都是数字（甚至⅟）除了四个：

In [252]: print([k for k in "⅐⅑⅒⅓⅔⅕⅖⅗⅘⅙⅚⅛⅜⅝⅞⅟ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫⅬⅭⅮⅯⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿↀↁↂↃↄↅↆↇↈ↉↊↋" if not k.isnumeric()])
['Ↄ', 'ↄ', '↊', '↋']

那些是：

Ↄ 罗马数字倒转一百
ↄ 拉丁文小写字母反转 C
↊ 变成数字二
↋ 变成数字三

为什么 Python 认为这些不是数字？

str.isnumeric https://docs.python.org/3/library/stdtypes.html?highlight=isnumeric#str.isnumeric对于“具有 Unicode 数值属性的所有字符”，记录为 true。

The canonical reference for that property is the Unicode Character Database http://www.unicode.org/ucd/. The information we need can be dug out of http://www.unicode.org/Public/9.0.0/ucd/UnicodeData.txt http://www.unicode.org/Public/9.0.0/ucd/UnicodeData.txt , which is the latest version at time of writing (late 2016) (warning: 1.5MB text file). It's a little tricky to read (the documentation is in UAX#44 http://www.unicode.org/reports/tr44/). I'm going to show its entry for a character that is numeric first, U+3023 HANGZHOU NUMERAL THREE (〣)

3023;HANGZHOU NUMERAL THREE;Nl;0;L;;;;3;N;;;;;

第八个分号分隔字段是“数值”属性；在本例中，它的值为3，与角色的名字一致。蟒蛇的str.isnumeric当且仅当该字段非空时才为 true。可以直接使用查询unicodedata.numeric https://docs.python.org/3/library/unicodedata.html#unicodedata.numeric.

The third以分号分隔的字段是一个两个字符的代码，给出“一般类别 http://www.unicode.org/reports/tr44/#General_Category_Values“；在本例中为“Nl”。大多数（但不是全部）具有数值的字符都属于“数字”类别之一（类别代码的第一个字母是 N）。例外情况是所有汉字，根据上下文，可能表示也可能不表示数字；请参阅UAX#38 http://www.unicode.org/reports/tr38/.

现在，您所询问的角色：

2183;ROMAN NUMERAL REVERSED ONE HUNDRED;Lu;0;L ;;;;;N;;;    ;2184;
2184;LATIN SMALL LETTER REVERSED C     ;Ll;0;L ;;;;;N;;;2183;    ;2183
218A;TURNED DIGIT TWO                  ;So;0;ON;;;;;N;;;    ;    ;
218B;TURNED DIGIT THREE                ;So;0;ON;;;;;N;;;    ;    ;

这些字符做not分配了一个数值，因此 Python 的行为是正确的。

注：每https://docs.python.org/3.6/whatsnew/3.6.html https://docs.python.org/3.6/whatsnew/3.6.html，Python只会在3.6版本中更新到Unicode 9.0.0；然而，AFAICT这些字符已经很长时间没有改变了。

（“为什么这些字符没有数值？”这个问题只有 Unicode 联盟才能明确回答；如果您有兴趣，我建议您在他们的一个网站上提出这个问题）邮件列表 http://www.unicode.org/consortium/distlist.html.)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

为什么 `'↊'.isnumeric()` 为 false？的相关文章

使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
Django 代理模型的继承和多态性

我正在开发一个我没有启动的 Django 项目我面临着一个问题遗产我有一个大模型在示例中简化称为MyModel这应该代表不同种类的物品的所有实例对象MyModel应该具有相同的字段但方法的行为根据项目类型的不同而有很大差异到目
通过 Scrapy 抓取 Google Analytics

我一直在尝试使用 Scrapy 从 Google Analytics 获取一些数据尽管我是一个完全的 Python 新手但我已经取得了一些进展我现在可以通过 Scrapy 登录 Google Analytics 但我需要发出 AJAX
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
如何使用 ICU 解析汉字数字字符？

我正在编写一个使用 ICU 来解析由汉字数字字符组成的 Unicode 字符串的函数并希望返回该字符串的整数值五 gt 5 三十一 gt 31 五千九百七十二 gt 5972 我将区域设置设置为 Locale getJapan 并使用
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

如何在 WPF 应用程序中生成 FlowDocument 的“打印预览”？

我的各种 WPF 应用程序显示 FlowDocument 我可以使用中描述的方法打印它们的答案打印 WPF FlowDocument https stackoverflow com questions 345009 printing a w
不允许使用通用接口的通用列表，有其他方法吗？

我正在尝试找到使用通用接口的通用列表作为变量的正确方法这是一个例子这可能不是最好的但希望您能明白这一点 public interface IPrimitive
toDF 的值不是 org.apache.spark.rdd.RDD[(Long, org.apache.spark.ml.linalg.Vector)] 的成员

在 SPARK 2 0 中使用 SCALA 将 pre LDA 转换转换为数据帧时遇到编译错误抛出错误的具体代码如下 val documents PreLDAmodel transform mp listing lda df select
从 HINSTANCE 调用 GetClassInfo 到外部窗口是否不合适？

作为一名前锋我对 Windows API 非常缺乏经验我正在尝试了解有关不同窗口的信息所以我在ATOM来自 Windows 我正在尝试调用GetClassInfo 但是每次我调用它时它都会失败我正在尝试看一个Untitled Not
在 C++ 中将十六进制字符串转换为十进制数

我想在 C 中将十六进制字符串转换为十进制数字整数并尝试使用以下方法 std wstringstream SS SS lt lt std dec lt lt stol L 0xBAD lt lt endl 但它又回来了0反而2989 s
潜在危险请求，隐藏错误

我正在尝试检查 MVC 应用程序的安全性当我尝试输入 html 或 javascript 时出现错误潜在危险请求 Server Error in Application A potentially dangerous Request
OpenGL 与 OpenMP 总是出现段错误

我的程序中有一个循环它将用像素 GL POINTS 填充 3D 立方体因此为了加快速度我想我可以使用 OpenMP 并在我的多核处理器中分离这个 for 循环问题是每当我在循环中使用 OpenMP 时程序都会出现段错误以下是循
为什么我们在渲染时必须清除OpenGL中的深度缓冲区？

我试图运行 OpenGL 代码但它没有GL DEPTH BUFFER BIT在 glClear 中清除因此我无法渲染场景我添加了这一点场景就被渲染了为什么需要使用这个清除位我可能知道这样做的原因以清除 GPU 之前使用的深度缓
访问（传递给）django 模型信号方法，如 pre_save、pre_delete request.user？

我必须跟踪我的模型发生的所有更改的历史记录我还跟踪用户所做的更改现在我正在处理views py 但我想使用django信号来利用这个功能例如pre save pre delete对于每个模型问题是 1 访问 request user
使用事件过滤器消费事件

首先谁能向我解释一下为什么我的MouseEvent无论哪个都会被消耗Alert 我选择的选项我想这与调用有关Alert在一个EventFilter 但我还不清楚 public class EventFilterConsumeError
是否可以在 sails.js / Waterline 中重命名 `createdAt` 和 `updatedAt`

使用 SailsJS 中的 Waterline ORM 我的默认值是autoCreatedAt and autoUpdatedAt设置为 false 但我仍然需要仅使用不同的字段名称 DBA 请求来实现该功能有没有办法为自动生成的字段
使用套接字时“流结束”是什么意思

在 Java 中使用套接字时如何在开始处理数据之前判断客户端是否已完成所有二进制数据的发送例如考虑 istream new BufferedInputStream socket getInputStream ostream new
Swift：替换字符串中的字符 - 没有 stringByReplacingOccurrencesOfString

好吧假设我有一个String like let myString my string hello 我想用替换我到目前为止 let characters map Array myString 0 0 它返回一个MapCollection
缩放后为不同标签设置相同的字体大小

我正在制作一个有 3 个标签的应用程序我正在使用标签自动收缩来帮助调整标签的字体大小以适应设备这些标签彼此相邻因此这意味着我希望它们具有相同的字体大小目前发生的情况是因为它们有不同数量的文本它们最终会缩小到不同的字体大小有没有
混淆 JavaFX 应用程序

由于 fxml files 使用控制器类来处理事件那么如何混淆 JavaFX 应用程序呢当混淆的控制器类具有不同的名称和路径时 fxml 文件无法找到它们混淆后编辑 fxml 文件不是我正在寻找的解决方案还有其他选择吗没有必要重新
OkHttp SSLHandshakeException SSL 握手中止 SSL 库中出现故障，协议错误

04 23 17 17 38 434 21599 21956 D NativeCrypto ssl 0x0 NativeCrypto SSL interrupt 04 23 17 17 38 435 21599 21956 D OkHttp
夏令时和 Cron

如果 Cron 有一项工作安排在凌晨 2 点运行另一项工作在凌晨 3 点运行这些工作将如何受到夏令时的影响当时间向后移动一小时时时间是否会直接从凌晨 2 59 59 变为凌晨 2 00 00 这意味着凌晨 2 点的作业将运行两次凌
运行时设置 TextView 在 RemoteView 中的位置

亲爱的大家我正在尝试在应用程序小部件中设置 TextView 的位置基本上直接访问 TextView 的属性是有效的 myRemoteView setTextColor R id myTextView Color WHITE work
检测鼠标被按住

我试图检测何时按住鼠标而不是单击鼠标这就是我所拥有的但我希望能够检测到鼠标被按住而不是点击计数 void mouseDown NSEvent event instead of clickCount I want my if state
为什么 `'↊'.isnumeric()` 为 false？

根据官方 Unicode 联盟代码表 http www unicode org charts PDF U2150 pdf 所有这些都是数字然而当我要求 Python 告诉我哪些是数字时它们都是数字甚至除了四个 In 252

为什么 `'↊'.isnumeric()` 为 false？

为什么 `'↊'.isnumeric()` 为 false？ 的相关文章

随机推荐

热门标签

为什么 `'↊'.isnumeric()` 为 false？的相关文章