如何在 Python 3 中获取当前语言环境的字母表?

2024-05-15

在 Python 2 中,您可以执行以下操作来获取当前语言环境的字符集:

import string
print string.letters

然而,在 Python 3 中,字符串模块的区域设置相关常量(例如string.letters, string.lowercase, string.uppercase等)被删除。


如何使用 Python 3 获取当前语言环境的字符集?


您可以获得模范人物 http://www.unicode.org/cldr/charts/latest/by_type/core_data.alphabetic_information.main.html对于每个区域设置使用pyicu https://github.com/ovalhub/pyicu module:

import locale
from icu import LocaleData

default, encoding = locale.getdefaultlocale()
languages = [default] + ['en_US', 'fr_FR', 'es_ES']

for language in languages:
    data = LocaleData(language)
    alphabet = data.getExemplarSet()
    print(language, alphabet)

Output

pt_BR [a-zà-ãçéêíò-õú]
en_US [a-z]
fr_FR [a-zàâæ-ëîïôùûüÿœ]
es_ES [a-záéíñóúü]

要获取当前区域设置就足够了:

default, _ = locale.getdefaultlocale()
data = LocaleData(default)
alphabet = data.getExemplarSet()
print(default, alphabet)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Python 3 中获取当前语言环境的字母表? 的相关文章

随机推荐