在 Python 2 中,您可以执行以下操作来获取当前语言环境的字符集:
import string
print string.letters
然而,在 Python 3 中,字符串模块的区域设置相关常量(例如string.letters
, string.lowercase
, string.uppercase
等)被删除。
如何使用 Python 3 获取当前语言环境的字符集?
您可以获得模范人物 http://www.unicode.org/cldr/charts/latest/by_type/core_data.alphabetic_information.main.html对于每个区域设置使用pyicu https://github.com/ovalhub/pyicu module:
import locale
from icu import LocaleData
default, encoding = locale.getdefaultlocale()
languages = [default] + ['en_US', 'fr_FR', 'es_ES']
for language in languages:
data = LocaleData(language)
alphabet = data.getExemplarSet()
print(language, alphabet)
Output
pt_BR [a-zà-ãçéêíò-õú]
en_US [a-z]
fr_FR [a-zàâæ-ëîïôùûüÿœ]
es_ES [a-záéíñóúü]
要获取当前区域设置就足够了:
default, _ = locale.getdefaultlocale()
data = LocaleData(default)
alphabet = data.getExemplarSet()
print(default, alphabet)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)