Python 2.7，将utf8字符串转换为ascii

2024-01-09

我正在使用 python 2.7.12 我有一个包含 unicode 文字的字符串，它不是 Unicode 类型。我想将其转换为文本。这个例子解释了我想要做什么。

>>> s
'\x00u\x00s\x00e\x00r\x00n\x00a\x00m\x00e\x00'
>>> print s
username
>>> type(s)
<type 'str'>
>>> s == "username"
False

我将如何转换这个字符串？

这不是 UTF-8，而是 UTF-16，尽管不清楚它是大端还是小端（没有 BOM，并且有一个前导和尾随 NUL 字节，使其长度不均匀）。对于 ASCII 范围内的文本，UTF-8 与 ASCII 无法区分，而 UTF-16 将 NUL 字节与 ASCII 编码字节交替（如您的示例中所示）。

无论如何，转换为纯 ASCII 相当容易，您只需要以一种或另一种方式处理不均匀的长度：

s = 'u\x00s\x00e\x00r\x00n\x00a\x00m\x00e\x00' # I removed \x00 from beginning manually
sascii = s.decode('utf-16-le').encode('ascii')

# Or without manually removing leading \x00
sascii = s.decode('utf-16-be', errors='ignore').encode('ascii')

当然，如果您的输入只是 NUL 散布的 ASCII，并且您无法弄清楚字节顺序或如何获得偶数个字节，那么您可以作弊：

sascii = s.replace('\x00', '')

但是，在输入是某种完全不同的编码的情况下，这不会引发异常，因此它可能会隐藏指定您期望捕获的错误。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python27

UTF8

Python 2.7，将utf8字符串转换为ascii 的相关文章

PhotoImage 实例没有属性“调整大小”

我收到错误 PhotoImage 实例没有属性调整大小尽管多个在线资源声称这是使用 PIL 调整图像大小的方法有任何想法吗相关代码 Deathwing ImageTk PhotoImage Image open Deathwing
无法解析 ReferenceProperty -- App Engine

我遇到了一个错误无法找出其根本原因错误如下 ReferenceProperty 无法解析 u StatusLog STATUSLOGSID 此错误仅有时发生大约一天一次或两次生成此错误的脚本成功的次数多于失败的次数该错误最奇怪的事
将以utf-8字符串为内容的unicode转换为str

我正在使用 pyquery 来解析页面 dom PyQuery http zh wikipedia org w index php title CSS printable yes variant zh cn content dom mw c
C++ 字符串：UTF-8 还是 16 位编码？

我仍在尝试决定我的家庭项目是否应该使用UTF 8 http en wikipedia org wiki UTF 8字符串根据 std string 实现必要时带有附加的 UTF 8 特定函数或一些 16 位字符串作为 std w
无法在 Windows 10 上启动 Celery Worker，并出现“PicklingError”

我有一个简单的测试代码可以在 Linux 上成功运行但它无法在我的 Windows 10 x64 计算机上运行当我尝试启动 celery Worker 时它抱怨无法恢复的错误 PicklingError 芹菜版本 3 1 20 在我
python中如何获取对象属性的类型

假设我有以下课程 class myClass def init self number self myStr bla self myInt number 3 如何获取属性类型我的意思是我想获得以下列表 str int 我还希望它适用于派生
Python 谷歌语音

我正在使用 google voice APIhere https pypi python org pypi pygooglevoice 0 5 并尝试从 Python 发送短信但是每当我尝试使用此代码登录时我都会得到一些意想不到的信息
在Python中创建32位浮点wav文件？

我想在 Python 2 x 中创建 32 位浮动 WAV 文件虽然标准 WAV 文件通常使用 int 但许多专业音频应用程序将音频数据处理并保存为 float 标准波形模块无法执行此操作 http bugs python org
dump() 缺少 1 个必需的位置参数：python json 中的“fp”

我正在尝试美化 json 格式但收到此错误 import requests as tt from bs4 import BeautifulSoup import json get url tt get https in pinterest
Python 2.7 - statsmodels - 格式化和编写摘要输出

我正在使用逻辑回归pandas 0 11 0 数据处理和statsmodels 0 4 3在 Mac OSX Lion 上进行实际回归我将运行约 2 900 个不同的逻辑回归模型并需要将结果输出到 csv 文件并以特定方式格式化目前
在 ROS 中运行tensorRT时出现“LogicError：explicit_context_dependent失败：无效的设备上下文 - 没有当前活动的上下文？”

我在 TensorRT 使用 python 中有一个推理代码我想在 ROS 中运行此代码但在尝试分配缓冲区时出现以下错误 LogicError explicit context dependent failed invalid devi
python中使用argsort进行排序

我尝试对数组进行排序 import numpy as np arr 5 3 7 2 6 34 46 344 545 32 5 22 print unsorted print arr np argsort arr print sorted p
使用 Google App Engine 和 Django 将第三方库 (twilio) 添加到项目中

每个人我是这个领域的新手我使用 django 框架使用 google 应用引擎开发 Web 应用程序我有一个关于 python lib dir 问题的故障排除导入错误没有名为的模块我的 appengine config py
Oracle中如何检测4字节UTF8字符

我们已经看到oracle中存储了4字节的UTF 8字符我们需要检测特定列中有多少行包含此类字符尝试了这里给出的建议 UTF 16 补充字符 https stackoverflow com questions 34720830 how t
印地语在 tcpdf 上无法正确显示

我创建了以下代码用于在 tcpdf 中使用 arial unicode 字体显示印地文文本 pdf new TCPDF PDF PAGE ORIENTATION PDF UNIT PDF PAGE FORMAT true UTF 8 fa
每个值有多个键

是否可以在 Python 字典中为每个值分配多个键一种可能的解决方案是为每个键分配值 dict k1 v1 k2 v1 k3 v1 k4 v2 但这并不高效因为我的数据文件大于 2 GB 否则你可以制作一个字典键的字典 key dic
python 2.7.5 中的 str() 与 repr() 函数[重复]

这个问题在这里已经有答案了有什么区别str and repr python 2 7 5 中的函数 python org 上的说明 The str 函数的目的是返回值的表示这些值是相当的人类可读的 while repr 是为了生成表示可
spacy 是否将令牌列表作为输入？

我想使用 spacy 的 POS 标记 NER 和依存解析而不使用单词标记化事实上我的输入是代表一个句子的标记列表我想尊重用户的标记化无论是使用 spacy 还是任何其他 NLP 包这是否可能现在我使用这个基于 spacy
如何使用 python 标准库 zipfile 检查 zip 文件是否已加密？

我正在使用 python 的标准库 zipfile 来测试存档 zf zipfile ZipFile archive name if zf testzip None checksum OK True 我收到这个运行时异常 File pack
使用解析将 ** 运算符更改为幂函数？

我的要求是将运算符更改为幂函数例如 1 Input B 2 Output power B 2 2 B 2 T 2 X Output power B 2 我写了下面的正则表达式来解决这个问题 rx r a zA Z0 9 a zA Z0

随机推荐

“mean_squared_error”的负值

我正在使用 scikit 并使用mean squared error作为 cross val score 中模型评估的评分函数 rms score cross validation cross val score model X y cv
将多个列表传递到 ArrayAdapter

我从活动中开始 adapter new ItemAdapter Items this items totals setListAdapter adapter 现在这是 ItemAdapter public class ItemAdapt
如何打开.sqlite-wal

我想从 Mac 应用程序导出我的 Shazamed 标签该应用程序不提供任何导出选项 Mac 版 Shazam 将它们存储在 sqlite 3 数据库中该应用程序正在生成 3 个文件 ShazamDataModel sqlite Sha
如何使用 MinGW 在 Windows 中构建 Google 的 protobuf？

我使用 Code Blocks 作为 MingW 的 IDE 我正在尝试使用谷歌协议缓冲区但我在构建 protobuf 时遇到了麻烦 protobuf 的自述文件说如果您使用 Cygwin 或 MinGW 按照上面的 Unix 安装说明
从 Netbeans 项目中删除文件，但不从硬盘中删除文件

我的项目文件夹中有很多文件但我不想将它们全部放在我的 Netbeans 项目中 Netbeans 还会使用更多内存和时间自动扫描它们有没有办法从 Netbeans 项目中排除文件文件夹使用 Netbeans 7 3 的解决方案在
如何在 jquery 中创建查询字符串？

我被困在这个问题上我想在动态过滤器上创建查询字符串现在我已经添加了过滤器类型Select your favorite sports and Select your favorite food 所以将来将会有更多的过滤器并且只会出现在复
创建 UNIX shell

我想为 UNIX 创建一个迷你 shell 只是为了了解一切的来龙去脉我对过去认为理所当然的事情有些困惑这是一个有点哲学的问题当我创建一个 shell 时我假设我有一个没有 shell 的 UNIX 那么在这种情况下 std in
串行或并行：Robo 测试实验室的设备测试顺序

当我在 Robo 测试实验室上使用多个物理设备运行测试配置时从 firebase 控制台或通过将应用程序上传到 Play 商店这些设备是并行运行还是串行运行如果设备并行运行由于测试设备之间共享相同的设置参数我的机器人设置脚本将无法
在 Windows 与 Mac 上更改 ggplot2 中的字体

我在 Mac 上使用 ggplot2 创建了一个绘图我将字体更改为 Times New Roman 效果很好 library extrafont ggplot data df stat density aes x R1 colour rh
将查找和替换对话框重置为 Visual Studio 中的当前文档

有没有办法在 Visual Studio 中强制查找和替换对话框自动选择当前文件在查找范围下拉列表中它应该仅在重新打开对话框时执行此操作我经常忘记从整个解决方案或项目切换回来最终浪费了大量时间等待 VS 搜索包括设计器文件
Kotlin 1.2.50 要求提供 baseFeatureInfoDir

当我切换 Android 项目时 classpath com android tools build gradle 3 2 0 alpha18 to classpath org jetbrains kotlin kotlin gradle
在 Java 中复制数据的更快方法？

我接到一项从服务器复制数据的任务我在用BufferedInputStream和输出流来复制数据我正在逐字节地进行尽管它正在运行但复制数据需要很长时间因为其中一些数据有 100 MB 所以它肯定不会工作任何人都可以建议我使用逐字节
在 xsd 中定义 xml，其中属性决定可能的内容

如何在 xsd 中定义这样的东西
vim中ctrl-v粘贴时如何输入^M

我的vim使用ctrl v是粘贴快捷方式这与需要ctrl v作为快捷方式前缀的命令冲突例如 M need ctrl v ctrl m 我可以在 vim 命令行中执行此操作并且无需初始化即可在 vim 中执行此操作但该符号不会从 vi
SQL JOIN 查找没有特定值的匹配记录的记录

我正在尝试加快几年前为雇主的购买授权应用程序编写的一些代码的速度基本上我有一个慢子查询我想用 JOIN 替换它如果它更快当主管登录应用程序时他会看到他尚未授权或拒绝的购买请求列表该列表是通过以下查询生成的 SELECT FROM
numpy 唯一且不排序[重复]

这个问题在这里已经有答案了如何使用 numpy unique 而不对结果进行排序而只是按照它们在序列中出现的顺序进行排序像这样的东西吗 a 4 2 1 3 1 2 3 4 np unique a 4 2 1 3 而不是 np uniq
使用 OpenCV 查找灰度图像中的局部最大值

有谁知道如何找到灰度中的局部最大值IPL DEPTH 8U使用 OpenCV 进行图像处理 HarrisCorner 提到了类似的东西但我实际上对角落不感兴趣谢谢如果像素等于局部邻域中的最大值则该像素被视为局部最大值下面的函数
为什么 ANTLR4 不匹配单词“of”和标点符号“,”？

我有一个Hello g4带有语法定义的语法文件 definition wordsWithPunctuation words WORD wordsWithPunctuation word word punctuation word word
Android M 奇怪的共享首选项问题

在我运行 Android M 开发者预览版 2 的 Nexus 5 上卸载重新安装应用程序时设备正在检索我很久以前存储的共享首选项例如布尔值isFirstLaunch 清除这些的唯一方法是从设备设置中手动执行此操作 Android
Python 2.7，将utf8字符串转换为ascii

我正在使用 python 2 7 12 我有一个包含 unicode 文字的字符串它不是 Unicode 类型我想将其转换为文本这个例子解释了我想要做什么 gt gt gt s x00u x00s x00e x00r x00n x00

Python 2.7，将utf8字符串转换为ascii

Python 2.7，将utf8字符串转换为ascii 的相关文章

随机推荐

热门标签