unicode().decode('utf-8', 'ignore') 引发 UnicodeEncodeError

2024-05-22

这是代码：

>>> z = u'\u2022'.decode('utf-8', 'ignore')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.6/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u2022' in position 0: ordinal not in range(256)

为什么在使用 .decode 时会引发 UnicodeEncodeError？

为什么当我使用“忽略”时会出现错误？

当我第一次开始摆弄 python 字符串和 unicode 时，我花了一段时间才理解这些行话decode and encode也是，所以这是我的帖子here https://stackoverflow.com/questions/4474430/how-can-i-get-unicode-characters-from-a-url-parameter/4474614#4474614这可能有帮助：

考虑到decoding就像你从常规字节串中所做的那样to统一码和encoding就像你所做的那样from统一码。换句话说：

You de-code a str生产一个unicode字符串（在 Python 2 中）

and en-code a unicode字符串来产生str（在Python 2中）

So:

unicode_char = u'\xb0'

encodedchar = unicode_char.encode('utf-8')

encodedchar将包含您的 unicode 字符，以所选编码显示（在本例中，utf-8).

同样的原理也适用于 Python 3。de-code a bytes对象产生一个str目的。你呢en-code a str对象产生一个bytes object.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Unicode

python2x

unicode().decode('utf-8', 'ignore') 引发 UnicodeEncodeError 的相关文章

如何在普通 C89 中读取给定字符长度的 UTF-8 字符串？

我正在用纯 C89 编写一个自定义的跨平台简约 TCP 服务器但我也会接受 POSIX 特定的答案服务器使用 UTF 8 字符串但从不查看它们的内部它将所有字符串视为不可变的二进制 blob 但现在我需要接受来自客户端的 UTF 8
在 SSIS 2012 中为 Oracle CLOB 转换 DT_TEXT

我正在使用 SSIS 2012 我有一个带有 DT TEXT 类型的输出列的脚本组件它是来自网页的 XML 我有一个 OLE DB 目标使用 OLE DB 的本机 OLD DB Oracle 提供程序并且该字段的表定义为 CLOB 这
如何在 Android 上的 HttpPost 中发送 unicode 字符

我试图在我的应用程序中允许多语言支持这会发出 HTTP post 来上传新消息我需要做什么才能支持日语和其他非拉丁语语言我的代码目前看起来像这样 note the msg string is a JSON message by the
C++：LPWSTR 在 cout 中打印为地址

我有一个类型变量LPTSTR 我打印到std cout with lt lt 在 ANSI 系统中不知道它是在哪里确定的它工作得很好它打印了字符串现在在 Unicode 系统中我得到的是十六进制地址而不是字符串那么为什么LP
在 strings.xml 中使用 Unicode 字符

我想在字符串中使用以下 unicode 字符我通过以下方式找到了它的十六进制和十进制代码this http apps timwhitlock info unicode inspect s F0 9F 9A 95 虽然我知道如何在字符串中使
JTextPane 的等宽字体/符号

我想使用 JTextPane 构建类似控制台的输出因此我使用等宽字体 textpane setFont new Font Font MONOSPACED Font PLAIN 12 这适用于所有类型的字母如 a z 0 9 等字符但
将 unicode 代码点转换为 UTF-8 的最简单方法

在 C 中将 Unicode 代码点转换为 UTF 8 字节序列的最简单方法是什么想到的唯一方法是使用iconv从 UTF 32LE 代码页映射到 UTF 8 但这似乎有点矫枉过正 Unicode 转换不是一个简单的任务对我来说使用
R 中带有变音符号的字符列表

我试图将字符串中的电话字符出现次数制成表格但变音符号单独作为字符制成表格理想情况下我有一个国际音标的单词列表其中包含大量变音符号以及它们与基本字符的几种组合我在这里给出了仅包含一个单词的 MWE 但对于单词列表和更多类型的组合
Xcode 6.3 和 Swift：Unicode 实用程序（例如 UCKeyTranslate）不可用？

我有以下测试代码 import Cocoa import Carbon let x kUCKeyActionDisplay 在 Xcode 6 2 中没有问题但在 Xcode 6 3 中此代码会引发错误错误信息是 Use of unre
ColdFusion cfmail 主题行中的特殊字符

邮件主题行中的特殊字符将转换为问号或方框我尝试将主题行的动态字符串包装在 URLEncodedFormat 中但最终徒劳无功
如何在 Emacs shell 缓冲区中获得对“✖”等的支持？

我正在运行一个进程如果出现错误则输出字符如 Unicode 中定义但是如果在 Emacs shell 缓冲区 GNU Emacs 的 Aquamacs 发行版中运行该进程我根本看不到错误使用 braeburn aquamac
当前从解码字符串中删除“surrogateescape”字符的习惯用法

阿明罗纳彻 http lucumr pocoo org 2013 7 2 the updated guide to unicode http lucumr pocoo org 2013 7 2 the updated guide to u
注释非法 Unicode 序列

我曾经在一个处理 unicode 处理的 Java 应用程序上工作像往常一样我首先编写一些代码并测试它然后注释掉工作代码并添加一些新行这个过程一直持续到我找到解决方案我遇到的确切问题是注释掉非法的 Unicode 字符串有些 u
在 JButton 上显示 Unicode 字符

我正在尝试显示这个 Unicode uD83D on a JButton文本但当我编译时它只显示未知字符的平方托马斯给出了一个很好的答案但请注意为了避免猜测哪些已安装的字体支持字符或字符串我们可以迭代可用的字体并使用canDis
Scala 中使用转义特殊字符解码字符串问题

我有一个多行 JSON 文件其中包含编码为十六进制的特殊字符的记录以下是单个 JSON 记录的示例 x22value x22 x22 xC4 xB1arines Bint xC4 xB1 xC3 xA7 Ramu xC3 xA7lar
如何将任何语言和字符集的字符串转换为 Java 中的有效文件名？

我需要根据用户输入的名称生成文件名这些名称可以是任何语言例如约翰史密斯高岡和子我爱你这些是使用输入的值因此我不能保证名称不包含文件名中无效的字符用户将从浏览器下载这些文件因此我需要确保文件名在所有配置的所有操作系统上都有
无法在 Python 2.4 中解码 unicode 字符串

这是Python 2 4 中的这是我的情况我从数据库中提取一个字符串它包含一个变音的 o xf6 此时如果我运行 type value 它会返回 str 然后我尝试运行 decode utf 8 但收到错误 utf8 编解码器无法解
用于 UTF8 到 1252 的 Windows C API

我熟悉 WideCharToMultiByte 和 MultiByteToWideChar 转换可以使用它们来做类似的事情 UTF8 gt UTF16 gt 1252 我知道 iconv 会满足我的需要但是有人知道任何 MS 库可以在一
在有或没有 UNICODE 支持的情况下，如何在我的程序中使用 _stprintf？

微软的定义 stprintf as swprintf if UNICODE被定义并且sprintf如果不但这些函数采用不同的参数在swprintf 第二个参数是缓冲区大小但是sprintf没有这个有人偷懒了吗如果是这样这就是
标准化 UTF-8 到底是什么？

The 重症监护室项目 http userguide icu project org transforms normalization 现在也有一个PHP库 http us php net manual en class normalize

随机推荐

Visual Studio 参考在多项目环境中未被复制

我在 VS 2010 中有一个解决方案文件其中有多个项目现在我有一个对该 dll 调用 MySql Data Entity dll 的引用例如我在解决方案中设置了以下项目域引用MySql Data Entity dll Dom
如何从 Django 中的链接设置预定义的表单值？

我的项目是这样布局的 1 page has many categories 2 category belongs to page has many items 3 item belongs to category 当我进入一个页面时我想修
Emacs + 流浪汉 + plink

我正在尝试让 emacs trapmp 在 Windows XP 下运行以便在 Amazon EC2 实例上通过 putty plink 工作用于执行此操作的文档很少我可以找到部分文档但没有一个文档能够解决实现此功能所需的所有步骤
C# - 为什么我需要初始化 [Out] 参数

我有几个从本机 dll 导入的方法使用以下语法 internal static class DllClass DllImport Example dll EntryPoint ExampleFunction public static e
laravel 模型保存后、保存前等回调

Laravel 中是否有回调例如 afterSave beforeSave etc 我进行了搜索但一无所获如果没有这样的事情实施它的最佳方法是什么 Thanks 实现保存前后回调以扩展的最佳方法save 功能这是一个简单的例子 c
删除对象时指针自动指向空

假设我有一个对象和其他几个不同类类型的对象中的 10 个指向它的指针如果对象被删除这些指针必须设置为空通常我会将对象的类与具有指向它的指针的类互连以便它可以通知它们它正在被删除并且它们可以将它们的指针设置为空但这也有一个负担即
使用 Python 3.x 基本获取 URL 的 HTML 正文

我是Python新手我对 Python 2 x 中的旧 urllib 和 urllib2 与 Python 3 中的新 urllib 之间的差异有点困惑除此之外我不确定数据在发送到 urlopen 之前何时需要编码我一直在尝试使用
python webdriver_manager chrome 自定义配置文件

如何使 webdriver manager chrome 使用自定义 chrome 用户配置文件我知道对于 selenium webdriver 我可以这样指定 options Options options add argument f
无法将 CLOB 数据存储到 DB2 中的 CLOB 定义的列中

我猜这是一个重复的问题但尚未找到合适的解决方案基本上我试图通过以下方式将大一点的 XML 即 32000 个字符插入到 CLOB 列中 DB2程序插入失败并出现以下错误看起来 DB2 正在将输入视为 String 而不是 CLO
理解 Objective-C 中选择器的唯一性

我无法理解选择器的部分功能如苹果指南中所述我把我感到困惑的部分加粗了在 Objective C 中选择器有两个含义可以用来参考当在源代码消息中使用方法时只需使用方法的名称到一个物体不过它也指的是唯一标识符编译源代码
以特定顺序运行具有效果的 jQuery 函数

我在 javascript 函数中有一些 jQuery 可以更改页面上的文本并以特定的时间间隔淡入和淡出我希望这些函数在每个函数完成其效果后按顺序运行 dialogueExchange1 dialogueExchange2 dialogu
在 unix 中编译 dhrystone 时出错

我是使用基准测试和 makefile 的新手我已经从下面的链接下载了 Dhrystone 基准测试我正在尝试编译它但我遇到了奇怪的错误我尝试解决它但没有成功有人可以帮助我运行 dhrystone 基准测试吗以下是我尝试编译的两
如何断点和调试角度模板？

例如在 React 中您可以在视图模板中放置一个断点并检查发生了什么编辑假设我想看看这里发生了什么 h2 hero name uppercase Details h2 div span id span hero id div di
将UIWebView显示的PDF保存到本地

我有一个UIViewController与UIWebView显示一个 pdf 文件具体取决于之前单击的行UITableView 现在我想添加一个按钮供用户在本地保存此 pdf 文件以供离线使用然后还有第二个UITableView它应该
使 html svg 对象也成为可点击的链接（在 iPhone 上）

这个问题与使 html svg 对象也成为可点击的链接 https stackoverflow com q 11374059 4825796 但给出的答案似乎不适用于 iPhone ios 9 3 safari 和 chrome 浏览器我
将日期时间舍入到最后一小时

我试图寻找这个但我找不到我想做的事情的好例子我在 MySQL 数据库中得到了日期时间值当使用该值时必须向下舍入例如所有这些值 2013 04 20 07 14 422013 04 20 07 19 512013 04 20 07
如何使用“子例程引用”作为哈希键

在 Perl 中我正在学习如何取消引用子例程引用但我似乎无法使用子例程引用作为哈希键在下面的示例代码中我可以创建对子例程 subref 的引用然后取消引用它以运行子例程 subref 我可以使用引用作为哈希值然后轻松取消引
如何同时将透镜（或任何其他光学器件）视为吸气剂和设置剂？

我正在尝试编写一个通用记录更新程序它允许人们轻松更新记录中的字段existing记录字段形状相似incoming记录这是我到目前为止所拥有的 applyUpdater fields existing incoming let gett
宏观评价[重复]

这个问题在这里已经有答案了可能的重复未定义的行为和序列点 https stackoverflow com questions 4176328 undefined behavior and sequence points 我无法理解以下宏
unicode().decode('utf-8', 'ignore') 引发 UnicodeEncodeError

这是代码 gt gt gt z u u2022 decode utf 8 ignore Traceback most recent call last File

unicode().decode('utf-8', 'ignore') 引发 UnicodeEncodeError

unicode().decode('utf-8', 'ignore') 引发 UnicodeEncodeError 的相关文章

随机推荐

热门标签