将 Unicode 转换为 python [重复]

2023-12-04

可能的重复：
将 Unicode 转换为 UTF-8 Python

我是一个非常新的 Python 程序员，正在编写我的第一个脚本。该脚本从 plist 字符串中提取文本，然后对其执行一些操作，然后将其打包为 HTML 电子邮件。

从一些条目中，我收到了可怕的 Unicode“outside ordinal 128”错误。

在阅读了尽可能多的有关编码和解码的内容后，我知道获得编码对我来说很重要，但我很难理解何时或如何准确地执行此操作。

首先使用 plistlib 引入有问题的变量，然后将其从 markdown 转换为 HTML，如下所示：

entry = result['Entry Text']
donotecontent = markdown2.markdown(entry)

后来，它在电子邮件中这样写：

html = donotecontent + '<br /><br />' + var3
part1 = MIMEText(html, 'html')
msg.attach(part1)

我的问题是，确保此内容中的 Unicode 字符不会导致抛出错误的最佳方法是什么。我不想忽视这些角色。

抱歉我的英语很蹩脚。我每天都说中文/日文，并使用中日韩字符。 Ceron几乎解决了这个问题，所以我不会讲如何使用encode()/decode() again.

当我们使用str()要转换任何 unicode 对象，它会将 unicode 字符串编码为字节数据；当我们使用unicode()铸造str对象，它将字节数据解码为 unicode 字符。

并且，编码必须是从返回的sys.getdefaultencoding().

在默认情况下，sys.getdefaultencoding()默认返回 'ascii'，执行时可能会抛出编码/解码异常str()/unicode()铸件。

如果你想通过以下方式进行 str unicode 转换str() or unicode()，并且使用“utf-8”进行隐式编码/解码，可以执行以下语句：

import sys    # sys.setdefaultencoding is cancelled by site.py
reload(sys)    # to re-enable sys.setdefaultencoding()
sys.setdefaultencoding('utf-8')

这将导致稍后执行str() and unicode()使用 utf-8 编码转换任何基本字符串对象。

但是，我更愿意使用encode()/decode()明确地，因为它使我的代码维护更容易。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

UTF8

将 Unicode 转换为 python [重复] 的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
如何将 GAE 中一种 Kind 中的所有实体复制到另一种 Kind 中，而无需显式调用每个属性

我们如何使用function clone entity 如中所述在 Python 中复制 Google App Engine 数据存储中的实体而无需在编译时知道属性名称 https stackoverflow com question
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv

随机推荐

setTimeout 如何防止潜在的堆栈溢出

一个例子 var list readHugeList var nextListItem function var item list pop if item setTimeout nextListItem 0 this line 如何使用s
将 SHA1 转换为正常形式

我有一个数据库其中每个密码都是通过 SHA1 传递的有时我想去用户仪表板看看感觉如何有没有办法我可以将 SHA1 转换为正常形式以用于测试目的谢谢如果正常形式的意思是我可以检索创建给定哈希的字符串那么答案是否定的它应
mkdir() 未将 chmod 设置为 0777

为什么 mkdir 不将 CHMOD 设置为0777 mkdir var www test 0777 创建目录后 CHMOD 设置为0755 来自 php net bool mkdir string pathname int mode 07
为什么根据我的 numpy 数组的类型是 int64 还是 uint8，按元素加法/减法的输出会有所不同？

我正在进行图像比较并计算差异并且注意到仅当我使用 dtype int64 而不是 dtype uint8 作为 numpy 数组读取数据时逐元素减法似乎才起作用出于图像可视化的原因我想切换到 unit8 image1 np arr
将输出写入 Azure Functions 中的 Blob

我正在学习使用 Azure 函数所以我可能听起来很愚蠢我正在编写一个计时器触发函数该函数每 1 分钟运行一次添加两个数字并写入文件这工作正常因为我可以将输出写入本地服务器上的文件第二步我想将输出写入 blob 下面是代码
如何使用 Swift Playground 打印到控制台？

我一直在关注他们的新语言 swift 的 Apple Guide 但我不明白为什么右侧的栏只显示 Hello playground 而不是 Hello world 有人可以解释为什么println不是打印在右边吗 Playground no
在sqlite中获取日期差异

我想获得今天和到期日之间的日期差异这是我实现的代码但这并没有返回正确的输出 public String getDaysList Cursor cursor db query COUPON null null null null null
理解 python id() 的唯一性

Python 文档id 功能陈述如下这是一个保证唯一且恒定的整数该对象在其生命周期内两个不重叠的对象一生可能有相同的id value CPython实现细节这是内存中对象的地址虽然下面的代码片段表明id的重复由于我没有明确d
iPhone 的 CSS 媒体查询

我有一个网站该网站将使用媒体查询在桌面和 iPhone 上显示以提供不同的样式表因此例如始终加载reset css 但如果在桌面上也加载desktop css 但如果在iPhone上或者如果用户调整浏览器窗口的大小改为加载 ipho
IE8 中 AJAX 的意外缓存结果

我在 Internet Explorer 缓存 JQuery Ajax 请求结果时遇到严重问题我的网页上有标题每次用户导航到新页面时该标题都会更新页面加载后我会这样做 get game getpuzzleinfo null funct
从 ADUser DistinguishedName 获取 CN 值

我有一个 PS 脚本用于检查 Active Directory 中某些自定义用户的属性属性之一是经理 data Get ADUser user Properties Select Object DisplayName LockedOu
collections.sort方法仅用于List类型的集合吗？

朋友们我是 Java Collection 的新手我想问一下Collections sort 方法仅用于由集合使用List类型我无法对以下代码进行排序 Collection collection new HashSet collec
Cosmos DB 查询 - 当某个属性不存在于所有文档中时使用 ORDER BY

我们在为 Cosmos Document DB 编写查询时遇到问题我们想要创建一个新的文档属性并在 ORDER BY 子句中使用它例如如果我们有一组文档例如 Name Geoff Company Acme Name Bob Comp
为什么字体较小时高度会增加？

我有一个具有一定行高的块我在其中插入内容 before伪元素 block before content text here 这效果很好但是如果我也给内容设置较小的字体大小 block before font size 6em cont
为什么main在没有变量的情况下初始化堆栈帧

为什么这段代码 include stdio h int main void puts Hello World 决定初始化堆栈帧这是汇编代码 LC0 string Hello World main push rbp mov rbp rsp
core-plot 从轴标签中删除小数点

有人可以告诉我如何从轴标签中删除小数点吗我希望只显示 10 个而不是 10 0 CPTXYAxis x axisSet xAxis NSNumberFormatter Xformatter NSNumberFormatter alloc
单个列表到字典

我有这个清单 single key1 value1 key2 value2 key3 value3 由此创建字典的最佳方法是什么 Thanks gt gt gt single key1 value1 key2 value2 key3 val
Android-列表视图、服务媒体播放器和布尔标志

我目前有一个listview当您单击某个项目时它会运行service with a mediaplayer 如果我点击另一个项目listview the service正在运行的应该停止并运行新的service 我正在使用一个boolea
set -e 在 bash 脚本中意味着什么？

我正在研究这个内容preinst在从 Debian 存档 deb 文件中解压该包之前脚本执行的文件该脚本有以下代码 bin bash set e Automatically added by dh installinit if 1 ins
将 Unicode 转换为 python [重复]

这个问题在这里已经有答案了可能的重复将 Unicode 转换为 UTF 8 Python 我是一个非常新的 Python 程序员正在编写我的第一个脚本该脚本从 plist 字符串中提取文本然后对其执行一些操作然后将其打包为 HT

将 Unicode 转换为 python [重复]

将 Unicode 转换为 python [重复] 的相关文章

随机推荐

热门标签