UnicodeDecodeError：无效的起始字节

2024-02-04

我有一个关于 UnicodeDecodeError:invalid start byte 的快速问题。我认为我的文本中的某个地方有非 UTF-8 字符，但错误消息的位置是读取文件的起点，所以我不知道如何修复它。

如果您有任何建议，请告诉我

以下是我从 python 返回的错误消息。

for line in fi:
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/codecs.py", line 313, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 3131: invalid start byte

以下是我的代码：

for filename in os.listdir(readDir):
    filename = os.path.join(readDir, filename)
    for keyword in keywords:
        outFileName = os.path.join(sortDir, keyword)
        outFileName = outFileName+'.csv'

        with open(filename, 'r') as fi, open(outFileName, "a") as fo:
            for line in fi:

我遇到了同样的问题，经过一段时间的搜索后我做了什么

import sys

#Set default encoder 
sys.setdefaultencoding("ISO-8859-1")

#Then convert string to UTF-8
yourString.encode('utf-8').strip()

我希望它对某人有用

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

Unicode

UnicodeDecodeError：无效的起始字节的相关文章

Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
如何将交互式 matplotlib 图形插入 tkinter 画布

我正在尝试将交互式 matplotlib 图形具有滑块重置按钮和单选按钮的图形放入 tkinter Canvas 中我已成功添加非交互式图表但当它变为交互式时找不到问题我尝试将所有内容更改为使用 matplotlib Figur
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

Flutter BottomNavigationBar 不适用于三个以上的项目

我有一个问题底部导航栏在颤振中 0 6 一旦我添加超过三个 BottomNavigationBarItem小时候栏中的按钮有白色图标而且它们很乱当我只使用三个或更少的物品时一切都很好这是我使用的小部件代码它打破了标准 botto
iOS 转换十六进制值

如何将十六进制值转换为表情符号图标我有一个如下所示的字符串 NSString myVal 1F61E 我如何转换此文本以将其显示为表情符号字符我发现了这个价值从这个链接 http www alanwood net unicode emo
为什么 Snowsql 不打开外部浏览器？

我想得到snowsql在我的计算机上本地工作但我无法登录我的数据库因为它要求我使用我的 google 帐户进行 SSO 身份验证文档说使用 authenticator externalbrowser选项哪个should打开本地浏览器并
服务器上的AJAX成功功能

这适用于我的开发机器但不适用于生产服务器我正在尝试使用 ajax 更新一些 div 但它们没有更新尽管其他部分工作正常我在服务器上使用 IIS 6 当我使用 firebug 在服务器端调试此代码时它不会命中我添加到 success
R igraph，如何使用形状和光栅的混合来绘制顶点？

我正在尝试使用 R 和 igraph 绘制图形混合使用形状和光栅图像作为顶点我修改了下面的 igraph 示例来重现我的问题有人能看出出了什么问题吗您需要一个 png 文件来测试脚本 library png library igra
修改跳过空列表并继续执行功能

背景以下代码稍作修改跳过空列表并继续执行函数 https stackoverflow com questions 57236878 skipping empty list and continuing with function impo
如何使用 ASP.NET Core v2 在 Visual Studio 2017 中安装 font-awesome

我正在使用 ASP NET Core v2 构建一个网页并且想使用 font awesome 首先我要说的是我已经尝试了几件事比如从 NPM 安装 Bower 从 NPM 安装 font awesome 从 VS 中的 Bower 包安
如何将数据集写入Kafka主题？

我正在使用 Spark 2 1 0 和 Kafka 0 9 0 我正在尝试将批处理 Spark 作业的输出推送到 kafka 该作业应该每小时运行一次但不是流式运行在网上寻找答案时我只能找到 kafka 与 Spark 流的集成而没
如何抑制“SpriteKit 纹理图集生成器警告”？

Xcode 报告以下警告 SpriteKit 纹理图集生成器警告由于输入纹理尺寸而将 images atlas 拆分为 2 个纹理图集虽然我将来会修改我的图像以避免 SpriteKit 生成此警告但我想使用一些 pragma 指令暂时抑
点击事件中的全日历错误时间

我正在使用角度和全日历我有令人惊讶的时区问题而且我似乎无法解决问题如果在周视图中我点击 08 00 我打开一个模式并显示时间我会看到 09 00 timezone Europe Brussels ignoreTimezone f
枕头调整像素图像大小 - Django/Pillow

我正在 Django 中开发一个图像上传器图像上传并保存到磁盘后我正在尝试调整保存的图像的大小同时保持其纵横比我正在使用 Pillow 进行图像处理调整大小当我尝试调整图像大小时出现问题即使调整大小的图像的长宽比与原始图像的长
使用 PHP 和 jQuery 生成并下载 .csv 文件

我想生成一个 csv 文件然后使用 AJAX 下载它在现场 csv php 我有这个代码
错误错误：未捕获（承诺）：QuotaExceededError Ionic 3

我正在使用 ionic 3 创建一个应用程序我正在 ionic 存储中保存一个字符串我工作得很好但突然出现这个错误 Home ts 这是我设置字符串的地方 this storage set 123 JSON stringify dat
如何跳过 x 轴上的标签？

我已经尝试了很长一段时间来弄清楚如何跳过该图表 x 轴上的标签例如显示每第三个或第四个标签我尝试将 autoSkip 和 stepSize 添加到刻度配置中但没有任何变化有没有一种简单的方法可以做到这一点 Edit visitor
如何使用 JavaScript 检测我的浏览器版本和操作系统？

我尝试使用下面的代码但它只在 Chrome 和 Mozilla 中显示结果在 IE6 中不起作用 div div
matplotlib 轴标签出现奇怪错误

我对 Python 和一般编程都很陌生所以如果我遗漏了一些明显的东西请提前道歉我正在尝试绘制图表并标记轴但每次尝试标记 y 轴时都会引发异常我在新脚本中编写了下面的代码以确保问题不是来自模块中的其他地方我正在使用Python
未知目录的重写规则

所以我试图获取 mod rewrite 规则来将请求重定向到带有 htaccess 文件的 php 脚本问题是我希望它能够工作无论我将项目放在网络服务器上的哪个位置 htaccess 文件和 php 脚本始终位于同一文件夹中重写本身
读取 XMLStreamReader 时出错。获取故障响应

我开发了一个应用程序用户应该填写申请表并在最后付款要付款用户应在下面给出的链接中填写详细信息 Payment https k2 karnataka gov in wps portal Khajane II Scope Remittan
在 Ubuntu 上安装 Python3 的 mod_wsgi

谁能给我一套在 Ubuntu for Python 3 上安装 mod wsgi 的清晰说明我确实使用 Python3 成功获得了 Flask 和 mod wsgi 并且短暂地感到高兴直到我查看 Apache 的日志并意识到我遇到了这个
UnicodeDecodeError：无效的起始字节

我有一个关于 UnicodeDecodeError invalid start byte 的快速问题我认为我的文本中的某个地方有非 UTF 8 字符但错误消息的位置是读取文件的起点所以我不知道如何修复它如果您有任何建议请告诉我以

UnicodeDecodeError：无效的起始字节

UnicodeDecodeError：无效的起始字节 的相关文章

随机推荐

热门标签

UnicodeDecodeError：无效的起始字节的相关文章