“for line in...”导致 UnicodeDecodeError: 'utf-8' 编解码器无法解码字节

2024-01-07

这是我的代码,

for line in open('u.item'):
# Read each line

每当我运行此代码时,都会出现以下错误:

UnicodeDecodeError:“utf-8”编解码器无法解码位置 2892 中的字节 0xe9:无效的连续字节

我尝试解决这个问题并在 open() 中添加一个额外的参数。代码如下:

for line in open('u.item', encoding='utf-8'):
# Read each line

但它再次给出了同样的错误。那我该怎么办?


As 由马克·兰塞姆建议 https://stackoverflow.com/questions/19699367/for-line-in-results-in-unicodedecodeerror-utf-8-codec-cant-decode-byte/19699399#19699399,我找到了解决该问题的正确编码。编码是"ISO-8859-1" https://en.wikipedia.org/wiki/ISO/IEC_8859-1,所以替换open("u.item", encoding="utf-8") with open('u.item', encoding = "ISO-8859-1")将解决问题。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

“for line in...”导致 UnicodeDecodeError: 'utf-8' 编解码器无法解码字节 的相关文章

随机推荐