【python+pytorh自然语言处理】AttributeError: 'Example' object has no attribute 'label'错误提示

2023-05-16

基于nlp自然语言预测模型

  • 在建模训练过程中遇到如下问题,供大家学习,借鉴
    • 如下问题
    • 1. **数据集字符编码问题** ,`'utf-8' codec can't decode byte 0xb1 in position 2: invalid start byte 错误处理`.
    • 2. 建模过程中遇到 `AttributeError: 'Example' object has no attribute 'label'错误提示`;
    • 字符编码问题解决方案:
      • 这样再次运行,正确执行,无编码格式报错问题
    • 处理 `AttributeError: 'Example' object has no attribute 'label`错误问题

在建模训练过程中遇到如下问题,供大家学习,借鉴

1.数据集字符编码问题 ,'utf-8' codec can't decode byte 0xb1 in position 2: invalid start byte 错误处理.

2.AttributeError: 'Example' object has no attribute 'label'错误提示

如下问题

1. 数据集字符编码问题'utf-8' codec can't decode byte 0xb1 in position 2: invalid start byte 错误处理.

2. 建模过程中遇到 AttributeError: 'Example' object has no attribute 'label'错误提示

字符编码问题解决方案:

运行提示错误:字符不能正确读取
在这里插入图片描述
具体方法如下,重新读取数据集,修改数据集编码方式,更改以为utf8:

在这里插入图片描述
具体代码如下

def check_utf8():
    # python3
    path = 'd:/data/train10400.csv'
    up_path = 'd:/data/10400_urf8.csv'
    f = open(path, "r")  #读取数据集
    fw = open(up_path, "wb")  # 二进制格式写入文件
    i = 0
    while True:
        i += 1
        line = f.readline()
        if not line:
            break
        else:
            try:
                fw.write(line.encode(encoding='utf-8'))#编码设置utf-8
            except:
                # print(i)
                print(str(line))

这样再次运行,正确执行,无编码格式报错问题

处理 AttributeError: 'Example' object has no attribute 'label错误问题

错误原因,是因为数据格式问题导致
在这里插入图片描述
如何解决训练模型过程中数据集错误问题

  1. 预处理数据,代码效验
  2. 对数据进行,模型检测

我们通过debug模型,查找出问题数据
在这里插入图片描述
在数据集定位当前数据,明显发现23行与其他数据集格式不相匹配
在这里插入图片描述

**修改23行格式错误数据**

在这里插入图片描述

**重新运行项目,查看结果**

在这里插入图片描述
成功解决报错问题

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【python+pytorh自然语言处理】AttributeError: 'Example' object has no attribute 'label'错误提示 的相关文章

  • 熊猫按 n 最大总和分组

    我正在尝试使用groupby nlargest and sum在 Pandas 中一起运行 但在运行时遇到困难 State County Population Alabama a 100 Alabama b 50 Alabama c 40
  • Vimeo API:获取下载所有视频文件的链接列表

    再会 我正在尝试从 Vimeo 帐户获取所有视频文件的列表 直接下载的链接 有没有办法在 1 GET 请求中做到这一点 好的 如果是API限制的话 就100倍 我有硬编码脚本 我在其中发出 12 个 GET 请求 1100 多个视频 根据文
  • 在函数内的 for 循环上使用 tqdm 来检查进度

    我正在使用 for 循环迭代目录树内的一大组文件 这样做时 我想通过控制台中的进度条来监视进度 因此 我决定使用 tqdm 来实现此目的 目前 我的代码如下所示 for dirPath subdirList fileList in tqdm
  • 如何同时运行多个功能[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有以下代码 my func1 my func2 my func3 my func4 my func5 是否可以同时计算函数的数据 而
  • 使用管理员权限打开cmd(Windows 10)

    我有自己的 python 脚本来管理我的计算机上的 IP 地址 它主要在命令行 Windows 10 中执行netsh命令 您必须具有管理员权限 这是我自己的计算机 我是管理员 运行脚本时我已经使用管理员类型的用户 Adrian 登录 我无
  • 如何通过 python 中的函数运行列表?

    我试图通过我创建的函数运行我的列表 但不断收到错误 我不知道出了什么问题 温度 F temp f 19 21 21 21 23 功能 def fahrToCelsius tempFahrenheit return tempFahrenhei
  • 将整数系列转换为交替(双元)二进制系列

    我不知道如何最好地表达这个问题 因为在这里谷歌搜索和搜索总是让我找到更复杂的东西 我很确定这是基本的东西 但对于我的生活来说 我找不到一个好的方法来做到这一点下列 给定一个整数序列 比如说 for x in range 0 36 我想将这些
  • 使用 Pandas 从 csv 文件读取标题信息

    我有一个包含 14 行标题的数据文件 在标头中 有经纬度坐标和时间的元数据 我目前正在使用 pandas read csv filename delimiter header 14 读取文件 但这只是获取数据 我似乎无法获取元数据 有人知道
  • 会话数据库表清理

    该表是否需要清除或者由 Django 自动处理 Django 不提供自动清除功能 然而 有一个方便的命令可以帮助您手动完成此操作 Django 文档 清除会话存储 https docs djangoproject com en dev to
  • 获取 Keras model.summary() 作为表

    我在 Keras 中创建了相当大的模型 我正在用 LaTeX 写一篇关于它的文章 为了很好地描述 LaTeX 中的 keras 模型 我想用它创建一个 LaTeX 表 我可以手动实现它 但我想知道是否有任何 更好 的方法来实现这一点 我四处
  • 如何从 python 脚本执行 7zip 命令

    我试图了解如何使用 os system 模块来执行 7zip 命令 现在我不想用 Popen 或 subprocess 让事情变得复杂 我已经安装了 7zip 并将 7zip exe 复制到我的用户文件夹中 我只想提取我的测试文件 inst
  • Python 在哪些系统上不使用 IEEE-754 双精度浮点数

    Python 对 IEEE 754 浮点运算进行了各种引用 但不保证1 https docs python org 3 tutorial floatingpoint html 2 https pythondev readthedocs io
  • 在 django 中导入设置时出现奇怪的错误

    我有很多项目在 ubuntu 中使用 python2 7 和 virtualenv virtualenvwrapper 工作 在我的工作中 一些开发人员使用 macosx 和 windows 通常我像往常一样创建项目 django admi
  • 哪种方式最适合Python工厂注册?

    这是一个关于这些方法中哪一种被认为是最有效的问题 Pythonic 我不是在寻找个人意见 而是在寻找惯用的观点 我的背景不是Python 所以这会对我有帮助 我正在开发一个可扩展的 Python 3 项目 这个想法类似于工厂模式 只不过它是
  • Python:导入模块一次然后与多个文件共享

    我有如下文件 file1 py file2 py file3 py 假设这三个都使用 lib7 py lib8 py lib9 py 目前 这三个文件中的每一个都有以下行 import lib7 import lib8 import lib
  • 在Python中使用pil读取tif图像时出现值错误?

    我必须读取尺寸的tif图像2200 2200并输入 uint16 我将 PIL 库与 anaconda python 一起使用 如下所示 from PIL import Image img Image open test tif img i
  • 根据标点符号列表替换数据框中的标点符号[重复]

    这个问题在这里已经有答案了 使用 Canopy 和 Pandas 我有数据框 a 其定义如下 a pd read csv text txt df pd DataFrame a df columns test test txt 是一个单列文件
  • 类返回语句不打印任何输出

    我正在学习课程 但遇到了问题return语句 它是语句吗 我希望如此 程序什么也没有打印出来 它只是结束而不做任何事情 class className def createName self name self name name def
  • 用 pandas DataFrame 替换 mysql 数据库表中的行

    Python 版本 2 7 6 熊猫版本 0 17 1 MySQLdb 版本 1 2 5 在我的数据库中 PRODUCT 我有一张桌子 XML FEED 表 XML FEED 很大 数百万条记录 我有一个 pandas DataFrame
  • PyQt5按钮lambda变量变成布尔值[重复]

    这个问题在这里已经有答案了 当我运行下面的代码时 它显示如下 为什么 x 不是 x 而是变成布尔值 这种情况仅发生在传递到用 lambda 调用的函数中的第一个参数上 错误的 y home me model some file from P

随机推荐