运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

2024-04-03

我正在训练最新版本的layoutLMv3模型，但在开始训练时trainer.train()出现以下错误。请帮我解决它。我使用的是 v100 4 GPU：

RuntimeError                              Traceback (most recent call last)
/tmp/ipykernel_3844/4032920361.py in <module>
----> 1 trainer.train()

/data/anaconda3/envs/data/lib/python3.7/site-packages/transformers/trainer.py in train(self, resume_from_checkpoint, trial, ignore_keys_for_eval, **kwargs)
   1417             resume_from_checkpoint=resume_from_checkpoint,
   1418             trial=trial,
-> 1419             ignore_keys_for_eval=ignore_keys_for_eval,
   1420         )
   1421 

/data/anaconda3/envs/data/lib/python3.7/site-packages/transformers/trainer.py in _inner_training_loop(self, batch_size, args, resume_from_checkpoint, trial, ignore_keys_for_eval)
   1655                         tr_loss_step = self.training_step(model, inputs)
   1656                 else:
-> 1657                     tr_loss_step = self.training_step(model, inputs)
   1658 
   1659                 if (

/data/anaconda3/envs/data/lib/python3.7/site-packages/transformers/trainer.py in training_step(self, model, inputs)
   2348 
   2349         with self.compute_loss_context_manager():
-> 2350             loss = self.compute_loss(model, inputs)
   2351 
   2352         if self.args.n_gpu > 1:
...
    visual_bbox = visual_bbox.to(device).type(dtype)
RuntimeError: CUDA error: device-side assert triggered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Algorithm

NLP

Pytorch

huggingfacetransformers

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时的相关文章

Python - 定义常量列表或字典的最佳/最简洁的方法

第一次使用堆栈溢出我很高兴来到这里简介我最近开始了 Python 编程世界的神奇冒险我喜欢它现在在我从 C 语言的尴尬过渡中一切都进展顺利但我在创建与标头文件 h 同义的内容时遇到了麻烦问题我有中等大小的字典和列表大约
pandas python 根据一个或多个其他列的子集更新 A 列的子集

Edit我修改了下面的部分描述以澄清功能和组的含义修复拼写错误并包含我尝试过的其他代码我的熊猫df有 450 万行和 23 列下表显示了几行df2这是从生成的df 它显示了两组 eeskin and hduquant 和三
AttributeError：模块“tensorflow.python.framework.ops”没有属性“RegisterShape”

我正在使用 TensorFlow 2 1 0 dev20191125 不幸的是我无法编译一个带有错误的简单示例 AttributeError 模块 tensorflow python framework ops 没有属性 Registe
Ubuntu Python shebang 线不工作

无法让 shebang 线在 Ubuntu 中为 python 脚本工作我每次只收到命令未找到错误 test py usr bin env python print Ran which python usr bin python 在 sh
我无法使用 Python 和 Facebook Marketing API 获取所有 Facebook 营销活动的统计信息

我正在尝试检索以下指标 date campaign name impressions clicks spend 在我的 Facebook 帐户中的所有活动中但显然我编写的脚本仅返回某些活动的统计数据而不是全部它仅返回大多数营销活动的营
Python3如何安装.ttf字体文件？

我想使用 python3 更精确的 Python 3 6 代码在 Windows 10 上安装 ttf 字体文件我用谷歌搜索但我发现的唯一的就是这个使用python在windows上安装TTF字体 https stackoverflow
不使用 graphviz/web 可视化决策树

由于某些限制我无法使用 graphviz webgraphviz com 可视化决策树工作网络与另一个世界是封闭的问题是否有一些替代实用程序或一些 Python 代码用于至少非常简单的可视化可能只是决策树的 ASCII 可视化 py
Python控制台默认十六进制显示

我在 Python 控制台中做了很多工作其中大部分都涉及地址我更喜欢以十六进制形式查看地址 So if a 0xBADF00D 当我简单地输入Python gt a进入控制台查看其值我更喜欢 python 回复0xBADF00D代替1
如何在 sqlalchemy 中创建基于文字的查询？

我创建了一个函数来创建表达式 def test operator1 operation operator2 return literal column operator1 op operation operator2 现在当我用 test
Pythoncom - 将相同的 COM 对象传递给多个线程

你好对于 COM 对象我是一个完全的初学者非常感谢任何帮助我正在开发一个Python程序该程序应该以客户端服务器的方式读取传入的MS Word文档即客户端发送一个请求一个或多个MS Word文档服务器使用pythoncom
使用 shell=True 将 PATH 设置为 bitbake 的“source”在 Python 中没有效果

下面是shell脚本中的代码 source proj common tools repo etc profile d repo sh repo project init branch repo project sync source pok
替换 pandas 数据框中的点

我有一个如图所示的数据框数字实际上是对象正在做df treasury rate pd to numeric df treasury rate 可预见的炸弹然而做df replace np nan 似乎没有摆脱这个点所以我很困惑有
python 和 android 中通过 AES 算法加密和解密

我有用于 AES 加密的 python 和 android 代码当我在android中加密文本时它在python上成功解密但无法在android端解密有人有想法吗 Python代码 import base64 import hash
如何在 scikit-learn 的 SVM 中使用非整数字符串标签？ Python

Scikit learn 具有相当用户友好的用于机器学习的 python 模块我正在尝试训练用于自然语言处理 NLP 的 SVM 标记器其中我的标签和输入数据是单词和注释例如词性标记而不是使用双精度整数数据作为输入元组 1 2
pip-tools 的干净设置不会编译非常基本的 pyproject.toml

使用全新的pip tools设置总是会导致Backend subprocess exited error pyproject toml project dependencies openpyxl gt 3 0 9 lt 4 在仅包含上述 p
wxPython：更新wx.ListBox列表

我在 python 程序中有一个 wx ListBox 我不想在 wx Timer 更新时更改其中的列表我的计时器正在工作我只是不知道如何更改它显示的列表这是一个例子 http www daniweb com code snippet
如何在 Python 中包含 PHP 脚本？

我有一个 PHP 脚本 news generator php 当我包含它时它会抓取一堆新闻项并打印它们现在我在我的网站 CGI 中使用 Python 当我使用 PHP 时我在新闻页面上使用了这样的内容为了简单起见我删掉了这个
如何使用 Python Pandas 制作 DataFrame 切片并在特定切片中“fillna”？

问题让我们从 Kaggle 获取泰坦尼克号数据集我有包含 Pclass 性别和年龄列的数据框我需要用特定组的中位数填充年龄列中的 NaN 如果是来自一等的女性我想用一等女性的中位数填写她的年龄而不是整个年龄列的中位数问
什么是“朴素”算法，什么是“封闭式”解决方案？

我有一些关于描述算法时使用的术语语义的问题首先朴素算法是什么意思这与给定问题的其他解决方案有何不同解决方案还可以采取哪些其他形式其次我听到很多人提到封闭式解决方案我也不知道这意味着什么但在尝试解决递归关系时经常会出现
从 xgb.train() 获取概率

我是 Python 和机器学习的新手我在网上搜索了我的问题并尝试了人们建议的解决方案但仍然没有得到它如果有人能帮助我我将非常感激我正在开发我的第一个 XGboost 模型我已经使用 xgb XGBClassifier 调整了参

随机推荐

Angular 项目结构最佳实践

这是我的 Angular 项目的目录结构 Angular 应用程序可以通过许多不同类型的组件而变得庞大组织 Angular 应用程序的最佳实践是什么 app layout home layout header menu content d
ui-路由器。从对象/函数获取状态名称

我想知道有什么方法可以用对象或函数引用视图中的状态吗只是为了将视图与状态定义分离例如如果我更改状态名称我不必在我的视图中的所有地方更改它可以在这里找到如下所述的一种解决方案作为一种可行的解决方案plunker http pln
java.lang.reflect.Array 在运行时创建新数组的代码是什么？

我查看了Java源代码方法如下 public static Object newInstance Class
查找 PostgreSQL 中时间戳之间的差异（以秒为单位）

我有一张桌子在PostgreSQL 8 3 with 2 timestamp列我想知道这些之间的区别timestamps很快你能帮我解决这个问题吗 TableA timestamp A timestamp timestamp B tim
如何从 AutoHotkey 数组中删除重复项？

我有一个array https autohotkey com docs misc Arrays htmAutoHotkey 中包含重复条目的字符串 nameArray Chris Joe Marcy Chris Elina Timothy
使用 TensorFlow 模型进行预测

我遵循了给定的 mnist 教程并且能够训练模型并评估其准确性但是教程没有展示如何根据模型进行预测我对准确性不感兴趣我只是想使用模型来预测新的示例并在输出中查看所有结果标签每个结果都有其分配的分数排序或未排序 In the
如何将 Qt QSqlDriver::subscribeToNotification 与 SQLite3 一起使用？

我正在编写一个 Qt 应用程序其中不同的模型可以插入删除更新同一个表当一个模型更改数据库时我希望其他模型能够收到更改通知以便他们可以相应地更新其视图看来在 SQLite 中监控插入删除和更新的最佳方法是使用QSqlDrive
如何在 Ionic 5 中从 url 下载文件而不使用 FileTransfer

我目前正在开发 Ionic 应用程序并停留在文件下载部分我看到很多帖子都说FileTransfercordova 库现已弃用取而代之的是 XHR 请求尽管我看到很多帖子说该库已被弃用但我找不到任何示例代码用于从 URL 下载文件
Android 中的 dumpsys cpuinfo：解释此命令的结果

我正在查看以下命令 adb shell dumpsys cpuinfo 我想知道这些报告的值是否是之前时间的平均值 D Android Dev Android sdk platform tools gt adb shell dumpsys
Latex verbatim：如何显示tree命令创建的文件目录？

我想插入使用逐字环境由树命令创建的文件目录图但在输出文档中仅保留文件名并且连接线消失 documentclass article usepackage fancyvrb begin document begin Verbatim ap
gcp - 从数据存储中获取所有实体

我正在尝试从数据存储中获取所有数据实体当我遇到谷歌文档时我发现了类似的内容查询投影链接到文档 https cloud google com datastore docs concepts queries 这是我用来从数据存储区获取所有
将 Unicode 连字符减号插入字符串会导致错误

我正在尝试将 unicode 连字符减号字符插入到文本字符串中我看到无效的通用字符错误内容如下 u 002D 连字符减号 textViewContent insertString u002D atIndex cursorPositi
遍历 List
如何循环遍历对象类型的列表 List countries new List countries Add new Name United States Abbr US Currency countries Add new Name Canad

isKindOfClass 行为

有人可以解释为什么 isKindOfClass 根据实例的创建方式返回不同的结果吗 interface BaseClass interface DerivedClassA BaseClass DerivedClassA instance D

SQL - OR 条件的顺序重要吗？

我必须选择符合的一行condition1 OR condition2 然而 condition1是优选的如果有两行第一行相交的位置condition1 并且不满足条件2 并且第二个满足condition2 并且不满足condition1

如何使 HTML
元素可跨浏览器编辑？

你知道如何制作一个 div 可以用 JavaScript 编辑吗我正在寻找跨浏览器的解决方案类似于富文本区域但使用可编辑的我需要类似的东西 div 我不想使用替换文本框我知道怎么做了您使用 DOMElement 的 conten

无法将对象转换为 JSON

早上好当我尝试通过虚拟设备注册或登录时出现此错误 E StorageHelpers Failed to turn object into JSON java lang NullPointerException Attempt to inv

使用 Apache POI 将列添加到 Excel

我想知道如何使用 apache poi 在 xlsx 文件中添加新列但我找不到任何东西有什么办法可以做到这一点吗或者是否有其他库可以解决这个问题提前致谢如果您的 Excel 文件包含已定义的现有行则添加列的最快方法是在行上迭代一

Unity3D本地尺度问题

下面的代码 Debug LogWarning updating scale fix scalefactor scaleFactor Current scale is cell transform localScale x cell tran

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
热门标签

PolarMask

Oral

论文开源项目合集

机器学习常用网址汇总

TFLearn

闲谈两句

130

ASP2

解算法题目例子

之间的详细对比

毫米波雷达

汇编评估堆栈

MSIL

高并发服务器实战

QCY

中为什么不能用

时序异常检测方法总结

下首次安装

进行目标追踪

部署加速

tensorrt8
Powered by Hwhale

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时 的相关文章

随机推荐

热门标签

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时的相关文章