CUDA SASS 到 Cubin

2023-12-05

通过 CuObjDump 可以使用 Cubin 文件生成 SASScuobjdump -sass <input file>,但是有什么办法可以将SASS转换回Cubin吗?


官方 NVIDIA CUDA 工具链中不提供任何“汇编程序”。 NVIDIA 工具链可以采用 CUDA C/C++ 或 PTX,并将其转换为 cubin 或其他可执行格式。

然而,有一些社区开发的汇编器:

也许目前最新的一个(可能是目前唯一值得考虑的一个)是maxas.

还有一个更老的asfermi在费米一代 CUDA GPU 中开发。我认为它没有被更新或维护。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA SASS 到 Cubin 的相关文章

  • Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

    我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
  • 在 __device/global__ CUDA 内核中动态分配内存

    根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页 可
  • CUDA 矩阵加法时序,按行与按行比较按栏目

    我目前正在学习 CUDA 并正在做一些练习 其中之一是实现以 3 种不同方式添加矩阵的内核 每个元素 1 个线程 每行 1 个线程和每列 1 个线程 矩阵是方阵 并被实现为一维向量 我只需用以下命令对其进行索引 A N row col 直觉
  • CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

    与 CUDA 的任何事情一样 最基本的事情有时也是最难的 所以 我只想将变量从 CPU 复制到 GPUconstant变量 我很难过 这就是我所拥有的 constant int contadorlinhasx d int main int
  • 如何使用 CUDA/Thrust 对两个数组/向量根据其中一个数组中的值进行排序

    这是一个关于编程的概念问题 总而言之 我有两个数组 向量 我需要对一个数组 向量进行排序 并将更改传播到另一个数组 向量中 这样 如果我对 arrayOne 进行排序 则对于排序中的每个交换 arrayTwo 也会发生同样的情况 现在 我知
  • 如何为 CUDA 内核选择网格和块尺寸?

    这是一个关于如何确定CUDA网格 块和线程大小的问题 这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段 见下文 我
  • VS 程序在调试模式下崩溃,但在发布模式下不崩溃?

    我正在 VS 2012 中运行以下程序来尝试 Thrust 函数查找 include cuda runtime h include device launch parameters h include
  • 将 nvidia 运行时添加到 docker 运行时

    我正在运行虚拟机GCP配备特斯拉 GPU 并尝试部署一个PyTorch基于应用程序使用 GPU 加速 我想让 docker 使用这个 GPU 可以从容器访问它 我设法在主机上安装了所有驱动程序 并且该应用程序在那里运行良好 但是当我尝试在
  • 通过 cuFFT 进行逆 FFT 缩放

    每当我使用 cuFFT 绘制程序获得的值并将结果与 Matlab 的结果进行比较时 我都会得到相同形状的图形 并且最大值和最小值位于相同的点 然而 cuFFT 得到的值比 Matlab 得到的值大得多 Matlab代码是 fs 1000 s
  • 大型跨平台软件项目的技巧/资源

    我将开始一个大型软件项目 涉及跨平台 GUI 和大量的数字运算 我计划用 C 和 CUDA 编写大部分应用程序后端 并用 Qt4 编写 GUI 我计划使用 Make 作为我的构建系统 这将是一个只有两名开发人员的项目 一旦我相对深入地了解它
  • CUDA 模型 - 什么是扭曲尺寸?

    最大工作组大小和扭曲大小之间有什么关系 假设我的设备有 240 个 CUDA 流处理器 SP 并返回以下信息 CL DEVICE MAX COMPUTE UNITS 30 CL DEVICE MAX WORK ITEM SIZES 512
  • 使用 cudamalloc()。为什么是双指针?

    我目前正在浏览有关的教程示例http code google com p stanford cs193g sp2010 http code google com p stanford cs193g sp2010 学习CUDA 演示的代码 g
  • 直接在主机上访问设备向量元素的最快方法

    我请您参考以下页面http code google com p thrust wiki QuickStartGuide Vectors http code google com p thrust wiki QuickStartGuide V
  • 对 CUDA 操作进行计时

    我需要计算 CUDA 内核执行的时间 最佳实践指南说我们可以使用事件或标准计时函数 例如clock 在Windows中 我的问题是使用这两个函数给出了完全不同的结果 事实上 与实践中的实际速度相比 事件给出的结果似乎是巨大的 我实际上需要这
  • 布尔实现的atomicCAS

    我想弄清楚是否存在错误答案 https stackoverflow com a 57444538 11248508 现已删除 关于Cuda like的实现atomicCAS for bool是 答案中的代码 重新格式化 static inl
  • CUDA 代码会损坏 GPU 吗?

    在测试包含内存错误的 CUDA 时 我的屏幕被冻结了 重新启动后我无法再检测到显卡 我的代码是否有可能物理损坏该卡 这发生在 Ubuntu 14 04 下 我不知道该卡的型号 因为我无法检测到它 但我记得它是一张相当新的卡 感谢所有的评论我
  • 一维纹理内存访问比一维全局内存访问更快吗?

    我正在测量标准纹理和 1Dtexture 内存访问之间的差异 为此 我创建了两个内核 global void texture1D float doarray int size int index calculate each thread
  • CUDA 中的 JPEG 库

    我正在尝试在 CUDA 中压缩和解压缩图像 到目前为止我已经找到了这个库 http sourceforge net projects cuj2k source navbar http sourceforge net projects cuj
  • 如何从尖点库矩阵格式获取原始指针

    我需要从尖点库矩阵格式获取原始指针 例如 cusp coo matrix
  • CUDA cutil.h 在哪里?

    有谁知道包含 cutil h 的 SDK 工具包在哪里 我尝试了 CUDA toolkits3 2 和 toolkits5 0 我知道这个版本已经不支持 cutil h 我还注意到一些提到的如何在 Linux 中包含 cutil h htt

随机推荐

  • jQuery 插件:添加回调功能

    我正在尝试提供我的插件回调功能 并且我希望它以某种传统的方式运行 myPlugin options function code to execute or myPlugin options anotherFunction 如何在代码中处理该
  • 从 Android 中的 TelephonyManager 检索 Line1 号码

    TelephonyManager manager1 TelephonyManager getSystemService Context TELEPHONY SERVICE String strMobile1 manager1 getLine
  • 如何在 com 自动化中启动特定的 excel 版本?

    我通过 COM 自动化 在 c 中 使用 Excel 但问题似乎无法控制在盒子上启动哪个版本的 excel 我们同时使用 Excel 9 和 Excel 11 并且一组特定的电子表格需要 excel 9 否则它们不会工作的 我包含了 exc
  • 在 CMakeLIsts.txt 中只编写 target_link_libraries(不指定包含路径)

    我发现当我使用target link libraries在 CMaksList txt 中 我忽略包含路径 target include directories 并成功运行应用程序 例如 cmake minimum required VER
  • 自动删除 Subversion 未版本控制的文件

    有谁知道一种方法来递归删除工作副本中不受版本控制的所有文件 我需要这个才能在自动构建 VMware 中获得更可靠的结果 这在 bash 中对我有用 svn status egrep cut c8 xargs rm 塞斯 雷诺的更好 svn
  • Admob 碎片

    我使用 appcompact 创建了一个空项目 并尝试向其中添加 AdMob 块 片段 main xml
  • 如何从 Sinatra 中的 URL 检测语言

    我有一个多语言网站 我将语言放入 URL 中 例如domain com en 当用户没有将语言放入 URL 中时 我想将他重定向到主要语言的页面 例如 domain com posts 到 domain com en posts 有没有简单
  • 使用 MVVM 在 wpf 中进行对话框的做法是好是坏?

    我最近遇到了为我的 wpf 应用程序创建添加和编辑对话框的问题 我想要在我的代码中做的就是这样的事情 我主要使用视图模型优先方法和 mvvm ViewModel 调用对话框窗口 var result this uiDialogService
  • 警报无法唤醒我的服务

    我有以下代码 我希望无论电话状态如何 此警报都会调用我的服务 即使它处于睡眠模式 我也需要它来访问互联网并进行一些网络调用 为什么手机处于睡眠模式时不起作用 报警管理器 Calendar cal Calendar getInstance c
  • R 聚合错误:“替换有 行,数据有

    我正在尝试聚合数据框 但收到一个我不明白的错误 我有一个名为 M15 的数据框 它包含 33 个变量的 200k 条记录 我无法使用可以与社区共享的数据重现此错误 M15 lt M15backup c 600 700 setting the
  • 添加 Visual Studio 2015 的先决条件

    I want to add new prerequisites to visual studio 2015 but can not find out the solution 如您所见 Visual Studio 2015 缺少先决条件 V
  • swiftui、动画应用于父效果子动画(下)

    上一个问题 swiftui 动画应用于父效果子动画 现在 TextView 有了自己的状态 RectangleView 和 TextView 在 3 秒内滑入屏幕 但 TextView 滑动一秒后状态发生变化 现在可以看到TextView停
  • javafx Bindings.createStringBinding 但绑定实际上不起作用

    我正在尝试绑定textProperty of the Label到对象的SimpleIntegerProperty在 的帮助下Bindings但当我更改时它不会更改文本SimpleIntegerProperty实时显示对象的信息 任何有关如
  • SQL使用unix时间戳计算一个月内的记录

    我试图返回每个月内的记录数 并按月 年对结果进行分组 架构看起来像这样 id title timestamp 我一直在四处寻找 但无法得到我期望的结果 谢谢 设置时间戳的格式 然后按其分组 按月分组 SELECT DATE FORMAT t
  • 保护 Android 应用程序敏感数据的最佳方法?

    是的 这是一个非常普遍的问题 但我试图了解处理与将敏感数据分发到应用程序的网络服务器相关的应用程序的最佳方法 任何链接 一般信息建议等 将不胜感激 由于应用程序会在一定时间内存储从数据库检索到的持久数据 一切都变得有些敏感 在设备上存储敏感
  • 使用 R:创建一个新列,计算“n”个其他列中“n”个条件发生的次数

    我有第 1 列和第 2 列 ID 和值 接下来 我想要一个计数列 列出每个 id 出现相同值的次数 如果发生多次 显然会重复该值 该数据集中还有其他变量 但新的计数变量只需以其中 2 个为条件 我已经浏览了这个博客 但我找不到一种方法使新变
  • 无法将整数从 javascript 传递到 npapi 插件

    我正在编写一个简单的napapi插件 我必须在html页面中打印从javascript函数传递的值 但我在做的时候遇到了问题 它在火狐浏览器上运行正常 但我想在 qt fancybrowser 示例上执行此操作 无论我在 javascrip
  • 将 for 循环的输出保存在单独的数据帧中

    我有一个简单的问题 尽管有很多类似的帖子 但我一直无法解决 因为我在 R 方面有点笨蛋 而且我没有得到我应该得到的任何东西 我有两组文件 All Files lt objects pattern constant country 0 9 4
  • 在 Node.js 中加载基本 HTML

    我正在尝试找出如何加载和渲染基本的 HTML 文件 这样我就不必编写如下代码 response write p blahblahblah p 我刚刚发现one方式使用FS库 我不确定它是否是最干净的 var http require htt
  • CUDA SASS 到 Cubin

    通过 CuObjDump 可以使用 Cubin 文件生成 SASScuobjdump sass