CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？

2024-03-14

有人有过在工作站上编码时在服务器上调试 CUDA 代码的经验吗？

我的笔记本电脑 (Thinkpad T400) 不支持 CUDA，但我可以访问带有一对运行 Linux 的 NVIDIA GTX 295 卡的服务器。

我可以使用 NVidia 的 Visual Studio 工具在服务器上进行远程调试吗？

如果做不到这一点，我的笔记本电脑上还运行着一个 Ubuntu 虚拟机。 Linux下有没有可以在服务器上使用的调试器？

我真的不想再买一台带有双 NVidia 卡的笔记本电脑。

在远程 Linux 机器（比如你的服务器）上用 c 语言开发是很常见的。您可以从任何客户端（例如您的笔记本电脑）通过 ssh 连接到服务器来编译和运行代码，就像您坐在计算机前一样，并且可以使用gdb http://www.gnu.org/software/gdb/在终端中调试您的代码。您还可以使用ddd http://www.gnu.org/software/ddd/作为 gdb 或 Linux IDE 的图形前端，例如eclipse http://www.eclipse.org/linuxtools/通过 ssh 转发 X11。

您可以使用cuda-gdb http://developer.nvidia.com/content/cuda-gdb以完全相同的方式在终端中调试 CUDA 代码。不幸的是，目前还没有适用于 Linux 的 Visual Cuda 调试器。但是，看来您可以将 ddd 与 cuda-gdb 一起使用[source] http://forums.nvidia.com/index.php?showtopic=87996，因为你有两个 GPU。我不确定在 Eclipse 中使用 cuda-gdb http://forums.nvidia.com/index.php?showtopic=153283.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

remotedebugging

CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？的相关文章

使用 CUDA 进行逐元素向量乘法

我已经在 CUDA 中构建了一个基本内核来执行逐元素两个复向量的向量向量乘法内核代码插入如下 multiplyElementwise 它工作正常但由于我注意到其他看似简单的操作如缩放向量在 CUBLAS 或 CULA 等库中进行了
CUDA 矩阵加法时序，按行与按行比较按栏目

我目前正在学习 CUDA 并正在做一些练习其中之一是实现以 3 种不同方式添加矩阵的内核每个元素 1 个线程每行 1 个线程和每列 1 个线程矩阵是方阵并被实现为一维向量我只需用以下命令对其进行索引 A N row col 直觉
__device__ __constant__ 常量

有什么区别吗在 CUDA 程序中定义设备常量的最佳方法是什么在 C 主机设备程序中如果我想将常量定义在设备常量内存中我可以这样做 device constant float a 5 constant float a 5 问题 1
cudaMemcpy() 与 cudaMemcpyFromSymbol()

我试图找出原因cudaMemcpyFromSymbol 存在似乎 symbol func 可以做的所有事情 nonSymbol cmd 也可以做 symbol func 似乎可以轻松移动数组或索引的一部分但这也可以使用 nonSymbo
最小化 MC 模拟期间存储的 cuRAND 状态数量

我目前正在 CUDA 中编写蒙特卡罗模拟因此我需要生成lots使用随机数cuRAND图书馆每个线程处理一个巨大的元素floatarray 示例中省略并在每次内核调用时生成 1 或 2 个随机数通常的方法参见下面的示例似乎是为每
cuda-gdb 错误消息

我尝试使用 cuda gdb 调试我的 CUDA 应用程序但遇到了一些奇怪的错误我设置了选项 g G O0构建我的应用程序我可以在没有 cuda gdb 的情况下运行我的程序但没有得到正确的结果因此我决定使用 cuda gdb 但
cuda 文件组织的有效方式：.cpp .h .cu .cuh .curnel 文件

cuda最容易理解最高效的代码组织是什么经过一番调查后我发现 cuda 函数声明应位于 cuh 文件中实现位于 cu 文件中内核函数实现位于 curnel 文件中其他 C 内容通常在 cpp 和 h 文件中最近我发布了一个问题
PyInstaller 是否包含 CUDA

我正在开发一个Python脚本我使用Python 3 7 3 它使用tensorflow gpu 1 14 0 并使用PyInstaller 3 5将此脚本转换为可执行文件我使用的是 CUDA 10 0 和 cuDNN 7 6 1 我的
CUDA Thrust 的多 GPU 使用

我想使用我的两张显卡通过 CUDA Thrust 进行计算我有两张显卡在单卡上运行对于两张卡都适用即使我在 std vector 中存储两个 device vector 也是如此如果我同时使用两张卡循环中的第一个周期将起作用并且不
Bank 在字长方面存在冲突

我读过一些关于共享内存的好文章但我对银行冲突有初步疑问据说如果线程 1 和线程 2 从存储体 0 访问字 0 则不存在存储体冲突但如果他们访问不同的单词就会出现银行冲突但我的问题是不同的单词如何可以驻留在一个银行中由于bank
CUDA计算能力2.0。全局内存访问模式

CUDA 计算能力 2 0 Fermi 全局内存访问通过 768 KB L2 缓存进行看起来开发人员不再关心全局内存库但全局内存仍然非常慢因此正确的访问模式很重要现在的重点是尽可能多地使用重用 L2 我的问题是如何我将感谢一
设备内存刷新cuda

我正在运行一个 C 程序其中调用了两次 cuda 主机函数我想清理这两个调用之间的设备内存有没有办法可以刷新 GPU 设备内存我使用的是计算能力为2 0的Tesla M2050 如果你只想将内存归零那么cudaMemset可能是最
OpenCV 2.4.3rc 和 CUDA 4.2：“OpenCV 错误：没有 GPU 支持”

我在这张专辑中上传了几张截图 https i stack imgur com TELST jpg https i stack imgur com TELST jpg 我正在尝试在 Visual Studio 2008 中的 OpenCV 中
CUDA 8 编译错误 -std=gnu++11

我正在尝试转换一些代码以使用 CUDA 并且我认为我遇到了兼容性问题我们使用CMake 这些是我使用的 gcc 和 CUDA 版本 gcc version gcc Ubuntu 5 4 0 6ubuntu1 16 04 5 5 4 0 2
Cuda：最小二乘求解，速度较差

最近我使用Cuda编写了一个名为正交匹配追踪的算法在我丑陋的 Cuda 代码中整个迭代需要 60 秒而 Eigen lib 只需 3 秒在我的代码中矩阵 A 是 640 1024 y 是 640 1 在每一步中我从 A 中
将内核链接到 PTX 函数

我可以使用 PTX 文件中包含的 PTX 函数作为外部设备函数将其链接到另一个应调用该函数的 cu 文件吗这是另一个问题CUDA 将内核链接在一起 https stackoverflow com questions 20636800 c
使用推力来处理 CUDA 类中的向量？

我对 C 类的推力的适用性有疑问我正在尝试实现一个类对象该对象接收顶点的 x y z 坐标作为 ver1 ver2 和 ver3 然后分配给一个三角形并计算面积和法向量然而我不太明白如何创建一类推力向量这是我从文件中读取的顶点坐
一维纹理内存访问比一维全局内存访问更快吗？

我正在测量标准纹理和 1Dtexture 内存访问之间的差异为此我创建了两个内核 global void texture1D float doarray int size int index calculate each thread
如何降级cuda版本

我目前使用的是 cuda 版本 4 2 但我需要将其更改为 3 1 是否可以卸载当前版本 4 2 版然后安装以前的版本 3 1 版编辑请参阅我的操作系统是linux ubuntu 10 04 64位编辑我找到了如何获取 3 1 版
如何从尖点库矩阵格式获取原始指针

我需要从尖点库矩阵格式获取原始指针例如 cusp coo matrix

随机推荐

ELF Relocation逆向工程

我希望你们能帮助我理解重定位条目和 ELF 部分数据是如何关联的以及它们是如何处理和生成的我有一个古老的不受支持的工具它采用 ELF 文件和相关的 PLF 文件部分链接文件在构建过程的早期生成并从中构建一个自定义可重定位文件该
我可以将 GitHub Pages index.html 放在存储库的子文件夹中吗？

我正在尝试使用 GitHub 页面来托管 Doxygen 站点理想情况下我希望能够将生成的文件和目录推送到 GitHub 而无需对其进行任何调整然而这意味着我的 index html 位于存储库的子文件夹中并且 GitHub Pa
我们可以确保 `+ (nonnull instancetype)sharedInstance;` 的可空性吗？

这是一个关于如何优雅地规避可空性的问题init in NSObject class 这是一个经典的 Objective C 实现 instancetype sharedInstance static dispatch once t once
当我只想使用模拟器时，是否需要 Firebase 服务帐户？

使用 java admin SDK 连接到 Firebase Emulator Suite 时如何在没有现有服务帐户凭据的情况下初始化应用程序我有环境变量FIREBASE DATABASE EMULATOR HOST localhost
使用 PHPMailer 和 html2pdf 通过电子邮件发送 PDF 数据

我尝试通过电子邮件发送 PDF 或 PNG 但似乎没有任何效果以下是我最后的尝试我已经阅读了这里的每一篇文章但没有任何建议起作用有人可以帮忙吗我正在使用 PHPMailer html2pdf 和 html2canvas 这两个都可
编辑单元格时按下按键时是否会触发任何事件？

是否可以以任何方式捕获事件as您在工作表中的特定单元格中按下某个键对其进行编辑吗已知最接近的是Change事件但只有在取消选择编辑的单元格后才能激活该事件我想捕捉事件while我正在编辑单元格这是答案我已经测试过相同的结果它
Docker 中的 MySQL 冻结在 root 密码配置中

我有下一个 dockerfile FROM ubuntu 16 04 RUN apt get update apt get upgrade y apt get install y apache2 mysql server mysql cli
安全 Chrome 扩展程序中的compute_hashes.json和verified_contents.json文件的用途是什么？

我见过一些 Chrome 扩展程序可以对文件夹和文件名进行哈希处理他们有一个名为 metadata 以及其中的两个文件 compulated hashes json 和 verified contents json 这些文件是什么它们有
更新图表时不会导致内存泄漏的图表库

我想构建一个页面其中包含基于使用 AJAX 从服务器异步获取的数据的交互式刷新图表我很喜欢jqPlot http www jqplot com 但是当尝试定期更新图表时通过调用replot 没有页面刷新会导致巨大的浏览器内存泄漏这
错误：[$resource:badcfg] 资源配置错误。预期响应包含一个数组，但得到一个对象

对于角度而言我是一个十足的菜鸟刚刚完成了代码学校教程我就遇到了第一个障碍我正进入状态Error resource badcfg Error in resource configuration Expected response t
MongoRepository findByCreatedAtBetween 未返回准确结果

我在 Mongo 中的文档结构是这样的 db user find id ObjectId 560fa46930a8e74be720009a createdAt ISODate 2015 10 03T09 47 56 333Z message
无法仅从远程服务器使用 SQL 身份验证登录

我正在尝试从 SQL Server 2008 连接到远程服务器使用 sa 用户名及其密码我可以在自己的计算机上使用此用户名和密码正常登录所以选择 SQL Server和Windows身份验证模式在我计算机上的 SQL Server 日
如何使用 Laravel 社交名流检索用户 github 存储库？

使用社交名流已经有一段时间了我想知道是否有任何内置方法可以让我检索用户存储库我熟悉提供的方法列表Laravel 网站 https laravel com docs 5 1 authentication social authentica
使用变量作为对象的属性名称 - Javascript [重复]

这个问题在这里已经有答案了看到了一些与此相关的答案但没有人回答该版本的相关主题考虑以下事项链接到 jsfiddle http jsfiddle net 8cUKR 2 function arrKeys objArr nameArr
在 VS2010 中，有没有办法知道给定的 w3wp.exe 正在服务哪个应用程序池，然后决定将调试器附加到？

因此我正在调试一些在单独的应用程序池中本地运行的网站一个来自主干一个来自分支我在两个 VS 实例中打开了主干和分支解决方案我想在一个中调试主干在另一个中调试分支我想知道是否有一种方法可以知道每个 w3wp exe 正在服务哪个
将时间字符串快速转换为日期

我使用 firebase 作为后端并存储一串时间例如晚上 7 00 我正在尝试将从 Firebase 收到的字符串转换为 NSDate 以便我可以对它进行排序更改时间等到目前为止我已经在网上查看并提出了这段代码 dateFormatt
C++ 中“Nil”的概念

您还记得在本科生算法讲座中了解以下概念非常方便Nil 任何东西都可以分配给它或与之比较顺便说一句我从来没有读过计算机科学本科生在 Python 中我们可以使用None 在斯卡拉有Nothing 如果我理解正确的话这是一切的子对象
复制 std 向量中仅出现一次的元素的最有效方法是什么？

我有一个带有如下元素的 std 向量 0 1 2 0 2 1 0 0 188 220 0 1 2 除了暴力 O n 2 算法之外查找和复制此向量中仅出现一次的元素的最有效方法是什么在这种情况下新列表应包含 188 220 Make a
用于自定义产品图像缩略图的挂钩

我需要有关 woo commerce 的帮助来覆盖购物车产品图像缩略图我正在创建一个插件用于在详细信息页面中自定义产品如果我们添加到购物车它将在购物车页面中使用自定义缩略图进行更新如果有任何钩子可用于覆盖图像请告诉我我也花了
CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？

有人有过在工作站上编码时在服务器上调试 CUDA 代码的经验吗我的笔记本电脑 Thinkpad T400 不支持 CUDA 但我可以访问带有一对运行 Linux 的 NVIDIA GTX 295 卡的服务器我可以使用 NVidia 的

CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？

CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？ 的相关文章

随机推荐

热门标签

CUDA 调试 - Windows 工作站上的 VS，Linux 服务器上的 GPU？的相关文章