OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译

2024-02-14

我用opencl实现了一个项目。我有一个包含内核函数的文件，内核使用的函数包含在单独的头文件中，但是当我更改包含的文件时，有时会应用更改，有时则不会，这让我很困惑应用程序是否有错误。

我检查了 stackoverflow 中的其他帖子，发现 nvidia 在通过方面存在严重问题-I{include directory}，所以我更改了它并明确给出了头文件地址，但是opencl编译器仍然无法找到内核文件名中包含的头文件中的错误。

另外，我使用的是 nvidia gtx 980，并且我的计算机上安装了 CUDA 7.0。

有人有同样的经历吗？我该如何修复它？

所以，假设我有一个这样的内核：

#include "../../src/cl/test_kernel_include.cl"

void __kernel test_kernel(
  __global int* result,
  int n
  )
{
  int thread_idx = get_global_id(0);
  result[thread_idx] = test_func();
}

其中test_kernel_include.cl如下：

int test_func()
{
  return 1;
}

然后我运行代码，得到一个所有成员都等于的数组1正如我们所期望的。现在，我改变了test_kernel_include.cl to:

int test_func()
{
  return 2;
}

但结果仍然是一个所有成员都等于的数组1应该改为2但他们不是。

在平台初始化之前执行此操作：

setenv("CUDA_CACHE_DISABLE", "1", 1);

它将禁用构建的缓存机制。它也适用于 OpenCL 平台，尽管它说的是 CUDA。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencl

OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译的相关文章

OpenCL 内核未矢量化

我正在尝试构建一个内核来进行并行字符串搜索为此我倾向于使用有限状态机 fsm 的转换表位于内核参数状态中代码 kernel void Find constant char text const int offset const int
性能：boost.compute vs. opencl C++ 包装器

以下代码分别使用 boost compute 和 opencl C 包装器将两个向量相加结果显示 boost compute 几乎比 opencl c 包装器慢 20 倍我想知道我是否错过了使用 boost compute 或者它确实很
内存复制速度对比 CPU<->GPU

我现在正在学习 boost compute openCL 包装库我的复制过程非常慢如果我们将 CPU 到 CPU 的复制速度调整为 1 那么 GPU 到 CPU GPU 到 GPU CPU 到 GPU 复制的速度有多快我不需要精确的数
限制 AMD OpenCL 的 GPU 数量

是否有解决方案限制 AMD OpenCL 平台使用的 GPU 数量对于 NVIDIA 平台只需设置环境变量即可CUDA VISIBLE DEVICES限制 OpenCL 可用的 GPU 集编辑我知道我可以使用更少的设备创建一个上下
cl::vector 与 std::vector：不同的迭代器行为

EDIT 添加了 PlasmaHH 建议的带有内存位置的调试输出我不明白 OpenCL 的 C 绑定中 cl vector 的不同行为考虑以下代码 Header Top hpp class Top public void setBool
并行化 std::nth_element 和 std::partition

我正在移植使用的 C 代码std nth element and std partition到 OpenCL nth element http www cplusplus com reference algorithm nth elemen
OpenCL 内核是异步执行的吗？

对于 CUDA 我知道它们是在向默认流空流发出启动命令后异步执行的那么在 OpenCL 中又如何呢示例代码如下 cl context context cl device id device id cl int err cl kern
GPU 显存带宽理论与实际

作为在 GPU 上运行的算法分析的一部分我觉得我正在达到内存带宽的要求我有几个复杂的内核执行一些复杂的操作稀疏矩阵乘法归约等和一些非常简单的操作当我计算每个内核读取写入的总数据时似乎所有重要的都达到了约 79GB s 的
CUDA PTX 代码 %envreg<32> 特殊寄存器

我尝试使用 CUDA 驱动程序 API 运行由 cl 内核生成的 PTX 汇编代码我采取的步骤是这些标准 opencl 程序 1 加载 cl内核 2 JIT编译 3 获取编译好的ptx代码并保存到目前为止一切都很好我注意到 ptx
opencl支持布尔变量吗？

openCL 支持布尔变量吗我目前正在使用 JOCL java 编写我的 openCL 调用代码但我没有看到任何有关布尔值的信息 tl dr 是的但是你应该在内核函数签名中避免它是的但a的大小bool is not定义的因此它
如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？

使用 OpenCL 进行简单的矩阵乘法 Multiply two matrices A B C include
如何在 Windows 上的 nvidia GPU 的 Visual Studio 2010 中配置 OpenCL？

我在华硕笔记本电脑上的 Wwindows 7 操作系统上使用 NVIDIA GeForce GTX 480 GPU 我已经为 CUDA 4 2 配置了 Visual Studio 2010 如何在 Visual Studio 2010 上为
使用 OpenCL 或其他 GPGPU 框架在现代 x86 硬件上的 CPU 和 GPU 之间共享数据

AMD Kaveri 的 hUMA 异构统一内存访问和 Intel 第四代 CPU 证明了 CPU 和 GPU 硬件的不断统一应该允许 CPU 和 GPU 之间进行无副本的数据共享我想知道最新的 OpenCL 或其他 GPGPU 框
在 Mac OS X 10.7.4 上使用 OpenCL 禁用 Nvidia 看门狗

我有一个 OpenCL 程序对于小问题运行良好但是当运行较大的问题超过 Nvidia 硬件上运行内核的 8 10 秒时间限制时虽然我没有将显示器连接到我正在计算的 GPU Nvidia GTX580 上但一旦内核运行大约 8 10
如何在 Emgu CV 项目中利用 OpenCL

我是使用 Emgu CV 的新手并开始创建小型示例项目例如面部检测眼睛检测等如果我可以利用 OpenCL 来加速使用 GPU 的过程那就太好了否则当我降低scaleFactor时它会导致大量的CPU利用率我怎样才能做到这一
是否可以在 OpenCL 中并行运行求和计算？

我是 OpenCL 的新手不过我了解 C C 基础知识和 OOP 我的问题如下是否可以以某种方式并行运行求和计算任务理论上可能吗下面我将描述我尝试做的事情任务例如是 double values new double 1000 l
在 OpenCL 中将函数作为参数传递

是否可以在 OpenCL 1 2 中将函数指针传递给内核我知道可以用C实现但不知道如何在OpenCL的C中实现编辑我想做这篇文章中描述的同样的事情在 C 中如何将函数作为参数传递 https stackoverflow com q
尽管有障碍，Open CL 仍不同步

我刚刚开始通过 Python 的 PyOpenCL 接口使用 OpenCL 我尝试创建一个非常简单的循环程序其中每个内核中每个循环的结果取决于上一个循环周期的另一个内核的输出但我遇到了同步问题 kernel void part1 g
AMD OpenCL 在 Linux 上工作所需的最小必要文件子集是什么？

我已经使用 buildroot 构建了 Linux 内核我已将开源 amdgpu 驱动程序和所需的固件合并到其中驱动程序很好检测 GPU 模式设置运行良好调整小文本的分辨率启动后会显示命令行现在我需要运行 OpenCL 程序
OSX 上的 ATI OpenCL SDK

我拥有 ATI GK 的新 MPB 我很好奇我是否可以下载 OSX 的 sdk 特别是示例集合和分析器或者我必须本地运行 Windows Linux 因为我只找到了 Windows 和 Linux 的版本提前致谢只要您有 Mac O

随机推荐

如何在不转义字符串的情况下读取argv值？

我正在写一个名为的 python 脚本flac2m4a哪个调用ffmpeg将 flac 文件转换为 m4a 文件核心程序是这样的 cmd ffmpeg i s acodec alac s m4a sys argv 1 sys argv 1
如何调试 XAML 设计器问题？

我正在使用 Visual Studio 2015 开发一个 UWP 应用程序我想做的一件事是在设计时使用一些示例数据现在我添加了一个 XAML 文件将构建操作设置为DesignDataWithDesignTimeCrateableT
在离线模式下使用 google doc 服务在 webview 中显示 PDF

我需要在 Webview 中显示 PDF 我使用谷歌文档服务来实现相同的目的在在线模式下 mWebview getSettings setJavaScriptEnabled true String strPdf https www ado
Android：以动画方式启动应用程序

我有一个通过单击网页中的链接启动的应用程序没问题效果很好然而应用程序主屏幕有点远离浏览器我想添加一些动画也许它可以淡入或其他什么我已经在 ImageView 上完成了补间动画但不知道如何在整个布局屏幕上执行此操作有任何想法
WPF XAML 浏览器应用程序 (XBAP) 是否适用于 Android 和 Windows Phone 浏览器？有哪些替代方案？

我想为我的小公司创建简单的 CRM 网站感谢 stackoverflow 上的人们我假设我可以使用 WPF XAML 浏览器应用程序 XBAP WPF XAML 浏览器应用程序 XBAP 是否可以在 Android 和 Windows
SocketException：权限被拒绝？

我的 LogCat 内容如下 08 19 09 29 01 964 WARN System err 311 java net SocketException Permission denied 08 19 09 29 02 204 WARN
Jellybean 上缺少扩展宽度的 dalvik 字节码

当 ICS 出现时引入了几种新的扩展宽度字节码其中大部分是支持巨型 ID 的说明以下是一些新指令取自我的 ics dalvik opcode gen bytecode txt Extended width opcodes op 00
git subtree 将更改推送回子树项目

下面的简短内容是我想将提交消息推送到子树但仅限于适用于该树的消息我该怎么做呢我有两个项目 Master and Slave Slave被检出为子树Master签出到lib slave via git subtree merge pr
如何将 CocoaPods 依赖项与 Cordova 插件捆绑在一起？

我正在开发一个 Cordova 插件对于 iOS 平台我想合并一些现有的非 Cordova 特定的 Cocoapods 我无法找到任何有关如何使其工作的信息或示例并且我预计这是一个相当常见的用例请注意我并不是尝试将 Cordov
使用 Keras 和 scikit-learn 进行分类时无法克隆对象错误（尝试将交叉验证添加到工作模型中）（训练分割有效）

我有一个现有的 NN 模型顺序模型带有列车分割测试我需要向我的数据集添加交叉验证实施交叉验证后出现以下错误 TypeError Cannot clone object
使用帖子id查询帖子

有人可以告诉我使用帖子 ID 获取帖子的最佳方式是什么我正在使用这个 query query posts post id GET php post id global post foreach query as post do stuff
获取具有任何签名的任何方法的 MethodInfo（任何签名的委托）

我想编写一个方法该方法将分析任何方法具有任意数量的参数和任何返回类型的自定义属性仅了解方法信息该函数将检查方法是否具有特定属性像这样 var tmp methodInfo GetCustomAttributes typeof L
在没有 C 运行时的情况下使用 64 位整数 - 链接错误 __alldiv

我正在尝试在不使用 C 运行时 msvcrt 或 libcmt 的情况下构建 Windows 控制台应用程序也就是说仅链接 kernel32 lib 并使用 WIN32 API 中的控制台函数而不是 printf 等我的问题是在链接
如何设置 ACL 以允许每个人列出 REST API 中的所有用户

我尝试使用 REST API 列出我的 Loopback 2 0 应用程序中的所有用户但收到以下错误 error name Error status 401 message Authorization Required statusCod
是否可以在 Ruby 中执行 before_action（就像在 Rails 中一样）？

是否可以致电before action在某些指定的方法之前比如在 Rails 中 class Calculator before action raise Exception calculator is empty if numbers
在 ubuntu 18.04 中卸载 php 7

我有一台服务器其中有一个使用 PHP 5 6 运行的应用程序但我将服务器从 Ubuntu 14 04 升级到 18 04 在此过程中我还将 PHP 升级到 7 2 现在我正在尝试卸载它但我发现很难我已经运行命令 sudo apt g
使用外部数据的 D3 条形图

我使用 d3 js v4 制作了一个条形图我尝试使用外部数据文件 tsv 文件它给出了以下错误错误属性高度预期长度 NaN 匿名 d3 min js 2 o d3 min js 2 yn d3 min js 2 mn d3 min
listview 没有在带有 viewpager 选项卡的片段中刷新

我遇到了在 viewpager 样式选项卡内使用 listview 和片段的问题该选项卡在 github 上的 jakewharton s Android ViewPagerIndicator 示例中给出我对三个选项卡使用相同的库每个
我什么时候应该在 WPF 中使用依赖属性？

我什么时候应该在 WPF 中使用依赖属性它们是静态的因此与使用 NET 属性相比我们可以节省大量内存相对于 NET 属性使用依赖属性的其他好处包括 1 无需检查线程访问 2 提示渲染包含元素 ETC 所以看来我应该始终在使用 WPF
OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译

我用opencl实现了一个项目我有一个包含内核函数的文件内核使用的函数包含在单独的头文件中但是当我更改包含的文件时有时会应用更改有时则不会这让我很困惑应用程序是否有错误我检查了 stackoverflow 中的其他帖子发现

OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译

OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译 的相关文章

随机推荐

热门标签

OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译的相关文章