多个 OpenCl 内核

2024-03-09

我只是想问，是否有人可以提醒我在相继使用几个简单内核时要注意什么。

我可以用同样的吗CommandQueue？我可以跑几次吗clCreateProgramWithSource + cl_program与不同的cl_program？我忘记了什么？

Thanks!

您可以创建并编译多个程序（并从中创建内核对象），也可以将所有内核放入同一个程序中（clCreateProgramWithSource毕竟需要几个字符串）并从该字符串创建所有内核。使用相同的 CommandQueue 应该可以正常工作。使用多个 CommandQueue 来执行应该在同一设备上串行执行的内核无论如何都不是一个好主意，因为在这种情况下，您必须手动等待事件完成，而不是异步地将所有内核排队然后等待结果（在至少某些操作应该在设备和主机上并行执行，因此在最后可能的时刻等待通常更快更容易）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencl

多个 OpenCl 内核的相关文章

在多 GPU 系统中，如何将 OpenCL 设备与给定 PCI 供应商、设备和总线 ID 的特定 GPU 相匹配？

我希望能够在由 PCI ID 标识的多 GPU 系统上将 OpenCL 设备与系统中的 GPU 进行匹配例如如果我的系统具有多个 GPU 可能来自不同的供应商我可以通过枚举 PCI 总线来列出设备这为我提供了 PCI 供应商设备和
OpenCL 内核未矢量化

我正在尝试构建一个内核来进行并行字符串搜索为此我倾向于使用有限状态机 fsm 的转换表位于内核参数状态中代码 kernel void Find constant char text const int offset const int
不受信任的 GPGPU 代码（OpenCL 等）- 安全吗？有什么风险？

在典型的 CPU 上运行不受信任的代码有很多方法沙箱假根虚拟化 GPGPU 不受信任的代码 OpenCL cuda 或已编译的代码怎么样假设在运行此类第三方不受信任代码之前清除了显卡上的内存是否存在安全隐患什么样的风险 Any
在 OpenCL 中以编程方式选择最佳 GPU 的最佳方法是什么？

我的笔记本电脑上有两个显卡 Intel Iris 和 Nvidia GeForce GT 750M 我正在尝试使用简单的向量相加OpenCL 我知道 Nvidia 卡速度更快并且可以更好地完成工作原则上我可以把if代码中的语句将查找N
性能：boost.compute vs. opencl C++ 包装器

以下代码分别使用 boost compute 和 opencl C 包装器将两个向量相加结果显示 boost compute 几乎比 opencl c 包装器慢 20 倍我想知道我是否错过了使用 boost compute 或者它确实很
内存复制速度对比 CPU<->GPU

我现在正在学习 boost compute openCL 包装库我的复制过程非常慢如果我们将 CPU 到 CPU 的复制速度调整为 1 那么 GPU 到 CPU GPU 到 GPU CPU 到 GPU 复制的速度有多快我不需要精确的数
cl::vector 与 std::vector：不同的迭代器行为

EDIT 添加了 PlasmaHH 建议的带有内存位置的调试输出我不明白 OpenCL 的 C 绑定中 cl vector 的不同行为考虑以下代码 Header Top hpp class Top public void setBool
CMake找不到NVIDIA的opencl sdk

我刚刚安装了 NVIDIA CUDA 工具套件用它在 Windows 8 1 上开发 OpenCL 应用程序我遇到了一些问题 1 FinedOpenCl cmake 不起作用因为 Nvidia 工具包未设置 opencl dir cm
OpenCL 双精度与 CPU 双精度不同

我正在 Linux 中使用 GeForce GT 610 卡进行 OpenCL 编程我的CPU和GPU双精度结果不一致我可以在这里发布部分代码但我首先想知道是否有其他人遇到过这个问题当我运行多次迭代的循环时 GPU 和 CPU 双精
OpenCL：头文件的附加目录

OpenCL 规范中写道5 6 3 构建选项 5 6 3 1 预处理器选项 I dir Add the directory dir to the list of directories to be searched for header f
OpenCL clGetPlatformIDs 异常

我使用此包安装附带的示例中的 HelloWorld 示例 AMD 套件 http developer amd com tools and sdks heterogeneous computing amd accelerated parall
多个 OpenCl 内核

我只是想问是否有人可以提醒我在相继使用几个简单内核时要注意什么我可以用同样的吗CommandQueue 我可以跑几次吗clCreateProgramWithSource cl program与不同的cl program 我忘记了什么 T
OpenCL 内置函数“选择”

我不清楚内置 OpenCL 函数的目的是什么select 有人可以澄清一下吗来自 OpenCL 规范功能选择基因型a 基因型b 基因型c 返回对于向量类型的每个分量结果 i 如果设置了 c i 的 MSB b i a i 在这种情
GPU 上非原子写入的保证很弱吗？

OpenCL 和 CUDA 包含原子操作已有好几年了尽管显然并非每个 CUDA 或 OpenCL 设备都支持这些操作但是我的问题是关于由于非原子写入而共存种族的可能性假设网格中的多个线程都写入全局内存中的同一位置我们是否可以保
为什么程序（全局）作用域变量必须是 __constant？

我是 OpenCL 新手对这个限制感到非常困惑例如如果我想写一个LCG 我必须使状态字可以修改为rand and srand 在 ANSI C 中我将使用以下方法来做到这一点 ANSI C static unsigned long
如何在 Docker 容器内运行 OpenCL + OpenGL？

目的是在 Docker 容器内运行 OpenCL OpenGL 互操作应用程序但我还没有成功 Intro 我有配备 NVidia 显卡的笔记本电脑因此我认为利用 NVidia Dockerfiles 1 2 将是一个很好的起点以下
在 Mac OS X 10.7.4 上使用 OpenCL 禁用 Nvidia 看门狗

我有一个 OpenCL 程序对于小问题运行良好但是当运行较大的问题超过 Nvidia 硬件上运行内核的 8 10 秒时间限制时虽然我没有将显示器连接到我正在计算的 GPU Nvidia GTX580 上但一旦内核运行大约 8 10
如何在 C 中将向量参数传递给 OpenCL 内核？

我在将向量类型 uint8 参数从 C 中的主机代码传递到 OpenCL 内核函数时遇到问题在主机中我将数据存储在数组中 cl uint dataArr 8 1 2 3 4 5 6 7 8 我的真实数据不仅仅是 1 8 这只是为了便于解
在内核 OpenCL 中实现 FIFO 的最佳方法

目标在 OpenCL 中实现下图所示 OpenCl 内核所需的主要内容是将系数数组和临时数组相乘然后最后将所有这些值累加为 1 这可能是最耗时的操作并行性在这里非常有帮助我正在为内核使用一个辅助函数来执行乘法和加法我希望这个函数也
在 open CL 中将结构数组传递给内核

你好我正在尝试在 open CL 中实现距离向量程序基本上我在将结构数组作为参数传递到内核时遇到问题我的结构定义是这样的 typedef struct int a nodes 4 node node srcA 为此分配内存后我使用此

随机推荐

如何在Java中使用snake yaml序列化具有自定义名称的字段

我正在尝试序列化具有如下字段的 Java 实例 public class Person private String firstName private String lastName public String getFirstName
shell脚本中的三重嵌套引号

我正在尝试编写一个 shell 脚本来调用另一个脚本然后执行 rsync 命令第二个脚本应该在它自己的终端中运行所以我使用gnome terminal e 命令该脚本的参数之一是一个字符串其中包含应提供给 rsync 的参数我把
在 Xamarin 应用程序中将项目添加到 Android 上的 ListView

我正在尝试重新混音将项目添加到 ListView 的基本 Android 建议 https stackoverflow com q 4540754 419956在 Xamarin 应用程序中但到目前为止我失败了在 Xamarin Stu
具有延迟加载功能的 ViewModel 类的单元测试

我正在尝试为具有延迟加载的 viewModel 类编写单元测试我有以下 ViewModel 类 abstract class DetailViewModel item TmdbItem BaseViewModel private val
使用 bash 和正则表达式在一行中查找并终止进程

我在编程时经常需要杀死一个进程我现在的做法是 ps aux grep python csp build py user 5124 1 0 0 3 214588 13852 pts 4 Sl 11 19 0 00 python csp bu
如何在 MSBuild 中递归调用任务？

例如我想每次调用这些脚本传递差异参数
驱动程序开发疑难解答：Windows CodeIntegrity 3004 无法识别签名的驱动程序

简短的介绍我有一个通过 SignTool 验证的签名驱动程序但 Windows 拒绝加载它并出现错误 CodeIntegrity 3004 在系统上找不到文件哈希我该如何解决详细描述我正在使用 Cypress Suite USB
隐藏WebView中的滚动条

当我不滚动页面时我想在 WebView 中隐藏垂直滚动条目前来看是一直显示的我以编程方式创建 WebView 所以我的问题与以编程方式自定义滚动条有关谢谢试试这个代码 webView setVerticalScrollBarEn
adb 未检测到 micromax a111

最近我购买了 micromax a111 Android 设备我是安卓开发者因此尝试使用该设备进行调试选项但 adb 无法检测到该设备我也更改了设置但没有成功如果有人有解决方案请帮助我解决这个问题 micromax没有官方的P
Play 框架中的 post 请求中的表单值为空

我有 html 来回发表单如下所示 message String main Contact contact css gt div div div p Have a question or need some assistance Let
Python - 创建具有动态大小的文本边框

我正在创建一个命令行脚本我希望有一个框这将始终适合其内容我知道如何做顶部和底部但它让 ljust 和 rjust 正常工作每行可能有一个字符串替换即 5 个这些字符串的长度可以是 0 到 80 之间的任何值我一直在做这样的事
将数据模型传递给前台服务[重复]

这个问题在这里已经有答案了我有一个在 Splash Activity 上触发的前台服务 Intent StartServiceIntent StartServiceIntent new Intent this typeof PagesSe
如何通过 CSS 将模式写入书面文本？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案几天前我看到一个网站其中的书面文字有背景图像是否已经可以使用 CSS 将背景图像添加到文本中我不想要文本后面的背
有没有办法从命令行弹出所有外部硬盘驱动器？（操作系统）

有没有办法从命令行弹出 OS X 计算机上所有已安装的硬盘驱动器卷如果我可以将 Applescript 包装在 shell 脚本中那么就可以了还有另一种优雅的方法可以在不知道确切名称的情况下卸载所有外部硬盘驱动器 osascript
将自定义配置组移动到单独的文件中

我最近写了一个相当大的自定义配置组我很好奇是否可以通过以下方式将此配置移动到单独的文件中
更改 HighCharts 中成交量列（高/低）的颜色

我有一个简单的图表显示下面带有成交量柱的烛台 http jsfiddle net T83Xy http jsfiddle net T83Xy 基本上我想对柱子使用黑色和红色具体取决于收盘价是否高于开盘价我通过推送 Y data co
如何在 Django Rest Framework 上正确序列化来自 django_countries 的 CountryFIeld？

我正在尝试序列化 CountryField django countries 包但我的 JSON 并未显示所有可用的国家地区我在这里读到django Rest 框架中的 django countries https stackover
canvas 的 toDataURL() 函数可能的数据类型有哪些？

canvas toDataURL type encoderOptions MDN https developer mozilla org en US docs Web API HTMLCanvasElement toDataURL的描述关于
ReSharper 格式化：对齐相等的操作数

谷歌员工请注意这个问题有点过时了因为当前版本的 ReSharper 2017 3 1 现在支持所请求的功能我喜欢格式化我的代码以对齐相等操作数的右侧像这儿 bool canRead false bool canReadClass t
多个 OpenCl 内核

我只是想问是否有人可以提醒我在相继使用几个简单内核时要注意什么我可以用同样的吗CommandQueue 我可以跑几次吗clCreateProgramWithSource cl program与不同的cl program 我忘记了什么 T

多个 OpenCl 内核

多个 OpenCl 内核 的相关文章

随机推荐

热门标签

多个 OpenCl 内核的相关文章