如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？

2024-03-14

使用 OpenCL 进行简单的矩阵乘法：

// Multiply two matrices A * B = C

#include <stdlib.h>
#include <stdio.h>
#include <math.h>
#include <oclUtils.h>

#define WA 3
#define HA 3
#define WB 3
#define HB 3
#define WC 3
#define HC 3

// Allocates a matrix with random float entries.
void randomInit(float* data, int size)
{
   for (int i = 0; i < size; ++i)
   data[i] = rand() / (float)RAND_MAX;
}

/////////////////////////////////////////////////////////
// Program main
/////////////////////////////////////////////////////////

int
main(int argc, char** argv)
{

   // set seed for rand()
   srand(2006);

   // 1. allocate host memory for matrices A and B
   unsigned int size_A = WA * HA;
   unsigned int mem_size_A = sizeof(float) * size_A;
   float* h_A = (float*) malloc(mem_size_A);

   unsigned int size_B = WB * HB;
   unsigned int mem_size_B = sizeof(float) * size_B;
   float* h_B = (float*) malloc(mem_size_B);

   // 2. initialize host memory
   randomInit(h_A, size_A);
   randomInit(h_B, size_B);

   // 3. print out A and B
   printf("\n\nMatrix A\n");
   for(int i = 0; i < size_A; i++)
   {
      printf("%f ", h_A[i]);
      if(((i + 1) % WA) == 0)
      printf("\n");
   }

   printf("\n\nMatrix B\n");
   for(int i = 0; i < size_B; i++)
   {
      printf("%f ", h_B[i]);
      if(((i + 1) % WB) == 0)
      printf("\n");
   }

   // 4. allocate host memory for the result C
   unsigned int size_C = WC * HC;
   unsigned int mem_size_C = sizeof(float) * size_C;
   float* h_C = (float*) malloc(mem_size_C);

   // 5. Initialize OpenCL
   // OpenCL specific variables
   cl_context clGPUContext;
   cl_command_queue clCommandQue;
   cl_program clProgram;
   cl_kernel clKernel;

   size_t dataBytes;
   size_t kernelLength;
   cl_int errcode;

   // OpenCL device memory for matrices
   cl_mem d_A;
   cl_mem d_B;
   cl_mem d_C;

   /*****************************************/
   /* Initialize OpenCL */
   /*****************************************/

   clGPUContext = clCreateContextFromType(0, 
                   CL_DEVICE_TYPE_GPU, 
                   NULL, NULL, &errcode);
   shrCheckError(errcode, CL_SUCCESS);

   // get the list of GPU devices associated 
   // with context
   errcode = clGetContextInfo(clGPUContext, 
              CL_CONTEXT_DEVICES, 0, NULL, 
              &dataBytes);
   cl_device_id *clDevices = (cl_device_id *)
              malloc(dataBytes);
   errcode |= clGetContextInfo(clGPUContext, 
              CL_CONTEXT_DEVICES, dataBytes, 
              clDevices, NULL);
   //shrCheckError(errcode, CL_SUCCESS);

   //Create a command-queue
   clCommandQue = clCreateCommandQueue(clGPUContext, 
                  clDevices[0], 0, &errcode);
   //shrCheckError(errcode, CL_SUCCESS);

   // Setup device memory
   d_C = clCreateBuffer(clGPUContext, 
          CL_MEM_READ_WRITE, 
          mem_size_A, NULL, &errcode);
   d_A = clCreateBuffer(clGPUContext, 
          CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR, 
          mem_size_A, h_A, &errcode);
   d_B = clCreateBuffer(clGPUContext, 
          CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR, 
          mem_size_B, h_B, &errcode);


   // 6. Load and build OpenCL kernel
   char *clMatrixMul = oclLoadProgSource("kernel.cl",
                        "// My comment\n", 
                        &kernelLength);
   //shrCheckError(clMatrixMul != NULL, shrTRUE);

   clProgram = clCreateProgramWithSource(clGPUContext, 
                1, (const char **)&clMatrixMul, 
                &kernelLength, &errcode);
   //shrCheckError(errcode, CL_SUCCESS);

   errcode = clBuildProgram(clProgram, 0, 
              NULL, NULL, NULL, NULL);
   //shrCheckError(errcode, CL_SUCCESS);

   clKernel = clCreateKernel(clProgram, 
               "matrixMul", &errcode);
   //shrCheckError(errcode, CL_SUCCESS);


   // 7. Launch OpenCL kernel
   size_t localWorkSize[2], globalWorkSize[2];

   int wA = WA;
   int wC = WC;
   errcode = clSetKernelArg(clKernel, 0, 
              sizeof(cl_mem), (void *)&d_C);
   errcode |= clSetKernelArg(clKernel, 1, 
              sizeof(cl_mem), (void *)&d_A);
   errcode |= clSetKernelArg(clKernel, 2, 
              sizeof(cl_mem), (void *)&d_B);
   errcode |= clSetKernelArg(clKernel, 3, 
              sizeof(int), (void *)&wA);
   errcode |= clSetKernelArg(clKernel, 4, 
              sizeof(int), (void *)&wC);
   //shrCheckError(errcode, CL_SUCCESS);

   localWorkSize[0] = 3;
   localWorkSize[1] = 3;
   globalWorkSize[0] = 3;
   globalWorkSize[1] = 3;

   errcode = clEnqueueNDRangeKernel(clCommandQue, 
              clKernel, 2, NULL, globalWorkSize, 
              localWorkSize, 0, NULL, NULL);
   //shrCheckError(errcode, CL_SUCCESS);

   // 8. Retrieve result from device
   errcode = clEnqueueReadBuffer(clCommandQue, 
              d_C, CL_TRUE, 0, mem_size_C, 
              h_C, 0, NULL, NULL);
   //shrCheckError(errcode, CL_SUCCESS);

   // 9. print out the results
   printf("\n\nMatrix C (Results)\n");
   for(int i = 0; i < size_C; i++)
   {
      printf("%f ", h_C[i]);
      if(((i + 1) % WC) == 0)
      printf("\n");
   }
   printf("\n");

   // 10. clean up memory
   free(h_A);
   free(h_B);
   free(h_C);

   clReleaseMemObject(d_A);
   clReleaseMemObject(d_C);
   clReleaseMemObject(d_B);

   free(clDevices);
   free(clMatrixMul);
   clReleaseContext(clGPUContext);
   clReleaseKernel(clKernel);
   clReleaseProgram(clProgram);
   clReleaseCommandQueue(clCommandQue);

}

在上面的代码中，我不断在这个地方收到错误：

/**********************/ /

Nvidia 驱动程序希望您提供一个非 NULL 属性指针作为第一个参数clCreateContextFromType call.

Khronos 规范clCreateContextFromType指出如果为属性参数传递 NULL，则选择的平台取决于实现。对于 Nvidia，选择似乎是如果传递 NULL 指针，则根本不选择任何平台。看clCreateContextFromType http://www.khronos.org/registry/cl/sdk/1.2/docs/man/xhtml/clCreateContextFromType.html了解更多信息。

另一方面，此行为与问题 #3 一致cl_khr_icd 扩展 http://www.khronos.org/registry/cl/extensions/khr/cl_khr_icd.txt，如果您通过 ICD 使用 OpenCL，则适用，其中指出：

3: How will the ICD handle a NULL cl_platform_id?

RESOLVED: The NULL platform is not supported by the ICD.

将属性传递给clCreateContextFromType，首先查询平台clGetPlatformIDs。然后使用所需的平台 ID 构造一个属性数组并将其传递给clCreateContextFromType。以下内容应该适用于 C99 兼容的编译器：

   // query the number of platforms
   cl_uint numPlatforms;
   errcode = clGetPlatformIDs(0, NULL, &numPlatforms);
   shrCheckError(errcode, CL_SUCCESS); 

   // now get all the platform IDs
   cl_platform_id platforms[numPlatforms];
   errcode = clGetPlatformIDs(numPlatforms, platforms, NULL);
   shrCheckError(errcode, CL_SUCCESS);

   // set platform property - we just pick the first one
   cl_context_properties properties[] = {CL_CONTEXT_PLATFORM, (int) platforms[0], 0};
   clGPUContext = clCreateContextFromType(properties, CL_DEVICE_TYPE_GPU, NULL, NULL, &errcode);
   shrCheckError(errcode, CL_SUCCESS);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencl

NVIDIA

如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？的相关文章

GPGPU：普通 PC 陷入困境的后果

我在一本书中读到在波前或扭曲中所有线程共享一个公共程序计数器那么它的后果是什么呢为什么这很重要 NVIDIA GPU 一次执行 32 个线程扭曲 AMD GPU 一次执行 64 个线程波前控制逻辑读取和数据路径的共享减少了面
OpenCL clGetPlatformIDs 异常

我使用此包安装附带的示例中的 HelloWorld 示例 AMD 套件 http developer amd com tools and sdks heterogeneous computing amd accelerated parall
nvidia驱动、cuda驱动和cuda工具包之间有什么关系？

在nvidia驱动包中有libcuda so cuda驱动和nvidia驱动一样吗 cuda工具包和libcuda so之间有什么关系来自cuda文档 http docs nvidia com cuda cuda c programmi
如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？

使用 OpenCL 进行简单的矩阵乘法 Multiply two matrices A B C include
如何使 TensorFlow 在具有 2.x 功能的 GPU 上运行？

我已在 Linux Ubuntu 16 04 上成功安装了tensorflow GPU 并进行了一些小的更改以使其能够与新的 Ubuntu LTS 版本配合使用然而我认为谁知道为什么我的 GPU 满足计算能力大于 3 5 的最低要
在 Windows 8 (x64) 中安装期间出现 PyOpenCL“致命错误：CL/cl.h：没有此类文件或目录”错误

在大量搜索此问题的解决方案后我发现此特定错误尚未针对 Windows 正确记录所以我决定将这个问题与解决方案一起发布抱歉如果我将其发布在错误的部分我希望这个解决方案能够帮助用户解决未来 PyOpenCL 安装错误请注意此处使用
GPU 上非原子写入的保证很弱吗？

OpenCL 和 CUDA 包含原子操作已有好几年了尽管显然并非每个 CUDA 或 OpenCL 设备都支持这些操作但是我的问题是关于由于非原子写入而共存种族的可能性假设网格中的多个线程都写入全局内存中的同一位置我们是否可以保
使用内置显卡，没有NVIDIA显卡，可以使用CUDA和Caffe库吗？

使用内置显卡没有 NVIDIA 显卡可以使用 CUDA 和 Caffe 库吗我的操作系统是 ubuntu 15 CPU为 Intel i5 4670 3 40GHz 4核内存为12 0GB 我想开始学习深度学习 CUDA 适用于 N
cudaMemcpyToSymbol 的问题

我正在尝试复制到恒定内存但我不能因为我对 cudaMemcpyToSymbol 函数的用法有误解我正在努力追随this http developer download nvidia com compute cuda 4 1 rel t
杀死 OpenCL 内核

有没有办法通过 OpenCL API 终止正在运行的 OpenCL 内核我在规范中没有找到任何内容我能想到的唯一解决方案是 1 定期检查内核中主机希望内核停止时写入的标志或 2 在单独的进程中运行内核并终止整个进程我认为这两个都不是
Linux 上的 OpenCL 编译

我是 OpenCL 的新手从昨天开始我尝试使用 OpenCL 进行并行编程而不是使用我更熟悉且以前体验过的 CUDA 现在我有 NVIDIA GTX 580 GPU Ubuntu Linux 12 04 操作系统和 CUDA SDK
如何在 pyopencl 中创建可变大小的 __local 内存？

在我的 C OpenCL 代码中我使用clSetKernelArg创建可变尺寸 local我的内核中使用的内存 OpenCL 本身不提供该内存看我的例子 clSetKernelArg clKernel ArgCounter sizeof
是否可以在 OpenCL 中并行运行求和计算？

我是 OpenCL 的新手不过我了解 C C 基础知识和 OOP 我的问题如下是否可以以某种方式并行运行求和计算任务理论上可能吗下面我将描述我尝试做的事情任务例如是 double values new double 1000 l
OpenCL 内核在 Nvidia GPU 上每个线程使用多少寄存器？

我的第一个问题是如何获取 Nvidia GPU 上 OpenCL 内核代码的寄存器使用信息因为 nvcc 编译器给出了相同的使用信息nvcc ptxas options vCUDA 内核代码的标志我还从 AMD GPU for Open
在 open CL 中将结构数组传递给内核

你好我正在尝试在 open CL 中实现距离向量程序基本上我在将结构数组作为参数传递到内核时遇到问题我的结构定义是这样的 typedef struct int a nodes 4 node node srcA 为此分配内存后我使用此
用于计算邻居列表的最佳 GPU 算法

给定 3D 中数千个点的集合我需要获取落在某个截止值以欧几里得距离而言内的每个粒子的邻居列表并且如果可能的话从最近到最远排序在 CUDA 或 OpenCL 语言中哪种 GPU 算法最快我所知道的最快的 GPU MD 代码之一
OpenCL 研究/学术论文

我即将在大学开始关于 OpenCL 的荣誉项目以及如何利用它来改进现代游戏开发我知道现在很快就会有几本关于学习 opencl 的书但我想知道是否有人知道关于 opencl 的任何好的论文我一直在寻找但似乎找不到任何东西我的项目
HUGE_VALF 和 INFINITY 常量之间的区别

在 OpenCL 中有两个代表无穷大的浮点数学常数其中之一很简单INFINITY 另一个 HUGE VALF 求值为无穷大这两者有什么区别求值至无穷大是什么意思 HUGE VALF是一个旧名称允许不支持无穷大的浮点系统例如
OSX 上的 ATI OpenCL SDK

我拥有 ATI GK 的新 MPB 我很好奇我是否可以下载 OSX 的 sdk 特别是示例集合和分析器或者我必须本地运行 Windows Linux 因为我只找到了 Windows 和 Linux 的版本提前致谢只要您有 Mac O
CUDA 代码会损坏 GPU 吗？

在测试包含内存错误的 CUDA 时我的屏幕被冻结了重新启动后我无法再检测到显卡我的代码是否有可能物理损坏该卡这发生在 Ubuntu 14 04 下我不知道该卡的型号因为我无法检测到它但我记得它是一张相当新的卡感谢所有的评论我

随机推荐

通过将变量名称“缝合”在一起来访问 C++ 中的变量

假设我有一个变量 int fish5 7 我可以通过连接术语 fish 和 5 来访问fish5吗理想的解决方案如下所示 printf I am displaying the number seven i fish 5 不不完全是你想要
将 CSV 文件导入 Django 模型的最简单方法是什么？

我正在 DJANGO 中制作一个应用程序来处理很多问题模型中指定了一个问题表或多或少会有数千个问题现在我手头有一个 Excel 文件其中包含所有问题我可以从那里创建一个 CSV 文件我只需要获取问题表中的 CSV 数据最简
使用 ProducerTemplate 通过 Camel 进行代理身份验证

我有一个使用 Camel 并在 ServiceMix 服务器上运行的项目但我似乎无法让它访问外部 Web 服务我怀疑这是因为我无法正确设置代理身份验证 Exchange exchange producerTemplate request
如何使用@SpringBootApplication注解自动检测@ConfigurationProperties注解的类

我正在学习 Spring Boot 并对参考文档中的一个示例有疑问以下部分文档 https docs spring io spring boot docs current reference html using spring boot
如何在 Google Drive API 中获取修订的导出链接

我正在使用 Google Apps 脚本来尝试获取 Google 绘图的各种修订版的导出链接列表下面的代码重现了该问题要尝试一下请使用绘图的 ID 调用 getRevisionHx Google oAuth function goog
更新到 Xcode 8.3 后，桥接标头中出现“文件“File.h”的不可移植路径；指定路径与磁盘上的文件名不同”警告

我更新到 Xcode 8 3 和 Swift 3 1 并在桥接头文件中收到此警告引用了 Objective C 头文件文件 File h 的不可移植路径指定的路径与磁盘上的文件名不同我该如何解决这个问题原来我拼错了文件名正确的名
仍然建议使用 Minitest 测试 Rails 4 中的路由吗？

在 Rails 3 中当在 MiniTest 中编写功能测试时我养成了分别测试路由和测试控制器操作的习惯我的想法来自于Rails 测试指南第 9 节测试路线 http guides rubyonrails org testing
如何将 JSON 转换为 CSV？

我该如何修复该错误 http play golang org p 0UMnUZOUHw http play golang org p 0UMnUZOUHw JSON to CSV in Golang package main import
F# 中的自定义 IEnumerator

更多 F 问题我在下面实现了二进制阅读器我希望它像可枚举序列一样工作下面的代码给了我以下错误我像往常一样不知道如何解决它我有一个 C 实现我必须实现两个不同的覆盖 Current财产我想我必须在这里做同样的事情但不知道如何做
在内存中将 XML 字符串作为 Excel 工作簿打开，而不使用 Windows Forms C# 进行保存

我的内存中有一个 excel 字符串我构建的代码看起来像这样 public static void exportToExcel const string startExcelXML
如何引导导航栏静态固定在滚动上？

我想在滚动时将静态导航栏设置为固定导航栏当它到达页面顶部时有没有办法使用 bootstrap 3 css 或 javascript 来获取它如果我没记错的话您想要实现的目标称为粘性导航栏只需几行 jQuery 滚动事件就很容易实
如何将通配符参数传递给 bash 文件

我正在尝试编写一个 bash 脚本允许用户使用通配符传递目录路径例如 bash show files sh 当在此目录中执行时 drw r r 2 root root 4 0K Sep 18 11 33 dir a rw r r 1 r
如果 for 循环找不到我想要的东西，就做一些事情

我有一个常见的问题我想知道是否有人有比我到目前为止所做的更好的方法来解决它我想循环一个数组来查找一个对象并更新它如果该对象不存在我想将其附加到数组中我通常处理更复杂的对象这使得问题变得更加复杂 var movies id 1 t
如何将 pandas 中的秒数替换为零

我在 pandas 中有以下数据框 code time 1 003002 1 053003 1 060002 1 073001 1 073003 我想在 pandas 中生成以下数据框 code time new time 1 003002
Swift 中的指针

我试图了解 Swift 中指针的使用特别是 Unsafe Mutable Pointer and UnsafeRaw Mutable Pointer 我对这个问题有几个问题 Is UnsafePointer
如何在 python 中运行这个 shell 脚本？

我想从 python 程序运行 bash 脚本该脚本有一个这样的命令 find type d exec bash c cd 0 gunzip c gz cut f 3 gt gt mydoc txt 通常我会运行一个子进程调用例如 su
运行项目时 Node Canvas 抛出错误

Node Canvas 在 m1 上不适用于我当我尝试运行我的项目时我收到此错误消息 Error dlopen node modules canvas build Release canvas node 0x0001 tried nod
每个配置文件中的部分只能出现一次。请参阅帮助主题了解异常情况。为什么？

配置错误描述处理服务此请求所需的配置文件期间发生错误请查看下面的具体错误详细信息并适当修改您的配置文件
Three.js 全屏问题

我已经通读了 Three js API 通读了 StackOverflow 上的问题我已经使用 firebug 和 chrome 的调试器调试了代码我已经删除了我能删除的所有内容但我仍然遇到这个恼人的全屏错误其中渲染器视口比我的屏幕
如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？

使用 OpenCL 进行简单的矩阵乘法 Multiply two matrices A B C include

如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？

如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？ 的相关文章

随机推荐

热门标签

如何消除 opencl 代码中的 CL_INVALID_PLATFORM 错误？的相关文章