在 Mac OS X 10.7.4 上使用 OpenCL 禁用 Nvidia 看门狗

2024-04-30

我有一个 OpenCL 程序,对于小问题运行良好,但是当运行较大的问题超过 Nvidia 硬件上运行内核的 8-10 秒时间限制时。虽然我没有将显示器连接到我正在计算的 GPU(Nvidia GTX580)上,但一旦内核运行大约 8-10 秒,它总是会终止。

我对此问题所做的初步研究表明,Nvidia 看门狗只应在显示器连接到显卡时强制执行时间限制。但是,我没有任何监视器连接到运行 OpenCl 的 GPU,但此限制仍然强制执行。

是否可以在 Mac OS X 10.7.4 中禁用 Nvidia 看门狗或让驱动程序识别出没有显示器连接到 GTX580?

我知道解决这个问题的一种可能方法是分解成更小的内核,但是由于我工作的性质,当我采用更细的颗粒时,我仍然可能达到这个限制。

我正在编译/运行的系统如下:

  • MacPro4,1 2 x 2.26 GHz 四核英特尔至强
  • Mac OS X 10.7.4
  • 代码 4.3.3
  • Nvidia GT120(连接 2 个显示器)
  • NVidia GTX580(无附件)

有关额外信息,当我运行 NVidia 设备查询时,我会得到以下输出:

CUDA Device Query (Runtime API) version (CUDART static linking)

Found 2 CUDA Capable device(s)

Device 0: "GeForce GTX 580"
  CUDA Driver Version / Runtime Version          4.2 / 4.2
  CUDA Capability Major/Minor version number:    2.0
  Total amount of global memory:                 1536 MBytes (1610285056 bytes)
  (16) Multiprocessors x ( 32) CUDA Cores/MP:    512 CUDA Cores
  GPU Clock rate:                                1564 MHz (1.56 GHz)
  Memory Clock rate:                             2004 Mhz
  Memory Bus Width:                              384-bit
  L2 Cache Size:                                 786432 bytes
  Max Texture Dimension Size (x,y,z)             1D=(65536), 2D=(65536,65535), 3D=(2048,2048,2048)
  Max Layered Texture Size (dim) x layers        1D=(16384) x 2048, 2D=(16384,16384) x 2048
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 32768
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  1536
  Maximum number of threads per block:           1024
  Maximum sizes of each dimension of a block:    1024 x 1024 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 65535
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and execution:                 Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Concurrent kernel execution:                   Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support enabled:                No
  Device is using TCC driver mode:               No
  Device supports Unified Addressing (UVA):      Yes
  Device PCI Bus ID / PCI location ID:           6 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

Device 1: "GeForce GT 120"
  CUDA Driver Version / Runtime Version          4.2 / 4.2
  CUDA Capability Major/Minor version number:    1.1
  Total amount of global memory:                 512 MBytes (536543232 bytes)
  ( 4) Multiprocessors x (  8) CUDA Cores/MP:    32 CUDA Cores
  GPU Clock rate:                                1400 MHz (1.40 GHz)
  Memory Clock rate:                             800 Mhz
  Memory Bus Width:                              128-bit
  Max Texture Dimension Size (x,y,z)             1D=(8192), 2D=(65536,32768), 3D=(2048,2048,2048)
  Max Layered Texture Size (dim) x layers        1D=(8192) x 512, 2D=(8192,8192) x 512
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  768
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             256 bytes
  Concurrent copy and execution:                 Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Concurrent kernel execution:                   No
  Alignment requirement for Surfaces:            Yes
  Device has ECC support enabled:                No
  Device is using TCC driver mode:               No
  Device supports Unified Addressing (UVA):      No
  Device PCI Bus ID / PCI location ID:           5 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 4.2, CUDA Runtime Version = 4.2, NumDevs = 2, Device = GeForce GTX 580, Device = GeForce GT 120
[deviceQuery] test results...
PASSED

> exiting in 3 seconds: 3...2...1...done!

None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 Mac OS X 10.7.4 上使用 OpenCL 禁用 Nvidia 看门狗 的相关文章

随机推荐

  • JPEG 颜色在不同浏览器中呈现不一致

    我正在使用的徽标在不同浏览器中的呈现方式有所不同 具体图片可查here https pbs twimg com profile images 741262755236356096 BqpBjB8R jpg and on 这个推特页面 htt
  • RecyclerView 中的单选

    我知道没有默认的选择方法RecyclerView类 但我尝试过以下方式 public void onBindViewHolder ViewHolder holder final int position holder mTextView s
  • 为 SharePoint 2010 Web 部件创建图表

    我已创建从 Web 部件到 Oracle 数据库的连接 其中包含日期和数字 我想在图表中显示这些数据 我在互联网上查找过任何示例 但我很困惑 任何人都可以向我指出一些简单的说明 详细说明如何在 C Sharp 中创建可在 Web 部件上使用
  • 在 ASP.NET MVC 中返回不同的视图同一控制器

    我想根据以下值将用户发送到两个不同页面之一isCustomerEligible 当该变量的值设置为 false 时 它 会调用 Index 但随后返回视图Customer而不是视图Index public ViewResult Index
  • textarea根据内容js或jquery设置高度

    这是我的代码 保持简单
  • 具有单变量优化的 NLopt

    任何人都知道 NLopt 是否适用于单变量优化 尝试运行以下代码 using NLopt function myfunc x grad x 2 end opt Opt LD MMA 1 min objective opt myfunc mi
  • 如何在 pytest 中测试类层次结构?

    我已经使用 pytest 一段时间了 并学会了喜欢参数化和固定装置 我第一次想测试一些具有分支继承结构的类 当然 我想为子类重用测试用例 假设我有以下包结构 mock pkg child py grandchild py parent py
  • EC2 增加大小后无法调整卷大小

    我已按照调整 EC2 卷大小的步骤进行操作 停止实例 拍摄当前卷的快照 在同一区域中从上一个快照创建了一个更大大小的新卷 从实例中分离旧卷 将新卷附加到同一安装点的实例 旧卷是 5GB 我创建的卷是 100GB 现在 当我重新启动实例并运行
  • C 中未声明的标识符

    我正在尝试在 Visual Studio 2012 Express 中用 C 语言编译一个小型银行程序 它向我显示了几乎所有变量的 未声明标识符 错误 以及 语法错误 缺少 在 类型 之前 请告诉我正确的语法 谢谢 include
  • 如何让文字显示5秒然后消失并显示按钮?

    我正在努力做到这一点 以便当您在我的问答游戏中得到正确答案时 它会摆脱您看到的大问题并说 干得好 5秒钟 然后返回到主菜单 其中随机有4个选定的问题 问题从 quizfile csv 加载并包含 What colour is elon mu
  • C#,Process.Start 隐藏?

    public static void Main string args SearchGoogle Test Console ReadKey true static void SearchGoogle string t Process Sta
  • ~/.R/Makevars 文件是什么/在哪里?

    我正在尝试安装包 glmnet 我收到此错误 ld warning directory not found for option L usr local gfortran lib gcc x86 64 apple darwin15 6 1
  • ORA-01722-无效号码

    我在包中有一个查询抛出错误 ORA 01722 无效号码 我尝试了很多方法但没有运气 select h column from table1 h table2 c where c created date 17 MAY 17 and nvl
  • 禁用进度输出 aws s3sync 而不禁用所有输出

    有什么办法可以禁用 Completed 1 of 12 part s with 11 file s remaining 进度输出aws s3 sync命令 来自 aws cli 工具 我知道有一个 quiet选项 但我不想使用它 因为我仍然
  • R包:写入内部数据,但不是一次全部写入

    我正在使用 R 包usethis devtools 该包中有一些我想保留在内部的对象 只是为了避免混乱 我使用的结构是根据源在不同文件中创建对象 所有这些都在我的data raw文件夹 例如 文件make laus codes R准备两个来
  • 使用 Spring MVC 4.0 Multipart 上传图像

    我正在尝试使用下面的代码在线上传图像 但是 由于某种原因 图像似乎没有在图像文件夹中创建 不确定 我在这里做错了什么 RequestMapping value add method RequestMethod POST public Str
  • 使用R中usmap包中的plot_usmap在同一张地图上绘制州和县边界

    我想创建一张显示州和县边界 即不同颜色的州边界 的美国地图 我通常使用导入或使用的形状文件来执行此操作ggplot2 s map data功能 然而 我面临三个障碍 1 我无法安装gdal and geos在我的计算环境中 以便排除使用任何
  • Xcode 项目文件未出现在项目导航器中

    这里有一个奇怪的问题 我的项目的 Swift 文件 Main Storyboard 附加图像 委托等文件在 Xcodes Project Navigator 中都丢失了 真正奇怪的是 项目构建得很好 我也可以从主编辑器窗口的顶部选择它们 即
  • 为什么 i2c_smbus 函数不可用? (I2C——嵌入式Linux)

    有很多参考使用i2c smbus 开发嵌入式 Linux 软件时在 I2C 总线上进行通信的函数 什么时候i2c smbus函数如i2c smbus read word data在软件项目中引用了 ARM8 处理器错误 例如 i2c smb
  • 在 Mac OS X 10.7.4 上使用 OpenCL 禁用 Nvidia 看门狗

    我有一个 OpenCL 程序 对于小问题运行良好 但是当运行较大的问题超过 Nvidia 硬件上运行内核的 8 10 秒时间限制时 虽然我没有将显示器连接到我正在计算的 GPU Nvidia GTX580 上 但一旦内核运行大约 8 10