是否可以在设备函数中调用cufft库调用?

2024-04-08

我在主机代码中使用 cuFFT 库调用,它们工作正常,但我想从内核调用 cuFFT 库。早期版本的 CUDA 没有这种支持,但是有了动态并行性,这可能吗?

如果有任何关于如何实现这一目标的示例,那就太好了。


尽管在 Kepler (cc 3.5) 卡上引入了动态并行性,但 cuFFT 仍然是一个主机 API,目前无法使用 cuFFT 在设备代码中创建或执行 FFT 运算。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

是否可以在设备函数中调用cufft库调用? 的相关文章

  • 在 cudaFree() 之前需要 cudaDeviceSynchronize() 吗?

    CUDA 版本 10 1 帕斯卡 GPU 所有命令都发送到默认流 void ptr cudaMalloc ptr launch kernel lt lt lt gt gt gt ptr cudaDeviceSynchronize Is th
  • CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

    与 CUDA 的任何事情一样 最基本的事情有时也是最难的 所以 我只想将变量从 CPU 复制到 GPUconstant变量 我很难过 这就是我所拥有的 constant int contadorlinhasx d int main int
  • 如何使用 CUDA/Thrust 对两个数组/向量根据其中一个数组中的值进行排序

    这是一个关于编程的概念问题 总而言之 我有两个数组 向量 我需要对一个数组 向量进行排序 并将更改传播到另一个数组 向量中 这样 如果我对 arrayOne 进行排序 则对于排序中的每个交换 arrayTwo 也会发生同样的情况 现在 我知
  • 内联 PTX 汇编代码强大吗?

    我看到一些代码示例 人们在 C 代码中使用内联 PTX 汇编代码 CUDA工具包中的文档提到PTX很强大 为什么会这样呢 如果我们在 C 代码中使用这样的代码 我们会得到什么好处 内联 PTX 使您可以访问未通过 CUDA 内在函数公开的指
  • 无法初始化 NVML:几个小时后 Docker 中出现未知错误

    我遇到有趣而奇怪的问题 当我使用 GPU 启动 docker 容器时 它工作正常 并且我看到 docker 中的所有 GPU 然而 几个小时或几天后 我无法在docker中使用GPU 当我做nvidia smi在泊坞窗机器中 我看到这条消息
  • 大型跨平台软件项目的技巧/资源

    我将开始一个大型软件项目 涉及跨平台 GUI 和大量的数字运算 我计划用 C 和 CUDA 编写大部分应用程序后端 并用 Qt4 编写 GUI 我计划使用 Make 作为我的构建系统 这将是一个只有两名开发人员的项目 一旦我相对深入地了解它
  • CUDA:获取数组中的最大值及其索引

    我有几个块 每个块在整数数组的单独部分上执行 举个例子 块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么 示例块一 a 0 到 a 10 具有以下
  • 有条件减少 CUDA

    我需要总结一下100000值存储在数组中 但带有条件 有没有办法在 CUDA 中做到这一点以快速产生结果 任何人都可以发布一个小代码来做到这一点吗 我认为 要执行条件约简 您可以直接将条件引入为乘法0 假 或1 真 加数 换句话说 假设您希
  • 云或烟雾的粒子系统

    我正在尝试使用 OpenGL 和 CUDA 制作一个简单的用于云和烟雾模拟的粒子系统 如何使粒子系统中的粒子表现得像真正的云或烟雾在低湍流风中的表现 我现在遇到的一些问题是 颗粒聚集成一个大球 粒子扩散到无限远 粒子突然弹射离开 我已经完成
  • CUDA NSight 未随 Windows 8 上的 CUDA 5.0 安装文件一起安装? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 据我所知 Nvidia 网站上没有 Nsight Eclipse 的下载链接 它说它将由 CUDA 5 安装本机安装 但并没有随CUDA安装一起安装
  • CUDA 模型 - 什么是扭曲尺寸?

    最大工作组大小和扭曲大小之间有什么关系 假设我的设备有 240 个 CUDA 流处理器 SP 并返回以下信息 CL DEVICE MAX COMPUTE UNITS 30 CL DEVICE MAX WORK ITEM SIZES 512
  • 摆脱异步 cuda 流执行期间的忙等待

    我正在寻找一种方法 如何摆脱以下代码中主机线程中的忙等待 不要复制该代码 它仅显示我的问题的想法 它有许多基本错误 cudaStream t steams S N for int i 0 i lt S N i cudaStreamCreat
  • 使用 cudamalloc()。为什么是双指针?

    我目前正在浏览有关的教程示例http code google com p stanford cs193g sp2010 http code google com p stanford cs193g sp2010 学习CUDA 演示的代码 g
  • 在 Cuda 中简单添加两个 int,结果始终相同

    我开始了学习Cuda的旅程 我正在玩一些 hello world 类型的 cuda 代码 但它不起作用 我不知道为什么 代码非常简单 取两个整数并将它们添加到 GPU 上并返回结果 但无论我将数字更改为什么 我都会得到相同的结果 如果数学那
  • 直接在主机上访问设备向量元素的最快方法

    我请您参考以下页面http code google com p thrust wiki QuickStartGuide Vectors http code google com p thrust wiki QuickStartGuide V
  • CUDA-Kernel 应该根据块大小动态崩溃

    我想做稀疏矩阵 密集向量乘法 假设用于压缩矩阵中条目的唯一存储格式是压缩行存储 CRS 我的内核如下所示 global void krnlSpMVmul1 float data mat int num nonzeroes unsigned
  • 布尔实现的atomicCAS

    我想弄清楚是否存在错误答案 https stackoverflow com a 57444538 11248508 现已删除 关于Cuda like的实现atomicCAS for bool是 答案中的代码 重新格式化 static inl
  • 如何从C++头文件调用CUDA文件?

    我知道从 c 文件调用 cu 文件的方法 但现在我想从 C 头文件调用 cu 文件 有可能做到吗 如果是这样 我应该如何设置我的项目 请帮忙 这是一个有效的例子 file1 h int hello file2 h include
  • CUDA 中的 JPEG 库

    我正在尝试在 CUDA 中压缩和解压缩图像 到目前为止我已经找到了这个库 http sourceforge net projects cuj2k source navbar http sourceforge net projects cuj
  • 了解流式多处理器 (SM) 和流式处理器 (SP)

    我正在尝试了解 GPU 的基本架构 我已经阅读了很多材料 包括这个非常好的答案 https stackoverflow com a 2213744 2386113 但我仍然很困惑 无法得到一个好的图片 我的理解 GPU 包含两个或多个流式多

随机推荐

  • 将 pybind11 与调用外部函数的动态库链接时出现未定义符号错误

    我正在尝试将 pybind11 模块与 so动态库 并且该库调用未在动态库中实现的函数 so文件 它在普通的 C 可执行文件中工作正常 但会引发Undefined Symbolpython导入时出错 这是一个简单的演示来重现我的问题 功能S
  • 在nodejs中,如何检查端口是否正在侦听或正在使用

    我在这里会非常具体 希望了解这一点的人可以编辑以重新表述一般情况 目前 当您运行 node debug 时 它会生成一个进程来侦听端口 5858 然后在父进程中尝试连接到该端口 但是 如果您正在运行另一个 节点调试 会话 则当前 节点调试
  • 在react-router 2中以编程方式重定向到页面

    我在用反应路由器 2 我想在成功登录或执行某些操作后以编程方式重定向到页面 我的路线文件是这样的 路线 js
  • Python 3.5 - Selenium - 如何处理新窗口并等待它完全加载?

    我正在做浏览器自动化 并且在某个时刻被阻止 此刻 我要求浏览器单击一个按钮 该按钮又打开一个新窗口 但有时互联网太慢 因此这个新窗口需要一些时间来加载 我想知道如何让 Selenium 等待这个新窗口完全加载 这是我的代码 driver s
  • 为什么 Java 客户端在运行时需要 WSDL?

    为 Java WS 客户端生成工件后 为什么需要 wsdllocation 参考 为什么运行时需要 WSDL 我可能会看到一些验证的原因 但这不应该是可选的吗 简介 虽然从设计角度来看 WSDL 对于 Web 服务客户端来说并不是必需的 但
  • Django:定义反向ForeignKey的名称

    我有两个模型 class Foo models Model foo field class Bar models Model foo models ForeignKey Foo on delete models CASCADE bar fi
  • 如何在没有实现任何模式的情况下操纵控件?

    我正在尝试通过实施自动化测试UIAutomation对于我们的项目 但许多控件不是标准的 并且也没有为这些控件实现适当的模式 我应该如何通过操作控件UI自动化框架在这种情况下 例如 我们产品中的按钮是通过 Pane 实现的 并且调用的模式也
  • .NET CLR 线程池耗尽 - 实现错误?

    我编写了一个简单的基于异步的负载测试库 它还有一个控制台界面可以从命令行进行测试 基本上 它同时运行大量请求 聚合它们 并显示摘要和简单的直方图 没有什么花哨 但我在本地系统中运行了大量测试 因此我想确保测试工具能够使用尽可能少的资源来获得
  • 如何从 64 位 .NET 应用程序打开 WOW64 注册表项

    我的 NET 应用程序 任何 CPU 需要读取 32 位程序创建的注册表值 在 64 位 Windows 上 它位于注册表中的 Wow6432Node 项下 我读到您不应该对 Wow6432Node 进行硬编码 那么使用 NET 访问它的正
  • 如何根据条件创建一个可以是多个字符串之一的常量?

    我想要不断地使用let这可能是几个值之一 例如 if condition1 constant hi else if condition2 constant hello else if condition3 constant hey else
  • 如何在Python中从邻接列表中选择子矩阵?

    我有一个邻接列表 其中每个数组代表该行的非零列 例如 下面的 adj 列表中的第 0 个数组意味着第 2 列和第 6 列为 1 其他所有列均为 0 adj list 2 6 1 3 24 2 4 3 5 21 4 6 10 1 5 7 6
  • 如何检测离子含量是否有滚动条?

    我想在离子内容上有或没有滚动条时隐藏或显示元素 更具体地说 我想在没有滚动条时显示一个按钮 在列表中加载更多项目 并在有滚动条的地方隐藏它 因此更多项目的加载是由 ion infinite scroll 完成的 我的 Ionic 应用程序也
  • 1 个节点存在 pod 在 kubernetes 集群中无法容忍的污点

    今天我的 kubernetes 集群 v1 15 2 给我这个错误 1 node s had taints that the pod didn t tolerate并且 Pod 无法启动 它告诉我一个节点有污点 我检查节点状态并且工作正常
  • 使用浏览器缓存进行增量更新

    客户端 AngularJS 应用程序 从服务器获取相当大的列表 列表可能有数百或数千个元素 这可能意味着未压缩的几兆字节 并且一些用户 管理员 获得更多数据 我不打算让客户端获得部分结果 因为排序和过滤不应该打扰服务器 压缩效果很好 大约为
  • 无法在 openpyxl 中保存 Excel 电子表格 - Python

    当我在 openpyxl 中时 我无法保存正在处理的活动文件 wb obj load workbook filename C Users timde PycharmProjects starshipit test xlsx read onl
  • nginx 和 apache2 上的 WordPress 重定向太多

    我刚刚在 ubuntu 14 04 LTS 上安装了 wordpress Nginx 充当 apache2 的反向代理 wp admin 工作正常 但我无法打开主页 Nginx 服务器代码 server listen 80 root var
  • INNER JOIN ON 与 WHERE 子句

    为简单起见 假设所有相关字段都是NOT NULL 你可以做 SELECT table1 this table2 that table2 somethingelse FROM table1 table2 WHERE table1 foreig
  • 如何重用所有场景的标题部分?

    我想重复使用header全部部分view controller scene header 部分表示绿色视图和标签 AMAR LIFE Here is my may 1st view controller scene 这是我的第一个视图控制器
  • R闪亮的分层下拉列表

    我们需要在 R闪亮中创建一个分层下拉列表 该列表至少有 3 个级别 您能帮我确定正确的库吗 请参考下面的图片供您参考 目前我们正在使用下面的代码 但是我们在下拉列表中得到了不正确的列 ui R library shiny library s
  • 是否可以在设备函数中调用cufft库调用?

    我在主机代码中使用 cuFFT 库调用 它们工作正常 但我想从内核调用 cuFFT 库 早期版本的 CUDA 没有这种支持 但是有了动态并行性 这可能吗 如果有任何关于如何实现这一目标的示例 那就太好了 尽管在 Kepler cc 3 5