为什么我收到有关 cudaMemcpyToArray(...) 已弃用的警告？

2024-02-29

这个警告是什么？我该如何解决它？

warning: ‘cudaError_t cudaMemcpyToArray(cudaArray_t, size_t, size_t, const void*, size_t, cudaMemcpyKind)’ is deprecated [-Wdeprecated-declarations]

已弃用意味着不建议使用，并且下一个 CUDA 版本中可能会取消对它的支持.

给出了如何处理的描述here https://forums.developer.nvidia.com/t/cudamemcpytoarray-is-deprecated/71385/10.

对于将整个分配从主机复制到设备的典型用法，并且源（主机）分配是宽度的平坦（无间距）分配w按高度排列的元素h行，也许是这样的：

cudaMemcpyToArray(dst, 0, 0, src, h*w*sizeof(src[0]), cudaMemcpyHostToDevice)

您可以将其替换为：

cudaMemcpy2DToArray(dst, 0, 0, src, w*sizeof(src[0]) , w*sizeof(src[0]), h, cudaMemcpyHostToDevice);

替换 API (cudaMemcpy2DToArray）已记录在案here https://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART__MEMORY.html#group__CUDART__MEMORY_1g9509226164aaa58baf0c5b8ed165df58.

请注意，在我给出的示例中，如果您没有意识到由行和列组成的“2D”分配，而是有一个单一的平面分配（比方说）w元素，您可以简单地设置h=1在上面的公式中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

compilerwarnings

为什么我收到有关 cudaMemcpyToArray(...) 已弃用的警告？的相关文章

f951 错误：无法识别的命令行选项

我在linux上正在编译以下内容 mpif90 shared source F90 object1 o object2 o L some path Qoption link rpath some path I some path lhdf
cuda-gdb 错误消息

我尝试使用 cuda gdb 调试我的 CUDA 应用程序但遇到了一些奇怪的错误我设置了选项 g G O0构建我的应用程序我可以在没有 cuda gdb 的情况下运行我的程序但没有得到正确的结果因此我决定使用 cuda gdb 但
PyInstaller 是否包含 CUDA

我正在开发一个Python脚本我使用Python 3 7 3 它使用tensorflow gpu 1 14 0 并使用PyInstaller 3 5将此脚本转换为可执行文件我使用的是 CUDA 10 0 和 cuDNN 7 6 1 我的
Bank 在字长方面存在冲突

我读过一些关于共享内存的好文章但我对银行冲突有初步疑问据说如果线程 1 和线程 2 从存储体 0 访问字 0 则不存在存储体冲突但如果他们访问不同的单词就会出现银行冲突但我的问题是不同的单词如何可以驻留在一个银行中由于bank
为什么 cuCtxCreate 返回旧上下文？

我已经安装了 CUDA SDK 4 2 64 CUDA工具包4 2 64 CUDA 驱动程序 4 2 64 我检查了 windows 中的每个 nvcuda dll 所有这些都是 4 2 版本但是当我使用驱动程序 api 创建上下文并使用
用于计算邻居列表的最佳 GPU 算法

给定 3D 中数千个点的集合我需要获取落在某个截止值以欧几里得距离而言内的每个粒子的邻居列表并且如果可能的话从最近到最远排序在 CUDA 或 OpenCL 语言中哪种 GPU 算法最快我所知道的最快的 GPU MD 代码之一
CUDA 8 编译错误 -std=gnu++11

我正在尝试转换一些代码以使用 CUDA 并且我认为我遇到了兼容性问题我们使用CMake 这些是我使用的 gcc 和 CUDA 版本 gcc version gcc Ubuntu 5 4 0 6ubuntu1 16 04 5 5 4 0 2
CUDA 添加矩阵的行

我试图将 4800x9600 矩阵的行加在一起得到一个 1x9600 的矩阵我所做的是将 4800x9600 分成 9 600 个矩阵每个矩阵长度为 4800 然后我对 4800 个元素进行缩减问题是这真的很慢有人有什么建议吗
在 CUDA 中的设备内存上分配 2D 数组

如何在 Cuda 中的设备内存中分配和传输往返于主机 2D 数组我找到了解决这个问题的方法我不必展平阵列内置的cudaMallocPitch 函数完成了这项工作我可以使用以下命令将阵列传输到设备或从设备传输阵列cudaMemcpy
Gitlab-CI：有条件的allow_failure

我最近开始为我的代码实现自动测试我注意到 CI 没有捕获编译器的警告即使有警告测试也显示为成功我最初为编译器添加了一个标志将警告转化为错误allow failure True 但问题是编译器在第一个警告 gt 错误时停止并没有完
为什么 cudaGLSetGLDevice 失败，即使它是在 main 函数的第一行中调用的

我想使用 OpenGL 和 CUDA 之间的互操作性我知道正如一些教程所说第一步是选择设备但是当我在主函数的第一行中调用 cudaGLSetGLDevice 0 时程序退出并显示信息 cudaSafeCall 运行时 API 错
将内核链接到 PTX 函数

我可以使用 PTX 文件中包含的 PTX 函数作为外部设备函数将其链接到另一个应调用该函数的 cu 文件吗这是另一个问题CUDA 将内核链接在一起 https stackoverflow com questions 20636800 c
CUDA 和 Eigen 的成员“已声明”错误

我只是 CUDA 和 Nsight 的初学者希望利用出色的 GPU 性能进行线性代数运算例如 CUBLAS 我在以下人员的帮助下编写了很多自定义代码Eigen http eigen tuxfamily org index php tit
编译Linux内核模块时出现错误：“CONFIG_X86_X32已启用，但没有binutils支持”和不需要的“n”字符

我想得到Rasta Ring0 调试器 http rr0d droids corp org 在我的 x86 64 Linux 中编译的 0 3 版本它是一个 Linux 内核模块我已将 32 位内联汇编替换为 64 位汇编如我的问题中
CUDA-Kernel 应该根据块大小动态崩溃

我想做稀疏矩阵密集向量乘法假设用于压缩矩阵中条目的唯一存储格式是压缩行存储 CRS 我的内核如下所示 global void krnlSpMVmul1 float data mat int num nonzeroes unsigned
布尔实现的atomicCAS

我想弄清楚是否存在错误答案 https stackoverflow com a 57444538 11248508 现已删除关于Cuda like的实现atomicCAS for bool是答案中的代码重新格式化 static inl
如何从C++头文件调用CUDA文件？

我知道从 c 文件调用 cu 文件的方法但现在我想从 C 头文件调用 cu 文件有可能做到吗如果是这样我应该如何设置我的项目请帮忙这是一个有效的例子 file1 h int hello file2 h include
CUDA 代码会损坏 GPU 吗？

在测试包含内存错误的 CUDA 时我的屏幕被冻结了重新启动后我无法再检测到显卡我的代码是否有可能物理损坏该卡这发生在 Ubuntu 14 04 下我不知道该卡的型号因为我无法检测到它但我记得它是一张相当新的卡感谢所有的评论我
一维纹理内存访问比一维全局内存访问更快吗？

我正在测量标准纹理和 1Dtexture 内存访问之间的差异为此我创建了两个内核 global void texture1D float doarray int size int index calculate each thread
为什么 CUDA 内存复制速度会这样，有一些恒定的驱动程序开销？

在我的旧 GeForce 8800GT 上使用 CUDA 内存时我总是会遇到奇怪的 0 04 毫秒开销我需要将 1 2K 传输到设备的常量内存中处理其中的数据并从设备中仅获取一个浮点值我有一个使用 GPU 计算的典型代码 alloc

随机推荐

在Python中使用lambda表达式在循环内生成函数[重复]

这个问题在这里已经有答案了如果我制作两个函数列表 def makeFun i return lambda i a makeFun i for i in range 10 b lambda i for i in range 10 为什么要列
空合并运算符的右结合如何表现？

空合并运算符是右结合的这意味着以下形式的表达式第一的第二第三被评估为第一的第二个第三个根据上述规则我认为以下翻译是不正确的 From Address contact user ContactAddress if cont
MSBuild 运行单元测试

我正在尝试配置 CruiseControl net 以定期构建我们的存储库代码并运行解决方案中包含的测试我已经配置了从 svn 服务器和构建部分检索代码但我无法对其进行测试 MSBuild 一直在抱怨这一点错误 MSB4057 目标
读取特定 Parquet 列时，将读取所有列而不是 Parquet-Sql 中给出的单个列

我在 Parquet Documentation 中读到只有我查询的列才会读取并处理该列的数据但是当我看到 Spark UI 时我发现完整的文件已被读取以下是编写 parquet 文件并在 Spark Sql 中读取的代码 obj
具有多索引的 df.at 与 df.loc

我有一个关于之间差异的问题df loc and df at关于具有多重索引的数据帧我一直在 stackoverflow 上查看一些精彩的资源但它似乎并没有阐明我的问题尤其是这个熊猫 at 与 loc https stackoverf
libcurl 中是否有可用的压缩

我需要使用 libcurl 和 C 将一个大文件从本地计算机传输到远程计算机 libcurl 是否有内置可用的压缩选项由于要传输的数据很大大小为 100 MB 到 1 GB 如果 libcurl 本身提供此类选项会更好我知道我们可以压
如何在 Python/ElementTree 中输出 XML 声明

我正在尝试为 XML 格式的单词参考源文件创建一个 XML 文件当我写入文件时仅显示 xml decation True 但我想要它的形式 from xml etree ElementTree import ElementTree fr
PHP 如果“id”为 null 则移动到 url

需要以下代码的帮助我有一个提供 id 的表单提交时下一个脚本从数据库获取数据如果由于某种原因 id 为零我如何将网址转发到我的 404 页面 Code id GET id include dbconnection php inclu
C++ 结构“placement new”有什么用途？

我刚刚了解了名为 placement new 的 C 结构它允许您精确控制指针在内存中指向的位置它看起来像这样 include
EF插入多个相关表

我正在尝试使用 Linq Entity Framework 将数据从 C 应用程序保存到数据库中插入到单个表很简单但我不知道如何将数据插入到三个表中这三个表都通过自增标识互连这是为了刮擦所以我正在拿一个线程及其所有帖子每个话题标
HtmlButton 处理程序在单击时触发两次（当 AutoEventWireup="True" 时）

我有一个 html 按钮见下文当单击并且 AutoEventWireup true 时 Save Click 单击处理程序将被触发两次当 AutoEventWireup False 时它会触发一次为什么会发射两次该按钮没有注册两
JS 编译过程中的参考错误与语法错误

我正在对解释与编译进行一些研究成立本文 https almogad medium com javascript is it compiled or interpreted 9779278468fc其中指出 console log Hell
请求模块抛出 OpenSSL.SSL.Error

我正在使用来自的 REST API泛欧交易所网站 http www euronext com 要进一步我需要验证服务器证书并通过模块请求发送我自己的客户端证书我已经用curl做了一些测试 crt pem文件都被接受了但请求仍然抛出 D
QTextDocument、QPdfWriter - 如何缩放输出

我创建了一个QTextDocument里面有一张桌子现在我尝试使用将其渲染为 PDF 格式QPdfWriter Qt 5 2 1 我就是这样做的 QPdfWriter pdfWriter output QPainter painter p
为什么这段代码可以在 Python 3.6 上运行，但不能在 Python 3.7 上运行？

In script py def f n memo 0 0 1 1 if n not in memo memo n sum f n i for i in 1 2 return memo n print f 400 python3 6 scr
有没有办法检查本机 Javascript 函数是否经过猴子修补？

例如我在某个网站上加载了一个脚本我想知道 JSON parse stringify 是否没有经过猴子修补我注意到如果我在 Chrome FF 中的函数上使用 toString JSON stringify toString 然后我回来
在 coefplot 中仅绘制交互项

在 Stata 中进行回归后我尝试仅绘制交互项的系数我无法使用社区贡献的命令coefplot 这是一个可重现的示例和我尝试的解决方案 sysuse auto clear reg price foreign i turn foreign
是否可以在 gcc pure C 中取消 const typeof ？

我有一个宏它使用 GCC 的 typeof 创建与宏参数相同类型的变量问题是如果这个论点有const类型在宏内部创建的变量是const我无法使用它例如 include
Extjs 4：创建 iFrame 窗口

我需要在 Extjs 中创建一个 iFrame 窗口以前在 ExtJS 3 x 中我会这样做 bodyCfg tag iframe But the WindowExtJS 4 的类似乎没有 bodyCfg 关于如何制作 iFrame Ex
为什么我收到有关 cudaMemcpyToArray(...) 已弃用的警告？

这个警告是什么我该如何解决它 warning cudaError t cudaMemcpyToArray cudaArray t size t size t const void size t cudaMemcpyKind is depr

为什么我收到有关 cudaMemcpyToArray(...) 已弃用的警告？

为什么我收到有关 cudaMemcpyToArray(...) 已弃用的警告？ 的相关文章

随机推荐

热门标签

为什么我收到有关 cudaMemcpyToArray(...) 已弃用的警告？的相关文章