有关 CUDA 中统一虚拟寻址 (UVA) 的信息/示例

2024-03-04

我试图理解 CUDA 中统一虚拟寻址(UVA)的概念。我有两个问题:

  1. 是否有任何示例(伪)代码可以演示这个概念?

  2. 我在 CUDA C 编程指南中读到 UVA 只能在 64 位操作系统上使用。为什么会这样呢?


A 统一虚拟地址空间 http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#unified-virtual-address-space将设备代码中使用的指针(值)和分配映射与主机代码中使用的指针(值)和分配映射组合到单个统一空间中。

1-是否有任何示例(伪)代码可以演示这个概念?

如何使用这一点的一个例子是使用cudaMemcpyDefault 传输类型说明符 http://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART__TYPES.html#group__CUDART__TYPES_1g18fa99055ee694244a270e4d5101e95b,代替cudaMemcpyDeviceToHost or cudaMemcpyHostToDevice in cudaMemcpy 运营 http://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART__MEMORY.html#group__CUDART__MEMORY_1g48efa06b81cc031b2aa6fdc2e9930741.

2-此外,我在编程指南中读到它仅与 64 位操作系统相关。为什么会这样呢?

32 位机器的最大可寻址空间为 4 GB。在现代 GPU(可能具有多个 GB 的内存)和现代 PC(可能具有多个 GB 的内存和 I/O 空间)中,这个空间不足以同时定义主机和设备内存空间。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

有关 CUDA 中统一虚拟寻址 (UVA) 的信息/示例 的相关文章

  • 具有 Cuda Thrust 的多个 GPU?

    如何将 Thrust 与多个 GPU 一起使用 这只是使用 cudaSetDevice deviceId 的问题吗 然后运行相关的 Thrust 代码 使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
  • CUDA:获取数组中的最大值及其索引

    我有几个块 每个块在整数数组的单独部分上执行 举个例子 块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么 示例块一 a 0 到 a 10 具有以下
  • 有没有好的 GLSL 哈希函数?

    所以我对这个问题的古老评论仍然得到了支持 GLSL rand 这一行代码的起源是什么 https stackoverflow com questions 12964279 whats the origin of this glsl rand
  • 在没有 SurfaceView 的 Android 上获取 GPU 信息

    在Android上 有没有一种方法可以在不创建SurfaceView的情况下获取GPU信息 我不想使用 OpenGL 绘制任何内容 但我只需要获取硬件信息 例如供应商 OpenGL ES 版本 可用扩展等 抱歉 我不知道如何在 Androi
  • Tensorflow:Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

    我正在从源安装tensorflow 文档 https www tensorflow org versions r0 10 get started os setup html installing from sources Cuda驱动版本
  • CUDA Thrust 的多 GPU 使用

    我想使用我的两张显卡通过 CUDA Thrust 进行计算 我有两张显卡 在单卡上运行对于两张卡都适用 即使我在 std vector 中存储两个 device vector 也是如此 如果我同时使用两张卡 循环中的第一个周期将起作用并且不
  • UnimplementedError:图形执行错误:在张量流上运行 nn

    我一直遇到这个错误 我不知道为什么 特别是因为我完全遵循某人的代码并且该人在运行此错误时没有错误 img shape 128 128 3 load pretrained model base model tf keras applicati
  • OpenCV 2.4.3rc 和 CUDA 4.2:“OpenCV 错误:没有 GPU 支持”

    我在这张专辑中上传了几张截图 https i stack imgur com TELST jpg https i stack imgur com TELST jpg 我正在尝试在 Visual Studio 2008 中的 OpenCV 中
  • C 中的 CUDA:如何使用 cudaMemcpyAsync 修复错误 11

    我目前正在尝试使用 CUDA 运行一个简单的多 GPU 程序 它的基本作用是将一个包含一些虚拟数据的大型数组复制到 GPU GPU 进行一些数学计算 然后将结果数组复制回来 我在 VS2017 的输出中没有收到任何错误 但我设置的一些错误消
  • CUDA 添加矩阵的行

    我试图将 4800x9600 矩阵的行加在一起 得到一个 1x9600 的矩阵 我所做的是将 4800x9600 分成 9 600 个矩阵 每个矩阵长度为 4800 然后我对 4800 个元素进行缩减 问题是 这真的很慢 有人有什么建议吗
  • CUDA 模型 - 什么是扭曲尺寸?

    最大工作组大小和扭曲大小之间有什么关系 假设我的设备有 240 个 CUDA 流处理器 SP 并返回以下信息 CL DEVICE MAX COMPUTE UNITS 30 CL DEVICE MAX WORK ITEM SIZES 512
  • 摆脱异步 cuda 流执行期间的忙等待

    我正在寻找一种方法 如何摆脱以下代码中主机线程中的忙等待 不要复制该代码 它仅显示我的问题的想法 它有许多基本错误 cudaStream t steams S N for int i 0 i lt S N i cudaStreamCreat
  • Cuda:最小二乘求解,速度较差

    最近 我使用Cuda编写了一个名为 正交匹配追踪 的算法 在我丑陋的 Cuda 代码中 整个迭代需要 60 秒 而 Eigen lib 只需 3 秒 在我的代码中 矩阵 A 是 640 1024 y 是 640 1 在每一步中 我从 A 中
  • 现代 GPU 上的纹理更改(和其他状态更改)成本

    我正在编写一个基于场景图的图形引擎用于建模目的 我正在使用 XNA 4 在我读过的许多地方 渲染期间应该最小化纹理变化 和其他状态变化 因此我必须按材质等对图元进行排序 我在 XNA 4 中创建了一个小型测试应用程序 它使用单个纹理渲染数百
  • 如何在没有 nvcc 的情况下在编译时获取 CUDA 工具包版本?

    我在 cpp 文件中对 cuSPARSE 库进行了一些调用 这些调用在旧工具包中不可用 为了支持使用旧工具包的系统 我想使用编译器指令编译不同的代码部分 特别是 我想使用旧工具包的 CSR 格式矩阵和新工具包的 BSR 格式矩阵来求解稀疏三
  • 完全禁用 NVCC 优化

    我正在尝试测量 GPU 上的峰值单精度触发器 为此我正在修改 PTX 文件以在寄存器上执行连续的 MAD 指令 不幸的是 编译器正在删除所有代码 因为它实际上没有做任何有用的事情 因为我没有执行任何数据的加载 存储 是否有编译器标志或编译指
  • CUDA 中的 JPEG 库

    我正在尝试在 CUDA 中压缩和解压缩图像 到目前为止我已经找到了这个库 http sourceforge net projects cuj2k source navbar http sourceforge net projects cuj
  • 如何降级cuda版本

    我目前使用的是 cuda 版本 4 2 但我需要将其更改为 3 1 是否可以卸载当前版本 4 2 版 然后安装以前的版本 3 1 版 编辑 请参阅我的操作系统是linux ubuntu 10 04 64位 编辑 我找到了如何获取 3 1 版
  • 如何从尖点库矩阵格式获取原始指针

    我需要从尖点库矩阵格式获取原始指针 例如 cusp coo matrix
  • 如何转储所有 NVCC 预处理器定义?

    我想达到同样的效果 gcc dM E lt dev null 如所描述的here https stackoverflow com q 2224334 1593077 但对于 nvcc 也就是说 我想转储所有 nvcc 的预处理器定义 唉 n

随机推荐

  • 如何从 PowerShell 在 Octopus Deploy 中设置系统变量值

    我试图在 运行脚本 步骤中为内置发行说明变量赋值 OctopusParameters Octopus Release Notes Some release notes 在下一步 发送电子邮件 中 我在电子邮件正文中使用此变量 但不幸的是它是
  • iOS应用程序不会死,退出后写入控制台并播放声音

    我的应用程序有某种僵尸问题 不是 NSZombie 问题 就像是死而复生的问题 我首先注意到 在调试会话之后 当我去跑步时 iPhone 上的音乐会每隔约 7 分钟暂停一次 当我解锁设备时 应用程序名称会在状态栏中闪烁红色 就好像它正在运行
  • 现代如何使用汇编(例如 C/C++)?

    我了解计算机如何按照基本原理工作 例如 可以用 C C 等 高级 语言编写程序 然后将其分解为目标代码 然后分解为二进制代码以供处理器理解 然而 我真的很想了解汇编 以及它如何在现代应用程序中使用 我知道处理器在基本 x86 指令集之上有不
  • 使用 python 进行动态时间扭曲(最终映射)

    我需要对齐两个声音信号 以便将一个声音信号映射到另一个声音信号 两个信号对应相同的行为 我尝试从以下位置实现 python 代码 https nipunbatra github io blog 2014 dtw html https nip
  • multipart/form-data 可以用 javascript 发送吗?

    我使用以下形式通过 POST 发送文件以及文本 名称
  • casper.js 中的 setInterval 和 this.wait

    我需要做一个循环每次迭代之间间隔 3 次 2 秒 我尝试了以下 3 个选项 Option 1 var casper require casper create verbose false logLevel debug casper star
  • 如何让 OpenCover 查看本地 bin\Debug 文件夹中的 PDB 而不是 GAC

    我正在使用 OpenCover 4 7 922 和 nUnit 控制台运行程序 3 10 0 我有一个myproj tests测试的项目myproj 建成后 myproj tests bin debug包含myproj tests dll
  • 调用soap webservice从带有轴的java客户端返回对象列表

    我对网络服务感到恼火 我有一个非常简单的肥皂网络服务 Remote public interface StudentService public String sayHello public List
  • 无法创建 MoveConstructibles 地图

    我有一堂课包含std unique ptr lt gt 我想把这个类的实例放在一个std map lt gt 我认为推动 C 引入移动语义的原因之一是可以将诸如unique ptrs在标准容器内 对于向量而言 这确实有效 但在我看来std
  • 用于安装/升级 .NET Core 的命令行

    是否有用于安装或升级 NET Core 的命令行命令 我使用以下命令检查我的计算机上是否安装了 NET Coredotnet version只是注意到我的计算机上仍然安装了预览版本 我想知道是否可以发出一些命令将其升级到最新版本 没有dot
  • 普通对象 VS 模型对象的类实例

    在 Angular TypeScript 中创建模型对象的最佳实践是什么 我应该使用带有对象表示法的类型注释 对象是Object E g let m MyModel name foo 我应该使用new运算符 对象是各自原型的实例 这两种方法
  • Git - 冲突(重命名/删除)是什么意思?

    我在理解其他问题中的含义方面没有取得多大成功 这是一个 Ruby on Rails 项目 如果您知道该怎么做 这可能非常简单 我尝试合并两个分支 这是结果的 部分 CONFLICT rename delete db migrate 2016
  • 如何找到预告片字典?

    浏览 PDF 规范 它说trailer之前的startxref 对我来说 这意味着xref可以出现在文档中的任何位置 但是trailer仍然出现在startxref 在您必须解析它之前 这是有意义的 因为您必须反向解析 您无法考虑注释或字符
  • 行分隔的 json 序列化和反序列化

    我正在使用 JSON NET 和 C 5 我需要将对象列表序列化 反序列化为行分隔的 json http en wikipedia org wiki Line Delimited JSON http en wikipedia org wik
  • Java中如何通过代理发送HTTPS请求?

    我正在尝试使用 HttpsUrlConnection 类向服务器发送请求 服务器存在证书问题 因此我设置了一个信任所有内容的 TrustManager 以及一个同样宽松的主机名验证器 当我直接发出请求时 这个管理器工作得很好 但当我通过代理
  • fputcsv 不会在 CSV 文件中写入任何数据

    在我的网站中 我从 mysql 数据创建一个表 然后现在我想在表底部添加一个导出按钮 以便用户能够将数据下载为 CSV 文件 为此 我编写了虚拟表单
  • preg 匹配重复或增量字符

    我使用 preg match 来验证密码 preg match 5 password 它也接受特殊字符 但由于某种原因 我需要修改它应该接受 仅限字母数字 至少 5 个字符长 非常重要的是它不能有任何重复或 增量字符 例如 aaaa 或 1
  • 对各个页面的不同图像使用 Backstretch

    我希望有人可以提供帮助 我正在尝试使用 jQuery Backstretch 为 Bootstrap Wordpress 中的每个特定页面应用不同的背景图像 例如 主页 bg 图像 a 关于 bg 图像 b 新闻 bg 图像 c 等等 我已
  • 在自定义验证器指令中注入 ngControl 会导致循环依赖

    我正在尝试创建自定义 Angular 2 验证器指令 它像这样注入 NgControl Directive selector ngModel customValidator providers provide NG VALIDATORS u
  • 有关 CUDA 中统一虚拟寻址 (UVA) 的信息/示例

    我试图理解 CUDA 中统一虚拟寻址 UVA 的概念 我有两个问题 是否有任何示例 伪 代码可以演示这个概念 我在 CUDA C 编程指南中读到 UVA 只能在 64 位操作系统上使用 为什么会这样呢 A 统一虚拟地址空间 http doc