Caffe解惑：为什么Caffe里头有mutable_cpu_data和cpu_data

2023-11-09

一开始看代码的时候会纳闷，为啥caffe里头又一个

cpu_data

还要有一个mutable_cpu_data

其实从字面就可以看出来这个mutable就是易变的意思啦。

二话不说翻出源代码看看究竟有啥区别:

const void* SyncedMemory::cpu_data() {
  to_cpu();
  return (const void*)cpu_ptr_;
}

void* SyncedMemory::mutable_cpu_data() {
  to_cpu();
  head_ = HEAD_AT_CPU;
  return cpu_ptr_;
}

他们之间就相差一个

head_ = HEAD_AT_CPU;

这是为什么呢？为啥需要这样做？

我想原因就是

当你想读取数据的时候请使用cpu_data

当然想修改数据的时候请你使用mutable_cpu_data。

这样就提示系统数据我改过啦，你要小心了的意思(我只知道数据一定在CPU上)。

另外还有一个 gpu_data和mutable_gpu_data，也是这样的原因。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CC

图像处理

源代码

CPU

GPU

Caffe解惑：为什么Caffe里头有mutable_cpu_data和cpu_data 的相关文章

Tensorflow：如何在模型训练过程中实时监控 GPU 性能？

我是 Ubuntu 和 GPU 新手最近在我们的实验室中使用了一台配备 Ubuntu 16 04 和 4 个 NVIDIA 1080ti GPU 的新 PC 该机还拥有i7 16核处理器我有一些基本问题为 GPU 安装 Tensorf
如何在C++中的cudaDeviceReset()之后重用tensorflow？

我正在使用 C 开发一个大型 CUDA 应用程序该应用程序运行各种模型需要完全释放所有 GPU 内存否则其他操作将失败我能够在关闭所有 tf 会话并运行 cudaDeviceReset 后释放所有内存但之后我无法运行任何新的张量流
有没有办法使用 GPU 调整图像大小？

有没有办法使用可通过 NET 应用程序使用的 GPU 图形卡调整图像大小我正在寻找一种极其高效的方法来调整图像大小并且听说 GPU 可以比 CPU 更快地完成此操作使用 C 的 GDI 是否有已知的实现或示例代码使用 GPU 来调整
CUDA素数生成

当数据大小增加超过 260k 时我的 CUDA 程序停止工作它不打印任何内容有人能告诉我为什么会发生这种情况吗这是我的第一个 CUDA 程序如果我想要更大的素数如何在 CUDA 上使用大于 long long int 的数据类型
CUDA 中的广义霍夫变换 - 如何加快分箱过程？

正如标题所示我正在对并行计算机视觉技术进行一些个人研究使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换我遇到的唯一问题是在投票过程中我调用atomicAdd 来防止多个同时写入操作但我似乎没有获得太多的性能效率我在网上搜索
什么是微编码指令？

我看过很多参考微编码指令的文献这些是什么以及为什么使用它们 CPU 读取机器代码并将其解码为内部控制信号将正确的数据发送到正确的执行单元大多数指令映射到一个内部操作并且可以直接解码例如在 x86 上 add eax edx只是将
哪种架构称为非均匀内存访问（NUMA）？

根据wiki http en wikipedia org wiki Non uniform memory access 非均匀内存访问 NUMA 是一种用于多处理的计算机内存设计其中内存访问时间取决于相对于处理器的内存位置但尚不清楚它是
DirectX 世界视图矩阵乘法 - GPU 或 CPU 的地方

我是 directx 的新手但令我惊讶的是我看到的大多数示例中世界矩阵和视图矩阵都是作为顶点着色器的一部分相乘而不是与 CPU 相乘并将结果传递给着色器对于刚性对象这意味着您为对象的每个顶点将相同的两个矩阵相乘一次我知道 GP
Tensorflow：docker 镜像和 -gpu 后缀

在具有 GPU 支持的 Tensorflow 的 Docker 映像中例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
普通的 x86 或 AMD PC 是直接从 ROM 运行启动/BIOS 代码，还是先将其复制到 RAM？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我知道现代计算机已经修改了哈佛架构它们可以从保存数据的地方以外的地方读取指令这一事实是否允许它们直接从 ROM 芯片获取指令他们是先
CPU是如何做减法的？

我有一些基本的疑问但每次我坐下来尝试面试问题时这些问题和我的疑问就会出现假设 A 5 B 2 假设A和B都是4字节那么CPU是怎么做的呢 A B添加我知道 A 的符号位 MSB 为 0 表示正值 B 的符号位为 1 表示负整数现
CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
错误：NVIDIA-SMI 失败，因为无法与 NVIDIA 驱动程序通信

NVIDIA SMI 抛出此错误 NVIDIA SMI 失败因为无法与 NVIDIA 通信司机确保安装了最新的 NVIDIA 驱动程序并且跑步我清除了 NVIDIA 并按照提到的步骤重新安装了它here https askubun
测量进程消耗的 CPU 时钟

我用 C 语言编写了一个程序它是作为研究结果创建的程序我想计算程序消耗的确切 CPU 周期精确的循环次数知道我怎样才能找到它吗 The valgrind tool cachegrind valgrind tool cachegrin
如何在GPU支持下运行python代码

我创建了一个 Flask 服务用于接受以相机 URL 作为参数的请求用于在相机框架中查找对象桌子椅子等我已经在 Flask 中编写了用于接受 POST 请求的代码 app route rest detectObjects meth
我们如何在每次运行时使用不同的种子在 CUDA C 中生成随机数？

我正在研究一个随机过程我想在每次运行程序时在 CUDA 内核中生成不同的系列随机数这类似于我们在 C 中声明种子时间空接下来是 srand 种子和兰特我可以通过内核将种子从主机传递到设备但是这样做的问题是我必须将整个种子
从 Java 内部限制 CPU

我在这个和其他论坛中看到了许多具有相同标题的问题但似乎没有一个问题能完全解决我的问题就是这个我有一个 JVM 它占用了托管它的机器上的所有 CPU 我想限制它但是我不能依赖任何限制工具技术external到 Java 因为我无
返回地址预测堆栈缓冲区与堆栈存储的返回地址？

一直在阅读 Agner Fog 的 Intel AMD 和 VIA CPU 的微架构他在第 34 页描述了返回地址预测 http www agner org optimize microarchitecture pdf http www
nvidia GPU 上的内核真的有超时吗？

寻找为什么我的内核产生奇怪的错误消息或仅 0 结果的答案我发现了这个answer https stackoverflow com questions 3988645 cl out of resources for 2 millions fl
如何使用Slurm访问集群中不同节点上的GPU？

我可以访问由 Slurm 运行的集群其中每个节点都有 4 个 GPU 我有一个需要 8 个 GPU 的代码那么问题是如何在每个节点只有 4 个 GPU 的集群上请求 8 个 GPU 这就是我尝试通过以下方式提交的工作sbatch bi

随机推荐

VirtualBox+WinDbg+Win7调试环境配置

VirtualBox WinDbg Win7调试环境配置火苗999 的博客 1 配置虚拟机串口如图勾选启用串口 gt 端口选择COM1 gt 端口模式选择主机管道 gt 勾选创建管道 gt 端口文件位置输入 pipe com1 2 配置
极简光线追踪入门

阅读本文不需要任何图形学基础这里抛砖引玉希望勾起读者对光线追踪的兴趣前言光线追踪原理简单并且可以抛开图形学的一堆理论单独提出来讲本文不需要任何图形学基础看完本文后将能够实现以下效果图1 光线追踪效果原理光线追踪算法由
linux文件夹大小4096,Linux文件系统之文件、分区大小限制

各种文件系统的限制 NTFS Windows 支持最大分区2TB 最大文件2TB FAT16 Windows 支持最大分区2GB 最大文件2GB FAT32 Windows 支持最大分区128GB 如果使用磁盘管理进行分区最大为32GB
Docker自定义network搭建kafka

昨天在搞spring cloud bus 想到用kafka实现消息总线然后就用docker起了一个zookeeper和kafka 本人docker版本是17 06 采用机器是Ubuntu18版本详细安装kafka的过程如下 1 dock
反病毒工具-VirtualKD

KD Kernel Debug 简介它是一款虚拟机辅助调试开源工具版本支持情况当前2 7版本支持Win8及以前系统官网 http virtualkd sysprogs org 当你需要高效地调试一台虚拟机你需要它双机调试的时候
VC中GDI绘图技术基础知识：hdc设备环境句柄，坐标系

VC中GDI绘图技术通过HDC设备环境句柄绘图有三种方式标准客户区绘图临时客户区绘图非客户区绘图 1 标准客户区绘图是在WM PAINT消息回调时执行调用BeginPaint函数 EndPaint函数 2 临时客户区绘图是在任
JSP+MVC开发模式 +EL表达式+ JSTL标签

今日内容 1 JSP 1 指令 2 注释 3 内置对象 2 MVC开发模式 3 EL表达式 4 JSTL标签 5 三层架构 JSP 1 指令作用用于配置JSP页面导入资源文件格式分类
ESP32 之 ESP-IDF 教学（十四）——虚拟文件系统（VFS）

本文章来自原创专栏 ESP32教学专栏基于ESP IDF 讲解如何使用 ESP IDF 构建 ESP32 程序发布文章并会持续为已发布文章添加新内容每篇文章都经过了精打细磨通过下方对话框进入专栏目录页 CSDN 请求进入目录 O
安卓上基于透明代理抓包

前言在安卓上基于透明代理对特定APP抓包中使用的是redsocks2 本文演示如何使用clash实现同样的效果你以为是Clash For Android 错这里使用的是Core版本就原理上来说和前一篇文章并无区别 Clash的优势
Linux网络协议栈(五) -- 数据包的发送（based in 2.6.32）

一关键数据结构对于输出封包设备的数据结构主要包括两个输出队列 queue 和输出队列规则 queue discipline 我们首先来看输出队列 2 6 18内核中无该结构体 struct netdev queue structne
谈谈App混合开发

混合开发的App Hybrid App 就是在一个App中内嵌一个轻量级的浏览器一部分原生的功能改为Html 5来开发这部分功能不仅能够在不升级App的情况下动态更新而且可以在Android或iOS的App上同时运行让用户的体验更好
技术人修炼之道阅读笔记（六）解决对抗性思维方法

技术人修炼之道阅读笔记六解决对抗性思维方法网上经常看见产品经理和开发人员的段子例如杀死一个开发人员不用枪只需要改三次需求技术人开会产品经理能安然无恙坐在这里是因为门外有保安等这些都说明了产品经理和开发人员的矛盾那么问
qt检查文件夹是否有写权限

Qt 使用如下函数能够判断路径或者文件是否可写 bool QFileInfo isWritable const 对于win10系统实测结果不准确继续排查官方文档描述 a 如果未启用 NTFS 权限检查 Windows 上的结果将仅反映
IDEA 程序包不存在,找不到符号但是明明存在对应的jar包的解决方案

注本人刚开始是使用 Settings gt Build gt Build Tools gt Maven gt Runner gt 勾选上Delegagte IDE build run actions to Maven 这种办法成功解决了
内核管理-之进程虚拟内存-基于linux3.10

关于启动过程内存管理见内存管理之启动关于内核空间内存管理见内存管理之内核内存管理如果需要内存管理五章整理成pdf了下载地址http download csdn net detail shichaog 8662135 进程的虚
hashmap 允许key重复吗_搞懂 HashMap，这一篇就够了

HashMap 概述如果你没有时间细抠本文可以直接看 HashMap 概述能让你对 HashMap 有个大致的了解 HashMap 是 Map 接口的实现 HashMap 允许空的 key value 键值对 HashMap 被认为是
Flutter页面关闭时Crash

Flutter页面关闭时Crash 问题描述项目中使用了Flutter的WebView组件来加载H5 关闭Activity时如果FLutter页面中包含 WebView 就会导致Crash 页面中如果没有WebView 则正常关闭 Fl
分布式一致性算法--Paxos

分布式一致性算法 Paxos 2017 08 31 10 15 0人阅读评论 0 收藏编辑删除分类 Paxos 1 分布式一致性算法 Paxos Paxos算法是莱斯利兰伯特 Leslie Lamport 1990年提出的一种基于
深入探索Android稳定性优化

前言成为一名优秀的Android开发需要一份完备的知识体系在这里让我们一起成长为自己所想的那样众所周知移动开发已经来到了后半场为了能够在众多开发者中脱颖而出我们需要对某一个领域有深入地研究与心得对于Android开发者来说
Caffe解惑：为什么Caffe里头有mutable_cpu_data和cpu_data

一开始看代码的时候会纳闷为啥caffe里头又一个 cpu data 还要有一个mutable cpu data 其实从字面就可以看出来这个mutable就是易变的意思啦二话不说翻出源代码看看究竟有啥区别 const void Synce

Caffe解惑：为什么Caffe里头有mutable_cpu_data和cpu_data

Caffe解惑：为什么Caffe里头有mutable_cpu_data和cpu_data 的相关文章

随机推荐

热门标签