【模型压缩】实例分析量化原理

2023-05-16

1.从定点模型训练来分析量化原理：

定点模型训练是一个迁移训练的过程：在浮点网络的相应位置插入定点化处理节点（相

当于激活函数），然后在这个经过定点化的计算图上重新训练神经网络。以全连接层为例，定点模型训练函数会根据 Layer 类型的 Dense 层构建一个 TensorFlow的 dense 层（由 MatMul 和 Add 两个 OP 构成），并且在 MatMul 操作的输入、Add 操作的输出、权重张量和 MatMul 之间、偏置张量和 Add 之间增加定点化处理节点。

解析：公式Q的输入为；X（数据输入，输出，权值值，偏置值），以及统计的（或者人为设置的）最大值和最小值，其目的是将权值偏置训练迭代的结果限制在特定范围内，以减小量化损失。

公式中bitwidth(是要量化的位数16位或者8位)， 如果要量化8位，那么根据以上描述

∇=2frac =xmax*128-1-1 ，当xmax确定即可求出frac，然后Q公式即可正常计算，Q=∇*floor 中floor 就是量化的结果，再次乘以∇ 就是恢复到了浮点值来完成正常的浮点训练（即定点训练只是将网络的进行了定点的限制），当量化网络的整形结果输出时也可通过乘以当前层的∇来得到正常的浮点值。

2.以libfacedetection实例分析

本实例并未进行定点训练，直接将浮点训练结果进行了定点化，但推理部分与上面原理和操作是一致的。

（1）将浮点权值转化为整形值，保存scale值，相当于∇

保存权值和scale值

（2）根据定点原理重写推理算法，首先重写整形矩阵运算，然后利用指令集加速

关于scale的传递，卷积为输入和权值的相乘，池化的输出等于输入

两外relu激活函数的scale需要重新求得，同样向下传递：

（3）定点转浮点的算子，将最终结果转成浮点

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【模型压缩】实例分析量化原理的相关文章

Go语言学习之读文件

三种方式读取文件 span class token keyword package span main span class token keyword import span span class token punctuation sp
include_directories和target_include_directories

1 作用 xff1a 给源文件添加头文件搜索路径 xff1a 将指定目录添加到编译器的头文件搜索路径之下 xff0c 指定的目录被解释成当前源码路径的相对路径 2 差别 xff1a 2 1 include directories xff1a
CMAKE常用内置变量解释：CMAKE_SOURCE_DIR/EXECUTABLE_OUTPUT_PATH/CMAKE_EXPORT_COMPILE_COMMANDS

前言 xff1a cmake的内置命令是不区分大小写的因此add subdirectory与ADD SUBDIRECTORY作用一致 cmake的所有变量都是区分大小写的 1 PROJECT SOURCE DIR 与 PROJECT BI
C++文件读写类介绍

一现有的文件读写方案方案一 xff1a 采用C 43 43 标准库读写该库拥有输入输出模板类及两个标准实例化集 xff1a 一个是用于操作char类型元素的实例化集即常用的cin xff0c cout等 xff0c 另一个用于操作w
自定义target命令：add_custom_target

一前置知识 1 CMake中一切都是基于target的 xff0c 如add library会产生一个library的target xff0c add executable会产生一个exe的target 2 以上命令生成的target放在
软件设计原则：迪米特法则

一定义迪米特法则 xff1a 要求一个对象应该对其他对象有最少的了解 xff0c 所以又叫做最少知识原则二法则内容 xff1a 1 不该有直接依赖关系的类之间 xff0c 不要有依赖 xff1a 即 xff0c 不和陌生人说话 xf
ElasticSearch最佳入门实践（六十二）type底层数据结构

type xff0c 是一个index中用来区分类似的数据的 xff0c 类似的数据 xff0c 但是可能有不同的fields xff0c 而且有不同的属性来控制索引建立分词器 field的value xff0c 在底层的lucene中建
四轴的组成及参数评定

电气工程及其自动化专业 xff0c 坐标广东湛江 xff0c 大一时期对专业上很感兴趣 xff0c 自学了许多东西 xff0c 但是只是停留在理论基础上而缺乏实践 xff0c 和学校在这方面的普及有点关系吧 xff0c 趁着国家有这方面的支
sudo rosdep init报错的解决方式

Ubuntu16 04下安装ROS时 xff0c 执行到sudo rosdep init这一步时会遇到问题 xff0c 如下图所示 xff1a 尝试了很多办法 xff0c 都没有成功的后来参考了https www ioiox com ar
VS版本和VC版本的对应【完整版】

看到网上杂七杂八 xff0c 很乱 xff0c 索性自己发帖多版本开发福音 xff08 该帖不更新了 xff0c 请看参考里连接中的官方文档 xff0c 非常清楚 xff0c 还保持最新 xff09 MSC 1 0 MSC VER 61 6
搭建运行激光slam环境中遇到的问题

1 先是踩了一些坑 xff0c 重复安装了一些库 xff0c 因为ros noetic里面就自带了一些库 xff0c 所以安装的时候重复安装了解决方法 xff1a 删掉重装另外缺少一些库 xff0c 乱装一顿 xff0c 居然凑齐 Ub
mac上用VSCode搭建 c++ 工程，用于学习Opengl

先下载VSCode安装c c 43 43 插件 xff0c 安装微软这个创建一个文件夹作为项目 xff0c 然后用VSCode打开这个目录在这个文件夹中创建好四个目录 xff0c 分别是src xff0c lib include bin
刷赞与评论

网站自动刷帖 xff0c 刷赞 xff0c 刷评论等网络推广方式的基本实现里面的思路有东西
系统复制-快速重装系统

ubuntu 直接把安装好常用软件和环境的系统打包成镜像 xff0c 用systemback安装 xff0c 便捷很多之前那种 xff0c ubuntu安装都要好久 xff0c 少说也得20分钟吧 xff0c 之前就是等 xff0c 等它
机器人控制领域

机器人控制领域好像没太有很新很有用的工作 xff0c 还是依据Dynamic Model的Motion Planning更接近于任务层其实 xff0c 感觉自己喜欢的不是控制而是motion xff0c motion control
树莓派电压过低串口数据错误增多

调试过程中 xff0c 树莓派串口读单片机上传的数据的程序突然一堆checksum error 换一块满电的LiPo电池就大幅减少了报错一开始猜测原因可能是电压过低导致CPU运行慢了 xff08 可能叫做降频 xff09 xff0c
机器人知识体系

纲机电力算控感知识体系体系各元素特点体系的建立和完善机电力算控感知识体系机械电子电气力学 xff08 静力学与动力学分析流体力学材料力学等 xff09 计算 xff08 通用计算机和嵌入式计算机 xff09 控制理论感知
OpenCV之imwrite()等基本操作

参考 xff1a Opencv之imwrite 函数的用处 imwrite 函数用来保存图片 opencv3中的imwrite函数是用来输出图像到文件 xff0c 其声明如下 xff1a CV EXPORTS W bool imwrite
麦克纳姆轮全向移动原理

什么是麦克纳姆轮在竞赛机器人和特殊工种机器人中 xff0c 全向移动经常是一个必需的功能全向移动意味着可以在平面内做出任意方向平移同时自转的动作为了实现全向移动 xff0c 一般机器人会使用全向轮 xff08 Omni Wheel
卡尔曼滤波(KF)与扩展卡尔曼滤波(EKF)的一种理解思路及相应推导（1）

前言 xff1a 从上个世纪卡尔曼滤波理论被提出 xff0c 卡尔曼滤波在控制论与信息论的连接上做出了卓越的贡献为了得出准确的下一时刻状态真值 xff0c 我们常常使用卡尔曼滤波扩展卡尔曼滤波无迹卡尔曼滤波粒子滤波等等方法 xff0

随机推荐

Qt Cmake添加*.qrc资源文件

cmake minimum required VERSION 3 5 project Test LANGUAGES CXX 这里 file GLOB RECURSE QRC SOURCE FILES CMAKE CURRENT SOURCE
IOS 加载本地HTML

web qtt以 folder形式添加到项目中 xff0c 注意是蓝色的颜色创建swift项目 xff0c 写入如下代码 span class token comment span span class token comment Vie
C#实现：将十进制数转换为十六进制（含完整源码）

C 实现将十进制数转换为十六进制含完整源码在C 中我们可以使用基础数据类型来存储整数值如int long等而十进制数是我们最常用的数制但有些场景下需要将其转换为其它进制如十六进制本文将介绍如何使用C 来实现将十进制数转换为
怎样用串口发送结构体-简单协议的封包和解包

先说解决方案 xff0c 细节和实现代码都放在正文下位机 xff1a 把结构体拆分成8位的整型数据 xff0c 加上数据包头和包尾 xff0c 然后按顺序单个单个地发出 xff1b 上位机 xff1a 把串口里的数据读取出来 xff0c
计算机网络学习笔记——IP Header Checksum（校验和）的计算方法

从TCP IP协议看到IP数据报 xff0c 看到Checksum的算法描述 xff0c 不甚了了 The checksum field is the 16 bit one s complement of the one s complem
在Ubuntu18.04中更新指定python版本以及pip

在Ubuntu18 04中更新指定python版本以及pip 更新指定python版本 xff08 eg python3 8 xff09 xff1a 参考教你Ubuntu安装python3 7 xff0c 并更新python默认指向 xf
【MATLAB数学建模编程实战】遗传算法求解最短路径（附代码及运行效果)

欢迎关注 xff0c 本专栏主要更新MATLAB仿真界面基础编程画图算法矩阵处理等操作 xff0c 拥有丰富的实例练习代码 xff0c 欢迎订阅该专栏 xff01 xff08 等该专栏建设成熟后将开始收费 xff0c 快快上车吧
stm32HAL库串口接收不定长数据（DMA传输）

相信大家很多初学者都会遇到串口接收不定长数据的情况对于初学者可能看着有点难理解 xff0c 多看几遍就好 xff0c 亲测能用话不多说上菜上菜 xff01 xff01 xff01 xff01 此代码是本人在具体工程应用 xff0c 实测
Flask - after_request 和 before_request

目录特殊的装饰器多个中间件怎么执行的特殊的装饰器 64 app before request 在视图函数执行前执行 64 app after request 在视图函数执行后执行 span class token keyword fro
VScode 占用cpu风扇狂转， C/C++ IntelliSense Server for Visual Studio Code cpptools.exe占用cpu 30%

点击下面那个红框中的东西 xff0c 然后选择暂停分析 cpu占用立马降下来了
学习C++中遇到的各种问题

拷贝构造函数到底是个是什么东西 xff1f 到底什么时候用const xff1f amp 是写在前还是写在后 xff1f 有区别 xff1f 为什么在析构函数中加了delete程序就会卡死 xff1f size t是个什么东西 xff1f
【3D目标检测】稀疏卷积

稀疏卷积实现部分先说说实现部分 xff0c 对原理感兴趣的往后看 1 稀疏数据生成这里的思路主要是先利用np meshgrid和np stack创建出稀疏数据补全后shape大小的点云坐标 xff0c 然后随机取前num points个
Unity3D之物体跟随鼠标移动和旋转

void FixedUpdate if Input GetMouseButton 0 Vector3 aimPos 61 Camera main ScreenToWorldPoint new Vector3 Input mousePosit
【寒武纪】视觉算法MLU220硬件适配（1）

1 xff0c 环境搭建 xff1a MLU220快速上手指南寒武纪开发者社区安装硬件驱动和软件工具链 xff0c 也可以直接使用寒武纪官方开发平台 xff1a 寒武纪开发平台本地开发安装完工具需要进行一些配置 xff1a 安装后配置
【自动驾驶】second模型训练

1 xff0c 数据组织 xff1a 训练验证数据生成 xff1a python create data py nuscenes data prep data path 61 NUSCENES TRAINVAL DATASET ROOT v
OpenMP入门

OpenMP 是 Open MultiProcessing 的缩写可以在 Visual Studio 或者 gcc 中使用 Hello World 把下面的代码保存为 omp cc include lt iostream gt inclu
【蒸馏】PointDistiller: Structured Knowledge DistillationTowards Efficient and Compact 3D Detection

简述方法的细节 fT和f S 教师检测器和学生检测器中的特征编码层 AT和AS 抽取的待蒸馏体素或重要性得分最高的点的特征 CT和CS 教师和学生检测特征的通道数 GT和GS 教师和学生检测器的图形特征该方法基于预先定义的重要度评分 x
【自动驾驶】多传感器感知技术解析

1 传感器自动驾驶中的传感器主要用到激光雷达 xff0c 毫米波雷达 xff0c 摄像头 xff0c 超声波 xff0c 优缺点如下 xff1a 1 xff09 激光雷达的测距精度测距范围及对温度和光照的适应性很强 xff0c 缺点线束
【自动驾驶】单目3D检测M3D-RPN解析与paddle复现

1 简介作者提出了一种单个的端到端区域建议网络用于多类别3D目标检测 2D和3D检测任务各自的目标是最终对一个对象的所有实例进行分类 xff0c 而它们在定位目标的维数上是不同的直观地说 xff0c 我们期望能够利用2D检测的强大功能来
【模型压缩】实例分析量化原理

1 从定点模型训练来分析量化原理 xff1a 定点模型训练是一个迁移训练的过程 xff1a 在浮点网络的相应位置插入定点化处理节点 xff08 相当于激活函数 xff09 xff0c 然后在这个经过定点化的计算图上重新训练神经网络以全连

热门标签