ARM整形算力计算

2023-05-16

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、RK3399规格？
二、开始计算
- 1.参考
- 2.计算
总结

前言

之前做人工智能使用RK3399的CPU去推理，发现效果不理想，现在基本上是采用NPU来推理了。我内心不禁萌生一个想法，ARM的CPU算力到底有多少，为什么推理方面干不过NPU，这里我借用经常使用的RK3399来对比下

一、RK3399规格？

RK3399是国产厂商瑞芯微设计的一款ARM产品，基于Cortex-A72+Cortex-A53的大小核架构设计，算是半国产产品吧，Cortex-A72数量2颗，主频1800Mhz；Cortex-A53数量4颗，主频1500Mhz。

二、开始计算

1.参考

我们需要参考官方给出的实际算力表，见下表

在这里插入图片描述
表里我们看出
Cortex-A72的DMIPS/MHZ是4.7，也就是每秒，每MHZ执行4.7百万个整数计算指令
Cortex-A53的DMIPS/MHZ是2.3，也就是每秒，没MHZ执行2.3百万个整数计算指令
有了这些数据，我们开始计算实际的整数算力。

2.计算

MOPS：megaOPS，每秒10^6次整数运算，相当于每秒一百万次整数运算
GOPS：gigaOPS，每秒10^9次整数运算，相当于每秒十亿次整数运算
TOPS：teraOPS，每秒10^12次整数运算，相当于每秒一万亿次整数运算
POPS：petaOPS，每秒10^15次整数运算，相当于每秒一千万亿次整数运算
EOPS：exaOPS，每秒10^18次整数运算，相当于每秒一百亿亿次整数运算

有了这些数据，我们就可以开始计算RK3399的算力了，这里我们抛弃其它的干扰，只计算官方给出的数据，结果可能有一定的偏差。

计算公式:频率(MHZ)x核心数xDMIPS/MHZ

Cortex-A72: 1800x2x4.7=16920 DMIPS
Cortex-A53: 1500x4x2.3=13800 DMIPS

合计：30720 DMIPS

这个算力在GOPS核TOPS中间，实际307.2GOPS或0.3072TOPS，看起来和动辄3TOPS的NPU比起来还是有差距的。

总结

1、市面上很多模型都是基于INT8的，精度和FLOAT肯定是差一些的，大多数人都是采用牺牲一些精度换取大量的性能提升，这个是目前边端设备上的主流做法。
2、没有测试GPU，RK3399这个GPU在嵌入式设备上还是蛮强的，但是实际上在推理场景发挥有限，至少我是没有获得过巨大的性能提升。
3、边端设备上推理还是采用NPU更划算，单纯依靠CPU还是不太现实，或者只能满足受限制的小场景。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

arm

整形算力计算

ARM整形算力计算的相关文章

如何使用 gcc 编译代码和 ARM Cortex A8 目标进行调用图分析？

我对这个已经咬牙切齿了我需要在 ARM 板上进行分析并需要查看调用图我尝试使用 OProfile Kernel perf 和 Google 性能工具一切正常但不输出任何调用图信息这使我得出结论我没有正确编译代码我在编译 C 代
RAM 存储二进制数和汇编语言的冒泡排序

我必须使用 ARM v7 执行一个例程在 RAM 内存中存储 10 个二进制数然后使用冒泡排序对这些数字从高到低进行排序我应该如何开始 func bubbleSortAscendingU32 ldr r3 r0 4 mov r1 9
Linux malloc() 在 ARM 和 x86 上的行为是否不同？

这个网站上有很多关于内存分配的问题但是我找不到专门解决我的问题的人这问题 https stackoverflow com questions 19148296 linux memory overcommit details似乎最接近
源和目标具有不同的 EABI 版本

我正在尝试使用 ARM 工具链编译 so 文件但是我不断收到这个错误错误源对象的 EABI 版本为 0 但目标对象的 EABI 版本为 5 我无法更改工具链中的任何内容因为我必须使用给定的工具链我以前从未见过这个错误我使用了这个
如何使用 Neon SIMD 将无符号字符转换为有符号整数

如何转换变量的数据类型uint8 t to int32 t使用霓虹灯我找不到执行此操作的任何内在因素假设您想要将 16 x 8 位整数的向量转换为 4 个 4 x 32 位整数的向量您可以通过首先解压缩为 16 位然后再次解压缩为
在linux x86平台上学习ARM所需的工具[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 x86 linux 机器在阅读一些关于 ARM 的各种信息时我很好奇现在我想花一些时间学
是否可以将 SpaCy 安装到 Raspberry Pi 4 Raspbian Buster

我一整天都在安装 SpaCy sudo pip install U spacy Looking in indexes https pypi org simple https www piwheels org simple Collectin
了解 U-Boot 内存占用

我不明白加载 U Boot 时 RAM 中发生了什么我正在开发 Xilinx Zynq ZC702 评估套件并尝试使用 U Boot 在其上加载 Linux 内核于是我使用Xilinx工具Vivado和SDK生成了一个BOOT bin
AOSP 的“午餐”组合是什么意思？我需要选择什么？

我是 Android 设备 ROM 开发的新手无论如何我现在正在为具有 64 位处理器的中国设备构建 AOSP 我按照 source android com 上的菜单进行操作当我运行午餐命令时终端显示午餐菜单选择一个组合我
gdb 不会从外部架构读取核心文件

我正在尝试在 Linux 桌面上读取 ARM 核心文件但似乎无法找出我的核心文件有什么方法可以指示 gdb 我的核心文件是什么类型吗 file daemon daemon ELF 32 bit LSB executable ARM ve
GCC C++ (ARM) 和指向结构体字段的 const 指针

假设有一个简单的测试代码 typedef struct int first int second int third type t define ADDRESS 0x12345678 define REGISTER type t ADDRE
为arm构建WebRTC

我想为我的带有arm926ej s处理器的小机器构建webrtc 安装 depot tools 后我执行了以下步骤 gclient config http webrtc googlecode com svn trunk gclient s
上下文切换到安全模式（arm trustzone）的成本是多少

我试图了解在arm中可信安全和非安全模式之间来回切换的成本从非安全世界转移到安全世界时到底需要发生什么我知道需要设置 ns 位基于某些特殊指令需要刷新和更新页表刷新和更新处理器缓存还有什么需要发生的吗处理器缓存它们是分段
.ko 文件是如何构建的

我正在尝试将我自己的驱动程序移植到Beagle 板 xm arm cortex A8 在移植时我试图弄清楚如何 ko文件实际构建在我们的Makefile我们只有一个命令来构建 o file 怎样是一个 ko文件已建立使用Linux 2
ARM 的内核 Oops 页面错误错误代码

Oops 之后的错误代码给出了有关 ARM EX 中的恐慌的信息 Oops 17 1 PREEMPT SMP在这种情况下 17 给出了信息在 x86 中它代表 bit 0 0 no page found 1 protection faul
直接写入 ARM Cortex A8 分支预测器中的全局历史缓冲区 (GHB) 或 BTB？

我有兴趣直接修改 Cortex A8 上的 BTB 分支目标缓冲区和 GHB 的内容 ARM 手册上有这样的内容要在指令端 GHB 数组中写入一项例如 LDR R0 0x3333AAAA MCR p15 0 R0 c15 c1 0 M
将 C 函数与 ARM 汇编结合使用

我见过人们在代码中使用 C 库中的 printf 的示例如下所示 data balign 4 hello asciz Hello n text global main func main main ldr r0 hello msg bl
使用arm-linux-gnueabi-gcc为Android交叉编译静态C hello world

我想使用 arm linux gnueabi gcc 从 C 构建静态 hello world 而不是使用 NDK 独立工具链或 Codesourcery 在Ubuntu中我做了以下事情 sudo apt get install gcc
在 Intel 机器 (Mac) 上构建 ARM 架构的 Docker 镜像

我希望能够从我的 Mac 构建 ARM 的 Docker 映像我知道我可以使用 QEMU 在 Mac 上运行 ARM 容器但我不知道如何为 ARM 构建现在这有点复杂我相信在不久的将来 docker 会让这一切变得更容易基本上您
如何在 Linux 内核中定义并触发我自己的新软中断？

我想在 Linux 内核中创建自己的软中断这是正确的方法吗 In the init我想触发该模块的softirq我将添加一个调用 394 void open softirq int nr void action struct softir

随机推荐

turnserver （coturn + redis）配置ICE server 临时用户密码【实践】

背景前端连接turn服务时一般都需要设置账号密码 xff0c 由于都是在js中配置的 xff0c 长期凭据相对临时用户安全性会差很多 xff0c 本文通过程序生成临时的账号密码 xff0c 把临时凭据设置到Redis中 xff0c tur
C# 端口转发

业务需要跳转ip xff0c 又不想迁移程序 xff0c 可以用此方法进行端口转发 span class hljs keyword static span span class hljs keyword void span Main spa
列数的规则如下: 1、1、2、3、5、8、13、21、34...... 求第30位数是多少

列数的规则如下 1 1 2 3 5 8 13 21 34 求第30位数是多少分析 xff1a 从第二个数开始 xff0c 每位等于前两个数相加递归 xff1a span class hljs keyword public span sp
dotnet core 使用传统Cookie

dotnet core 使用传统Cookie 先在添加Cookie中间件 app UseCookiePolicy public void Configure IApplicationBuilder app IHostingEnvironme
dotnet core web IApplicationBuilder 中间件学习

dotnet core web IApplicationBuilder 中间件学习编写一个自己的中间件的模版 public static class MyApp public static IApplicationBuilder User
docker gitlib 搭建

docker gitlib 搭建 1 docker 命令构建 sudo docker run v etc localtime etc timezone rw v etc localtime etc localtime rw d p 8443
net core Ocelot 网关初使用（1）

新建 net core webapi 项目安装 nuget 包 96 96 96 Install Package Ocelot 96 96 96 配置添加一个Ocelot json的文件用来添加Ocelot的配置转发 http loc
net core Ocelot 网关初使用（2）- 搭配 consul 服务使用 Ocelot

搭配 consul 服务使用 Ocelot xff0c 自动路由配置新建webapi 项目 xff0c 安装 nuget 包 install package Ocelot install package Ocelot Provider C
spring boot web开发（1）构建项目

spring boot web开发 xff08 1 xff09 构建项目 1 构建项目去 https start spring io 下载基础项目在pom xml 添加 web 依赖 lt dependency gt lt groupId
SpringBoot web开发（2）session登录注册

SpringBoot web开发 xff08 2 xff09 session登录注册新建 LoginController java 文件使用 session 控制登录 64 Autowired HttpSession session 添加
SpringBoot web开发 (3) 使用 mysql-jpa 登录验证

3 使用 mysql jpa 构造数据库实体类型添加maven依赖 lt dependency gt lt groupId gt org springframework boot lt groupId gt lt artifactId
JAVA+Netty根据二级域名实现多租户内网穿透功能【设计实践】

目录背景实践项目结构原理分析代码实现 cc common项目 cc server项目 cc client项目 Nginx配置使用启动服务端启动客户端背景上一篇JAVA基于Netty实现内网穿透功能设计实践殷长庆的博客
C++：stringstream格式化字符串

C语言通过snprintf对字符串进行格式化格式化前需要首先对字符串的长度预估如果长度大于了字符数组的大小格式化字符串会被截断 C 通过stringstream对字符串进行格式化 include lt sstream gt inclu
Ubuntu：apt软件包管理工具

apt是Advanced Packaging Tool 是Ubuntu的安装包管理工具主要的几个操作为 1 安装软件包 sudo apt install 软件包名 2 卸载软件包而保留软件的配置文件 sudo apt remove 软件
CMake：message输出消息

可以在执行cmkae的时候使用message输出信息 xff1a message lt mode gt 34 message text 34 其中mode有如下几个选项 xff08 优先级由低到高 xff09 xff1a TRACE xff
C++(11)：通过underlying_type获取/输出枚举类的值

C 11 枚举类风静如云的博客 CSDN博客 c 11 枚举类介绍了枚举类使用的好处不过如果直接输出枚举类的值是不行的 include lt iostream gt using namespace std int main enum
gitlab-ce安装

GitLab是一个利用 Ruby on Rails 开发的开源应用程序 xff0c 实现一个自托管的Git项目仓库 xff0c 可通过Web界面进行访问公开的或者私人项目 GitLab拥有与Github类似的功能 xff0c 能够浏览源代码
WSL2安装到其它目录下

提示 xff1a 文章写完后 xff0c 目录可以自动生成 xff0c 如何生成可参考右边的帮助文档文章目录前言一 WSL2是什么 xff1f 二下载Ubuntu20 041 打开Mocrosoft Store2 导出发行版总结前
解决Ubuntu20.04安装CUDA-11.2报256错误的问题

提示 xff1a 文章写完后 xff0c 目录可以自动生成 xff0c 如何生成可参考右边的帮助文档文章目录前言一报错的原因是什么 xff1f 二安装cuda 11 2三安装nvidia driver 455四再装cuda 11
ARM整形算力计算

提示 xff1a 文章写完后 xff0c 目录可以自动生成 xff0c 如何生成可参考右边的帮助文档文章目录前言一 RK3399规格 xff1f 二开始计算1 参考2 计算总结前言之前做人工智能使用RK3399的CPU去推理 x

热门标签