为强化机器学习性能，ARM推出两款新GPU Mali-G52和Mali-G31

2023-05-16

ARM于近期推出了两款图形处理器产品，分别为Mali-G52以及Mali-G31，主要应用于主流移动市场。

由于移动端AI计算、图形处理需求的与日俱增，GPU之于手机SoC的作用日渐凸显，ARM全新的图形核心也呼之欲出。近日，据媒体报道，ARM于推出了两款图形处理器产品，分别为Mali-G52以及Mali-G31，主要应用于主流移动市场。这两款核心均是ARM现有的Bifrost图形架构的变种，重点改善了其机器学习性能以及功耗表现。

为强化机器学习性能，ARM推出两款新GPU Mali-G52和Mali-G31

据悉，Mali-G52采用更宽的执行引擎，相比前代产品的4线程，Mali-G52最多可提供8线程，可在相同芯片面积上，提供更高的图形性能。实测数据显示，相比上一代，G52性能密度提高30%，能效提高15%，可降低设备的功耗和散热，并支持更长的游戏时间，甚至可支持AR等高耗电技术。

而Mali-G31主要针对720P或更低显示分辨率的高能效设备而设计，与Mali-G51 MP2相比，Mali-G31的芯片面积可以缩小20%，并且仍然可以提供12%的性能提升。更重要的是，Mali-G31是ARM支持Vulkan API和OpenGL ES 3.2标准的最小芯片。

ARM资深市场营销总监Ian Smythe表示：“对终端设备而言，支持丰富的多层用户界面以及一系列广泛的最新应用已成为必然趋势。更为重要的是，机器学习不再是高端智能手机的专有配置。各级用户都希望轻松使用配备机器学习功能的各类APP应用，3D游戏、混合现实和4k内容越来越流行，新型的游戏也不断出现在主流手机上。在新一代用户的需求之下，ARM以技术驱动创新，推出新一代解决方案，为用户提供更酣畅的视觉体验。”

最后，ARM还公布称，迄今已向它的合作伙伴交付超过1250亿枚芯片，并预计到2021年这一数字将达到2000亿。

原文发布时间： 2018-03-07 22:04

本文作者：巫盼

本文来自云栖社区合作伙伴镁客网，了解相关信息可以关注镁客网。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为强化机器学习性能，ARM推出两款新GPU Mali-G52和Mali-G31 的相关文章

CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
saber sd 如何在没有 SPL 的情况下直接从 uboot 启动

sabre sd 基于 imx 6 最大内部 RAM 约为 150Kb 然而 uboot 足够大可以容纳在这个空间中在这个场景中事情是如何进行的 https community freescale com docs DOC 95015
如何为 CUDA 内核选择网格和块尺寸？

这是一个关于如何确定CUDA网格块和线程大小的问题这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段见下文我
GPU的编程语言有哪些

我读过一篇文章指出 GPU 是超级计算的未来我想知道在GPU上编程使用什么编程语言 OpenCL 是开放式跨平台解决方案可在 GPU 和 CPU 上运行另一个是 NVIDIA 为其 GPU 构建的 CUDA HLSL Cg 等少数几
架构armv7的重复符号

尝试在我现有的应用程序中使用 Layar SDK 时出现以下错误我该如何解决这个问题 Ld Users pnawale Library Developer Xcode DerivedData hub afxxzaqisdfliwbzxbi
arm64和armhf有什么区别？

Raspberry Pi Type 3 具有 64 位 CPU 但其架构不是arm64 but armhf 有什么区别arm64 and armhf armhf代表 arm hard float 是给定的名称Debian 端口 https
将 nvidia 运行时添加到 docker 运行时

我正在运行虚拟机GCP配备特斯拉 GPU 并尝试部署一个PyTorch基于应用程序使用 GPU 加速我想让 docker 使用这个 GPU 可以从容器访问它我设法在主机上安装了所有驱动程序并且该应用程序在那里运行良好但是当我尝试在
错误：分配具有形状的张量时出现 OOM

在使用 Apache JMeter 进行性能测试期间我面临着初始模型的问题错误分配形状为 800 1280 3 和类型的张量时出现 OOM 通过分配器浮动在 job localhost replica 0 task 0 device
具有 Cuda Thrust 的多个 GPU？

如何将 Thrust 与多个 GPU 一起使用这只是使用 cudaSetDevice deviceId 的问题吗然后运行相关的 Thrust 代码使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
如何在WinMobile6上启用ARMv6非对齐访问？

ARMv6 引入了一个很棒的功能未对齐的内存访问这使得代码中的某些事情变得更加简单和更快但微软只在winCE6中提供了API 现在大多数 PDA 都基于 WinMobile6 基于 CE 5 x 默认情况下禁用未对齐访问我尝试在 C
Android NDK 代码中的 SIGILL

我在市场上有一个 NDK 应用程序并获得了有关以下内容的本机崩溃报告 SIGILL信号我使用 Google Breakpad 生成本机崩溃报告以下是详细信息我的应用程序是为armeabi v7a with霓虹灯支持它在 NVIDI
A64 Neon SIMD - 256 位比较

我想将两个小端 256 位值与 A64 Neon 指令 asm 进行有效比较平等为了平等我已经有了解决方案 bool eq256 const UInt256 lhs const UInt256 rhs bool result 首先将
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
用于计算邻居列表的最佳 GPU 算法

给定 3D 中数千个点的集合我需要获取落在某个截止值以欧几里得距离而言内的每个粒子的邻居列表并且如果可能的话从最近到最远排序在 CUDA 或 OpenCL 语言中哪种 GPU 算法最快我所知道的最快的 GPU MD 代码之一
2022年Android CPU架构分布（armeabi-v7a vs arm64-v8a）

有没有关于 2022 年 Android 设备上的架构使用情况的官方信息我有一个支持armeabi v7a 和arm64 v8a 的应用程序我想要放弃对armeabi v7a的支持并且仅支持 64 位设备 arm64 v8a 但我找不到
了解流式多处理器 (SM) 和流式处理器 (SP)

我正在尝试了解 GPU 的基本架构我已经阅读了很多材料包括这个非常好的答案 https stackoverflow com a 2213744 2386113 但我仍然很困惑无法得到一个好的图片我的理解 GPU 包含两个或多个流式多
尝试了解 ARM 二进制映像中的加载内存地址 (LMA) 和二进制文件偏移量

我在一家ARM 皮质 M4 STM32F4xxxx 我试图了解二进制文件 elf and bin 在内存中构建并闪存特别是关于内存位置具体来说我不明白的是LMA从实际的二进制文件偏移量进行翻译让我用一个例子来解释一下我有一个 e
在 Intel 机器 (Mac) 上构建 ARM 架构的 Docker 镜像

我希望能够从我的 Mac 构建 ARM 的 Docker 映像我知道我可以使用 QEMU 在 Mac 上运行 ARM 容器但我不知道如何为 ARM 构建现在这有点复杂我相信在不久的将来 docker 会让这一切变得更容易基本上您
如何在 Linux 内核中定义并触发我自己的新软中断？

我想在 Linux 内核中创建自己的软中断这是正确的方法吗 In the init我想触发该模块的softirq我将添加一个调用 394 void open softirq int nr void action struct softir
更新 MMU 转换表的正确方法是什么

我在我的 s3c2440 板上启用了 MMU 3G 4G 内存故障属性当我没有读写 3G 4G 内存时一切都很好所以为了测试页面错误向量我写入了 0xFF 3G地址正如我所料我从FSR中得到了正确的值所以我在 do page

随机推荐

JVM_栈详解一

1 Java虚拟机栈 2 栈的存储单位栈中存储什么 xff1f 每个线程都有自己的栈 xff0c 栈中的数据都是以栈帧 xff08 Stack Frame xff09 的格式存在在这个线程上正在执行的每个方法都各自对应一个栈帧 xff0
EntLib 3.1学习笔记(6) : Security Application Block

http www microsoft com china MSDN library enterprisedevelopment softwaredev dnpag2entlib mspx mfr 61 true http msdn2 mic
Delphi文件操作所涉及的一些函数附例子

判断文件是否存在 FileExists 判断文件夹是否存在 DirectoryExists 删除文件 DeleteFile Windows DeleteFile 删除文件夹 RemoveDir RemoveDirectory 获取当前文件夹
排序算法

include lt iostream gt include lt cstdlib gt include lt cstdio gt include lt time h gt using namespace std 插入排序 void Ins
C++应用中调用YOLOv3（darknet）进行目标检测

YOLOv3论文 xff1a https pjreddie com media files papers YOLOv3 pdf 官网和代码 xff1a https pjreddie com darknet yolo属于one stage x
DJI开发之航线重叠率的计算

介绍无人机在规划一块区域的时候 xff0c 我们需要手动的给予一些参数来影响无人机飞行 xff0c 对于一块地表 xff0c 无人机每隔N秒在空中间隔的拍照地表的一块区域 xff0c 在整个任务执行结束后 xff0c 拍到的所有区域照片能
MODBUS MASTER RTU在STM32上的实现

MODBUS MASTER RTU在STM32上的实现 1 概述最近需要将几个信号采集模块通过总线串联起来 xff0c 这样便于系统模块化故将目光关注到了工业上经常使用的modbus协议 modbus协议是一种一主多从的拓扑结构 xff
基于HttpClient的HttpUtils(后台访问URL)

最近做在线支付时遇到需要以后台方式访问URL并获取其返回的数据的问题 xff0c 在网络上g了一把 xff0c 发现在常用的还是Apache的HttpClient 因为以经常要用到的原故 xff0c 因此我对其进行了一些简单的封装 xff0
micropython安装ros_ROS2与STM32入门教程-microROS的freertos版本

ROS2与STM32入门教程 micro ros的freertos版本说明 xff1a 介绍如何安装使用micro ros 测试开发板 xff1a olimex stm32 e407 步骤 xff1a 安装ros2版本foxy xff0c
C#中通过com组件操作excel不能关闭的问题

问题 xff1a 当用如下代码操作完Excel xff0c 虽然调用了Application的Quit 方法 xff0c 但发现Excel进程并没退出 object missing 61 System Reflection Missing
交叉编译的概念及交叉编译工具的安装

目录一什么是交叉编译二为什么要交叉编译 xff1f 三交叉编译链的安装四相关使用方法五软连接一什么是交叉编译交叉编译是指将一种编程语言编写的程序编译成另一种编程语言的程序 xff0c 通常是在不同的操作系统或硬件环境
.cn根服务器被攻击之后

如果是互联网行业的人员应该知道 xff0c 8月25日凌晨 xff0c 大批的 cn 域名的网站都无法访问 xff0c 当然包括weibo cn等大型网站个人比较奇怪的一件事情是 xff0c 微博PC网页版是 www weibo com
[UML]UML系列——包图Package

系列文章 UML UML系列用例图Use Case UML UML系列用例图中的各种关系 xff08 include extend xff09 UML UML系列类图Class UML UML系列类图class的关联关系 xff08
VBA编程中的 sheet1 与 sheets(1)的区别

自己理解 sheet1是一个专有名词 xff0c 不是任何对象的属性 xff0c 只能单独使用 xff0c 特指代码所在工作簿的那个sheet1 和顺序无关 xff0c 是固定的一个表 xff0c sheets 1 则和顺序有关参考资料
python练习笔记——计算1/1-1/3+1/5-1/7……的和

1 1 1 3 43 1 5 1 7 43 求100000个这样的分式计算之为是多少 xff1f 将此值乘以4后打印出来 xff0c 看看是什么 xff1f num list 61 count 61 1 i 61 1 while True
Django Model获取指定列的数据

model一般都是有多个属性的 xff0c 但是很多时候我们又只需要查询特定的某一个 xff0c 这个时候可以用到values和values list 利用values查询 from attendence models import Emp
HIVE自定义函数的扩展

作者简介淳敏 xff0c 物流架构师同时也是一位team leader xff0c 工作认真负责 xff0c 曾在休假期间面向大海编程 xff0c 不明觉厉在Hive中 xff0c 用户可以自定义一些函数 xff0c 用于扩展Hive
Flink Window分析及Watermark解决乱序数据机制深入剖析-Flink牛刀小试

版权声明 xff1a 本套技术专栏是作者 xff08 秦凯新 xff09 平时工作的总结和升华 xff0c 通过从真实商业环境抽取案例进行总结和分享 xff0c 并给出商业应用的调优建议和集群环境容量规划等内容 xff0c 请持续关注本套博
使用Network Recycle Bin启用映射网络驱动器上的回收站

前言在内网环境中我们经常会使用NAS或者Samba在Windows中映射网络驱动器 xff0c 方便局域网用户实时共享交换数据但当存储在网络或映射网络上的任何文件被删除时 xff0c 该文件将被永久删除它不会去到本地计算机回收站 xf
为强化机器学习性能，ARM推出两款新GPU Mali-G52和Mali-G31

ARM于近期推出了两款图形处理器产品 xff0c 分别为Mali G52以及Mali G31 xff0c 主要应用于主流移动市场由于移动端AI计算图形处理需求的与日俱增 xff0c GPU之于手机SoC的作用日渐凸显 xff0c ARM

为强化机器学习性能，ARM推出两款新GPU Mali-G52和Mali-G31

为强化机器学习性能，ARM推出两款新GPU Mali-G52和Mali-G31 的相关文章

随机推荐

热门标签