对人工智能芯片的一些看法

2023-11-19

人工智能芯片

 

2016年,随着阿尔法狗击败专业人类围棋棋手,已“深度学习”为基础的人工智能技术被大众所熟知。其实“深度学习”技术已经发展了有近30年的历史了。现在的“深度学习”的实现以神经网络技术为主。神经网络通过模拟大脑生物神经网络的连接,通过多层数字神经网络的了解,来实现深度学习,神经网络最著名的就是卷积神经网络。“深度学习”中的深度就体现在多层的神经网络的连接,因为初代的机器学习技术的学习网络层数都比较浅。

现在的人工智能技术的开发主要分为两个方向。一是人工智能算法的研究和神经网络的训练;另一个方向就是实现人工智能算法的加速计算。由于深度学习,神经网络算法的计算量极大,通用CPU的运算能力不能满足与其高速的计算量。现在业界的解决方案主要有GPU加速,FPGA加速,专用ASIC加速。在神经网络计算中,尤其以卷积神经网络(CNN)为主,卷积网路需要运算大量的卷积运算,通过设计卷积硬件加速模块,加速卷计神经网络中的卷积运算。

在加速方案中,GPU平台的解决方案最为成熟,现在GPU加速解决方案做的最好的公司是英伟达,英伟达靠GPU显卡起家,最近几年,随着人工智能技术的发展,人工智能公司对计算力的需求的增加,英伟达依靠自家的GPU技术,开发的GPU加速计算平台被众多人工智能公司应用。英伟达公司也依靠人工智能的热潮得到了极大的增长。 但GPU的缺点在于他的成本和功耗,现在GPU的价格及其昂贵,一块可用于人工智能训练的GPU显卡大概要上万元之多。而且GPU的功耗也极大,一块GPU在进行人工智能网络训练时的功耗达到了上百瓦之高,而且GPU的体积巨大。正是由于这些缺点,GPU加速平台只能部署在服务器端,并配上专业的服务器机柜,供电电源,散热结构。GPU加速平台无法部署到个人消费平台,包括个人电脑和移动智能手机上。

而对于FPGA加速以及专用ASIC加速,由于其计算结构是为神经网络定制的,而且在半导体电路级别进行优化,并采用最先进的半导体制造工艺。因而专用加速芯片的速度可以做到非常高的频率,而功耗也可以优化到非常的级别。专用加速芯片通常的开发路劲是先在FPGA平台上验证所搭建的计算加速网络。在初期,FPGA平台可以极大的提高开发效率的降低开发成本。等到加速计算网络在FPGA平台上可以完美运行后,在将计算网络制作到专用芯片上,通过 大批量的生成,可以极大的降低芯片的成本。

在FPGA加速领域,老牌的FPGA公司Xilinx和Intel(原Altera)都推出了自己的人工智能解决方案。Xilinx推出了DNNDK(Deep Neural Network Development Kit,深度神经网络开发平台)平台,基于Xilinx的FPGA硬件平台,支持例如tensorflow,caffe ,mxnet等等通用的AI框架,可用于数据中心的AI加速和边缘计算的AI加速,可用于图像识别,视频分析,金融分析,人脸检测等领域。而Intel则推出了 OpenVINO™ (开放视觉推理和神经网络优化)工具套件,该工具套件基于卷积神经网络,在边缘计算中支持CNN的计算,通过使用常见的应用编程接口(API),支持在各种异构平台,如 CPU、GPU、FPGA上执行神经网络加速计算。还有其他人工智能公司也利用FPGA搭建的专用的人工智能硬件急速电路。

在专用ASIC芯片领域,最著名的就是Google的TPU(Tensor processing unit ,张量处理器),是为机器学习而定制的芯片,运行效率大大高于GPU,通过内置的大量的计算单元阵列,来实现人工智能计算的加速。中国的人工智能芯片公司“地平线”主要开发视频识别类的人工智能加速芯片,下载已经发布的有“征程 ”和“旭日”系列处理器。分别面向智能驾驶,智能摄像头领域。而寒武纪开发的智能终端处理器IP,已经成功的应用于智能手机芯片中,可广泛应用于计算机视觉等领域,提升视觉终端人/车/物/行为/图像/视频等的抓取和即时处理能力。以矿机起家的比特大陆也凭借在计算芯片领域的积累,设计了自己的云端和终端人工智能芯片,可应用于安防监控、数据中心、超级计算、机器人等领域。如今,人工智能芯片公司百花齐放,在各个领域不断地持续发力,相互竞争,相互促进。

关注公众号:“数字积木”,获取更多精彩内容,技术干货。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

对人工智能芯片的一些看法 的相关文章

  • [工具环境] pip&git lfs下载命令

    关键词 pip git lfs pip从git下载指定的提交版本 伴随着大模型的火热发展 PEFT和transformers也是更新频繁 常会看到requirements中安装的软件包来自github中的某个commit hash 比如re
  • 应用编排与管理:核心原理

    本节课程要点 K8s 资源的重要元信息 使用阿里云服务演示一下如何去修改或查看 K8s 重要元数据 详细分析控制器模式 总结控制器模式特点 资源元信息 1 Kubernetes 资源对象 首先 我们来回顾一下 Kubernetes 的资源对
  • g2o的基本使用

    参考 https www jianshu com p e16ffb5b265d 参考 https zhuanlan zhihu com p 36889150 图是一种数据结构 在图优化中 用顶点 vertex 表示优化变量 用边 edge
  • Smali--Dalvik虚拟机指令语言-->【android_smali语法学习一】

    最近一周在研究rom移植 所以就对Smali语言学习了一下 Smali语言其实就是Davlik的寄存器语言 Smali语言就是android的应用程序 apk通过apktool反编译出来的都有一个smali文件夹 里面都是以 smali结尾
  • 基于当前系统制作docker镜像

    1 通过tar 备份目录 tar cvpf home buildrpm tar directory exclude proc exclude sys exclude dev exclude run root localhost home l
  • 不能安装64位office提示已安装32位的

    问题描述 安装64位office办公软件的时候提示已经安装32位的office办公软件所以无法继续安装 但实际上之前安装的32位的office办公软件已经卸载了 问题现象截图如下 解决办法 从问题描述中 我们其实已经能够看出问题原因了 类似
  • React的超详细讲解

    React React的重点 webpack webpack 是一个现代 JavaScript 应用程序的静态模块打包器 module bundler 当 webpack 处理应用程序时 它会递归地构建一个依赖关系图 dependency
  • 虚幻引擎程序化资源生成框架PCG 之 UPCGBlueprintElement源码笔记(一)

    UPCGBlueprintElement是PCGGraph中自定义节点的基类 但官方目前还没有给出详细的文档 所以从源代码里找点答案 文章目录 可覆盖函数 Override Functions Excute 和 Excute with Co
  • web.xml加载顺序

    web xml加载顺序 应用服务器启动时web xml加载过程 至于这些节点在xml文件中的前后顺序没有关系 不过有些应用服务器 我曾碰到过的 websphere就严格要求web xml的节点顺序 否则部署不成功 所以还是赞成按照web x
  • CSS 样式穿透

    1 穿透语法 如果给样式中声明scop 那么页面的类会增加data 562e3wue8等属性 此时就需要用到 gt gt gt 或者 deep 或者 v deep 以后用后两个比较多 如果在样式类前面 v deep 则会自动找到 data
  • 快速搭建一个自己的服务器详解(java环境)

    一 服务器的购买 1 我选择的是阿里云的服务器 学生价9 5元一个月 百度直接搜索阿里云 然后点击右上角登录 推荐大家用支付宝扫码登录 方便快捷 阿里云官网的东西比较多 登录后我找了很久也没有找到学生服务器在哪里卖 最后在咨询里找到了这个网
  • 喜爱夜蒲3_百度百科

    喜爱夜蒲3 百度百科 喜爱夜蒲3
  • LeetCode707.设计链表

    题目描述 707 设计链表 力扣 LeetCode 这道题用单向链表和双向链表都能写 因为对双向链表不是很熟 所以就用双向链表来写了 由于初始化的链表并没有放入任何元素 所以这个结点就当成哑结点来处理 而且这样对之后的增删操作也更便利 C语
  • 通配符的使用

    通配符是一种特殊语句 主要有星号 和问号 用来模糊搜索文件 当查找文件夹时 可以使用它来代替一个或多个真正字符 当不知道真正字符或者懒得输入完整名字时 常常使用通配符代替一个或多个真正的字符 SQL 通配符 在搜索数据库中的数据时 SQL
  • java最大线程数

    Xms 初始堆大小 如 Xms256m Xmx 最大堆大小 如 Xmx512m Xmn 新生代大小 通常为 Xmx 的 1 3 或 1 4 新生代 Eden 2 个 Survivor 空间 实际可用空间为 Eden 1 个 Survivor
  • 华为OD机试 - 经典屏保(Java)

    题目描述 DVD机在视频输出时 为了保护电视显像管 在待机状态会显示 屏保动画 如下图所示 DVD Logo在屏幕内来回运动 碰到边缘会反弹 请根据如下要求 实现屏保Logo坐标的计算算法 屏幕是一个800 600像素的矩形 规定屏幕的左上
  • PermissionError: [WinError 5] 拒绝访问。解决办法

    PermissionError WinError 5 拒绝访问 问题描述 解决办法 一 找到programdata下anaconda3的python 二 进入Users的权限 将除了特殊权限外 全部挂上 三 在返回到anaconda3的目录
  • Nginx-简介

    用Python语言开发的站点使用的Web服务器主要有Nginx Apache以及淘宝的Tengine Nginx是由Igor Sysoev在2004年发布的一个开源 高性能的HTTP服务器和反向代理 它还可以用来作为IMAP POP3的代理
  • K8s基础6——应用配置管理方案、调度策略、污点和污点容忍

    文章目录 一 应用配置管理方案 1 1 ConfigMap 1 1 1 注入变量 1 1 2 挂载数据卷 1 2 Secret 1 2 1 数据卷挂载 1 2 2 变量注入 二 调度策略 2 1 nodeSelector定向调度 2 1 1
  • Github上 10 个开源免费且优秀的后台控制面板

    Web 开发中几乎的平台都需要一个后台管理 但是从零开发一套后台控制面板并不容易 幸运的是有很多开源免费的后台控制面板可以给开发者使用 那么有哪些优秀的开源免费的控制面板呢 我在 Github 上收集了一些优秀的后台控制面板 并总结得出 T

随机推荐