1080T、2080T、4070T显卡的深度学习性能测试和结论

2023-11-02

本文更新地址:4070Ti、4090显卡的深度学习性能测试和结论 - 哔哩哔哩

先说结论:

4070T显卡FP32的训练和推理速度跟3090应该基本类似。但由于显存12G偏低,4070T不太适合如今的深度学习模型训练(新手列外,大部分模型都能训练起来,耗电也相对很低),更适合测试最新的一些算法效果(只用推理)。

环境:

pytorch环境:conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6 -c pytorch -c conda-forge

测试代码:霹雳吧啦Wz的GitHub中的swin-L和FastRCNN。 

深度学习模型个人测试结果 

swin-L模型单位是 图像/秒,FastRCNN模型单位是 秒/图像

备注1:主流显卡的测评分

备注2:其他显卡的测试性能(SSD模型,FP32训练)

备注3:另一个网站上的综合评分

 备注4:各类GPU的FP16和FP8训练和推理性能

感觉备注4和我真实测试的有较大差异,FP16的训练,4070ti竟然和2080Ti几乎一样,不知道为什么作者会得出此结论。

个人总结

  • timespy 4K跑分非常适合深度学习性能评估:作为经过本人验证,4070ti的深度学习性能(FP32训练和推理)相对1080T和2080T显卡的差异,几乎跟time spy 4K跑分差异几乎一致。至于FP16和FP8,还未测试。
  • 操作系统基本不影响显卡深度学习性能:Ubuntu 22.04和win11系统下,4070ti的训练和推理速度几乎一模一样。
  • 12G显存是硬伤:4070T相对3090速度上并不差,只是显存12G真的是硬伤,分类网络swin-L的batchsize都只能设为8(图像224*224)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

1080T、2080T、4070T显卡的深度学习性能测试和结论 的相关文章

随机推荐

  • Hadoop Spark 常见问题【一】

    Spark 1 RDD 数据集拆分 数据存储在内存或者磁盘 多分区 失效自动重构 转换操作构造 2 RDD俩种依赖 窄依赖 父RDD中的分区最多只能被一个子RDD的一个分区使用 和宽依赖 子RDD依赖于所有父RDD 3 spark 角色 1
  • APS高级计划排程系统和生产排产系统

    一 什么是APS系统 高级计划与排程APS Advanced Planning and Scheduling 是指在考虑生产资源约束的前提下 通过优化方法 为生产加工任务精确安排生产资源和计划生产时间 使生产及时完成 并使资源充分利用 AP
  • 【WebRTC 02】从摄像头获取视频以及切换分辨率和视频源

    上一节中我们已经搭建出了用于操作的环境 这一节我们要实现的一个小目标 就是将电脑摄像头拍到的内容实时显示到网页上 同时我们一起学习下原理 并做一些小拓展 文章目录 操作环境 实现效果 几个概念 HTML5中的Audio和Video API
  • C++项目练手:矩阵类的功能实现

    C 项目练手 矩阵类的功能实现 C 课程设计 矩阵类的相关功能实现 矩阵简述 实数矩阵是由一个按照长方阵列排列的实数集合 除数据外 两个实数矩阵可以进行加法和乘法运算 一个矩阵也可以和一个实数相乘 得到一个新的矩阵 请基于抽象出的矩阵的属性
  • JavaScript进阶之高阶函数(Higher-order function)

    你还在以为 map reduce filter 是高阶函数吗 高阶函数听上去很让人不明觉厉 但其实也并没有什么特别厉害的地方 只是网上的定义一直让我们有点模糊而已 接下来我们来详细讲讲 首先是定义 查自百度百科 定义 在数学和计算机科学中
  • 二进制安装docker

    二进制安装docker文档 建模部署 docker安装 下载docker 因rpm包安装依赖较多 选择二进制安装 下载地址如下 https download docker com linux static stable x86 64 创建d
  • 区域生长

    转自 https blog csdn net qq 37764129 article details 81227091 注 本程序只能做图像分割 结果图是转自原作者的 暂时没实现该功能 1 理论基础 区域生长算法的基本思想是将有相似性质的像
  • 称重问题递归解法

    用天平称重时 我们希望用尽可能少的砝码组合称出尽可能多的重量 如果只有5个砝码 重量分别是1 3 9 27 81 则它们可以组合称出1到121之间任意整数重量 砝码允许放在左右两个盘中 本题目要求编程实现 对用户给定的重量 给出砝码组合方案
  • 【小沐学NLP】Python实现中文、英文分词

    NLP开发系列相关文章编写如下 1 小沐学NLP Python实现词云图 2 小沐学NLP Python实现图片文字识别 3 小沐学NLP Python实现中文 英文分词 4 小沐学NLP Python实现聊天机器人 ELIZA 5 小沐学
  • win10 提供管理员权限才能删除文件夹

    计算机管理员帐户 也就是我们熟知的 Administrator 拥有可执行影响其他用户操作的权限 由于win10专业版刚发布 很多用户不知道怎么取得管理员权限 接下来小编就跟大家分享启用管理员权限的方法 1 打开win10专业版的开始菜单中
  • 手把手教你--JAVA微信支付(H5支付)

    概述 之前说过 有时间把微信支付的H5支付讲解下 一直拖了半年时间 最近的项目正好又温习了支付功能 趁着热乎 抓紧起来 微信的H5支付 相对公众号支付 容易了跟多 很多相似的东西 也有不同之处 这里只介绍H5支付的关键点 其他内容请先去看我
  • linux系统编程:线程同步-信号量(semaphore)

    线程同步 信号量 semaphore 生产者与消费者问题再思考 在实际生活中 只要有商品 消费者就可以消费 这没问题 但生产者的生产并不是无限的 例如 仓库是有限的 原材料是有限的 生产指标受消费指标限制等等 为了进一步 解决好生产者与消费
  • Go(1)之基本使用

    Go 1 之基本使用 Author Once Day Date 2023年1月8日 漫漫长路 有人对你微笑过嘛 参考文档 Go程序设计语言 Go 语言教程 菜鸟教程 runoob com Go 语言教程 w3cschool 1 概述 Go语
  • C语言(Head First C)-6_2:结构、联合与位字段:结构更新、联合、枚举和位字段

    该系列文章系个人读书笔记及总结性内容 任何组织和个人不得转载进行商业活动 6 2 结构 联合与位字段 结构更新 联合 枚举和位字段 如何更新结构 结构就是把一组绑在一起的变量当做一条数据处理 我们已经学会了创建结构对象 并使用点表示法访问结
  • 【微信小程序地理位置权限】wx.getLocation申请教程+申请素材

    为进一步规范开发者调用涉用户信息相关接口或功能 保障用户合法权益 平台将对如下地理位置相关接口调用实行准入开通 wx getLocation wx onLocationChange wx chooseAddress wx chooseLoc
  • 解决:Oops internal error 40343 occured.Further work is not possible and IDA will close (打开文件出现40343错误)

    问题 IDA pro打开文件出现40343错误 解决方法 换一个安装目录或者重新软件 修改文件名名称 不能是中文 测试 最后修改了文件夹名称为全英文就可以 打开了 希望对大家有所帮助谢谢大家观看
  • 数字时代的抉择,金蝶 EBC 的破局

    今年 10 月 Gartner 发布了企业在 2021 年需要关注的重要战略科技趋势 其中 可组装的企业 一词引起热议 Gartner 认为原本为了提高效率而建立的静态业务流程很脆弱 在疫情的冲击下容易变得支离破碎 因此企业应具有不断重组与
  • 5.28 深圳活动|Jina AI 生态助力云原生场景下的 AIGC 应用开发

    亚马逊云科技 Community Day 将于 5 月 28 日 在深圳南山区海德酒店 11 楼举办 Jina AI 软件工程师付杰将带来 Jina AI 生态助力云原生场景下的 AIGC 应用开发 的主题演讲 Community Day
  • 数据探索(数据特征分析)④—Python分布分析、对比分析、统计量分析、期性分析、贡献度分析、相关性分析

    Python介绍 Unix Linux Window Mac 平台安装更新 Python3 及VSCode下Python环境配置配置 python基础知识及数据分析工具安装及简单使用 Numpy Scipy Matplotlib Panda
  • 1080T、2080T、4070T显卡的深度学习性能测试和结论

    本文更新地址 4070Ti 4090显卡的深度学习性能测试和结论 哔哩哔哩 先说结论 4070T显卡FP32的训练和推理速度跟3090应该基本类似 但由于显存12G偏低 4070T不太适合如今的深度学习模型训练 新手列外 大部分模型都能训练