1080T、2080T、4070T显卡的深度学习性能测试和结论

2023-11-02

本文更新地址：4070Ti、4090显卡的深度学习性能测试和结论 - 哔哩哔哩

先说结论：

4070T显卡FP32的训练和推理速度跟3090应该基本类似。但由于显存12G偏低，4070T不太适合如今的深度学习模型训练（新手列外，大部分模型都能训练起来，耗电也相对很低），更适合测试最新的一些算法效果（只用推理）。

环境：

pytorch环境：conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6 -c pytorch -c conda-forge

测试代码：霹雳吧啦Wz的GitHub中的swin-L和FastRCNN。

深度学习模型个人测试结果

swin-L模型单位是图像/秒，FastRCNN模型单位是秒/图像

备注1：主流显卡的测评分

备注2：其他显卡的测试性能（SSD模型，FP32训练）

备注3：另一个网站上的综合评分

备注4：各类GPU的FP16和FP8训练和推理性能

感觉备注4和我真实测试的有较大差异，FP16的训练，4070ti竟然和2080Ti几乎一样，不知道为什么作者会得出此结论。

个人总结

timespy 4K跑分非常适合深度学习性能评估：作为经过本人验证，4070ti的深度学习性能（FP32训练和推理）相对1080T和2080T显卡的差异，几乎跟time spy 4K跑分差异几乎一致。至于FP16和FP8，还未测试。
操作系统基本不影响显卡深度学习性能：Ubuntu 22.04和win11系统下，4070ti的训练和推理速度几乎一模一样。
12G显存是硬伤：4070T相对3090速度上并不差，只是显存12G真的是硬伤，分类网络swin-L的batchsize都只能设为8（图像224*224）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

开阔见识

深度学习

Pytorch

python

1080T、2080T、4070T显卡的深度学习性能测试和结论的相关文章

使用 MongoDB 作为我们的主数据库，我应该使用单独的图数据库来实现实体之间的关系吗？

我们目前正在为一家专业公司内部实施类似 CRM 的解决方案由于存储信息的性质以及信息的不同值和键我们决定使用文档存储数据库因为它完全适合目的在本例中我们选择 MongoDB 作为此 CRM 解决方案的一部分我们希望存储实体之间的关
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
计算另一个字符串中多个字符串的出现次数

在 Python 2 7 中给定以下字符串 Spot是一只棕色的狗斑点有棕色的头发斑点的头发是棕色的查找字符串中 Spot brown 和 hair 总数的最佳方法是什么在示例中它将返回 8 我正在寻找类似的东西string c
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

Hadoop Spark 常见问题【一】

Spark 1 RDD 数据集拆分数据存储在内存或者磁盘多分区失效自动重构转换操作构造 2 RDD俩种依赖窄依赖父RDD中的分区最多只能被一个子RDD的一个分区使用和宽依赖子RDD依赖于所有父RDD 3 spark 角色 1
APS高级计划排程系统和生产排产系统

一什么是APS系统高级计划与排程APS Advanced Planning and Scheduling 是指在考虑生产资源约束的前提下通过优化方法为生产加工任务精确安排生产资源和计划生产时间使生产及时完成并使资源充分利用 AP
【WebRTC 02】从摄像头获取视频以及切换分辨率和视频源

上一节中我们已经搭建出了用于操作的环境这一节我们要实现的一个小目标就是将电脑摄像头拍到的内容实时显示到网页上同时我们一起学习下原理并做一些小拓展文章目录操作环境实现效果几个概念 HTML5中的Audio和Video API
C++项目练手：矩阵类的功能实现

C 项目练手矩阵类的功能实现 C 课程设计矩阵类的相关功能实现矩阵简述实数矩阵是由一个按照长方阵列排列的实数集合除数据外两个实数矩阵可以进行加法和乘法运算一个矩阵也可以和一个实数相乘得到一个新的矩阵请基于抽象出的矩阵的属性
JavaScript进阶之高阶函数（Higher-order function）

你还在以为 map reduce filter 是高阶函数吗高阶函数听上去很让人不明觉厉但其实也并没有什么特别厉害的地方只是网上的定义一直让我们有点模糊而已接下来我们来详细讲讲首先是定义查自百度百科定义在数学和计算机科学中
二进制安装docker

二进制安装docker文档建模部署 docker安装下载docker 因rpm包安装依赖较多选择二进制安装下载地址如下 https download docker com linux static stable x86 64 创建d
区域生长

转自 https blog csdn net qq 37764129 article details 81227091 注本程序只能做图像分割结果图是转自原作者的暂时没实现该功能 1 理论基础区域生长算法的基本思想是将有相似性质的像
称重问题递归解法

用天平称重时我们希望用尽可能少的砝码组合称出尽可能多的重量如果只有5个砝码重量分别是1 3 9 27 81 则它们可以组合称出1到121之间任意整数重量砝码允许放在左右两个盘中本题目要求编程实现对用户给定的重量给出砝码组合方案
【小沐学NLP】Python实现中文、英文分词

NLP开发系列相关文章编写如下 1 小沐学NLP Python实现词云图 2 小沐学NLP Python实现图片文字识别 3 小沐学NLP Python实现中文英文分词 4 小沐学NLP Python实现聊天机器人 ELIZA 5 小沐学
win10 提供管理员权限才能删除文件夹

计算机管理员帐户也就是我们熟知的 Administrator 拥有可执行影响其他用户操作的权限由于win10专业版刚发布很多用户不知道怎么取得管理员权限接下来小编就跟大家分享启用管理员权限的方法 1 打开win10专业版的开始菜单中
手把手教你--JAVA微信支付（H5支付）

概述之前说过有时间把微信支付的H5支付讲解下一直拖了半年时间最近的项目正好又温习了支付功能趁着热乎抓紧起来微信的H5支付相对公众号支付容易了跟多很多相似的东西也有不同之处这里只介绍H5支付的关键点其他内容请先去看我
linux系统编程：线程同步-信号量(semaphore)

线程同步信号量 semaphore 生产者与消费者问题再思考在实际生活中只要有商品消费者就可以消费这没问题但生产者的生产并不是无限的例如仓库是有限的原材料是有限的生产指标受消费指标限制等等为了进一步解决好生产者与消费
Go(1)之基本使用

Go 1 之基本使用 Author Once Day Date 2023年1月8日漫漫长路有人对你微笑过嘛参考文档 Go程序设计语言 Go 语言教程菜鸟教程 runoob com Go 语言教程 w3cschool 1 概述 Go语
C语言（Head First C）-6_2:结构、联合与位字段：结构更新、联合、枚举和位字段

该系列文章系个人读书笔记及总结性内容任何组织和个人不得转载进行商业活动 6 2 结构联合与位字段结构更新联合枚举和位字段如何更新结构结构就是把一组绑在一起的变量当做一条数据处理我们已经学会了创建结构对象并使用点表示法访问结
【微信小程序地理位置权限】wx.getLocation申请教程+申请素材

为进一步规范开发者调用涉用户信息相关接口或功能保障用户合法权益平台将对如下地理位置相关接口调用实行准入开通 wx getLocation wx onLocationChange wx chooseAddress wx chooseLoc
解决：Oops internal error 40343 occured.Further work is not possible and IDA will close （打开文件出现40343错误）

问题 IDA pro打开文件出现40343错误解决方法换一个安装目录或者重新软件修改文件名名称不能是中文测试最后修改了文件夹名称为全英文就可以打开了希望对大家有所帮助谢谢大家观看
数字时代的抉择，金蝶 EBC 的破局

今年 10 月 Gartner 发布了企业在 2021 年需要关注的重要战略科技趋势其中可组装的企业一词引起热议 Gartner 认为原本为了提高效率而建立的静态业务流程很脆弱在疫情的冲击下容易变得支离破碎因此企业应具有不断重组与
5.28 深圳活动｜Jina AI 生态助力云原生场景下的 AIGC 应用开发

亚马逊云科技 Community Day 将于 5 月 28 日在深圳南山区海德酒店 11 楼举办 Jina AI 软件工程师付杰将带来 Jina AI 生态助力云原生场景下的 AIGC 应用开发的主题演讲 Community Day
数据探索（数据特征分析）④—Python分布分析、对比分析、统计量分析、期性分析、贡献度分析、相关性分析

Python介绍 Unix Linux Window Mac 平台安装更新 Python3 及VSCode下Python环境配置配置 python基础知识及数据分析工具安装及简单使用 Numpy Scipy Matplotlib Panda
1080T、2080T、4070T显卡的深度学习性能测试和结论

本文更新地址 4070Ti 4090显卡的深度学习性能测试和结论哔哩哔哩先说结论 4070T显卡FP32的训练和推理速度跟3090应该基本类似但由于显存12G偏低 4070T不太适合如今的深度学习模型训练新手列外大部分模型都能训练