搭建Swin-Transformer-Detection

2023-05-16

前提条件

CUDA10.1
Pytorch1.7.0
python3.8

下载Swin-Transformer-Detection源码

git clone https://github.com.cnpmjs.org/SwinTransformer/Swin-Transformer-Object-Detection.git?

安装mmdetection

官方教程

#安装mmdet
pip install mmdet

#安装mmcv-full
#这里对mmcv-full pytorch cuda 的版本都有要求，在官方网站按照自己的配置选择对应安装命令即可
pip install mmcv-full==1.3.3 -f https://download.openmmlab.com/mmcv/dist/cu101/torch1.7.0/index.html

#下载mmdetection源码
git clone https://github.com.cnpmjs.org/open-mmlab/mmdetection.git
cd mmdetection

#编译下载好的源码
pip install -r requirements/build.txt
pip install -v -e .  # or "python setup.py develop"

测试mmdetection是否安装成功

#先在mmdetection目录下创建checkpoints目录
# url: http://download.openmmlab.com/mmdetection/v2.0/faster_rcnn/faster_rcnn_r50_fpn_1x_coco/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth
#从上述URL中下载模型到创建好的checkpoints目录


from mmdet.apis import init_detector, inference_detector

config_file = 'configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py'

checkpoint_file = 'checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth'
device = 'cuda:0'
# init a detector
model = init_detector(config_file, checkpoint_file, device=device)
# inference the demo image
inference_detector(model, 'demo/demo.jpg')

编译Swin-Transformer-Detection

mmdetection安装完成后，转到Swin-Transformer文件夹进行编译

cd ../Swin-Transformer-Object-Detection
python setup.py develop		#编译源码

测试

#类似mmdetection测试
#从Swin-Transformer下载对应模型放在Swin主目录即可
python demo/image_demo.py demo/demo.jpg configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py checkpoints/mask_rcnn_swin_tiny_patch4_window7.pth

从测试命令可以看出：网络配置和模型是一一对应的关系，Swin-Transformer文件夹中已经有了官网对应的七种预训练的配置参数，而对应的七种模型需要在官网自行下载。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Swin

Transformer

Detection

搭建Swin-Transformer-Detection 的相关文章

CROSSFORMER: A VERSATILE VISION TRANSFORMER BASED ON CROSS-SCALE ATTENTION 论文阅读笔记

CROSSFORMER A VERSATILE VISION TRANSFORMER BASED ON CROSS SCALE ATTENTION 论文阅读笔记这是浙大腾讯哥伦比亚大学一起发表在ICCV的一篇文章文章有三个贡献一是
页面如何知道我正在用 firebug 分析它

Look Wow 网页如何知道我正在使用 firebug 顺便说一句我不知道如何显示半透明的添加横幅你可以做 if window console window console firebug alert Firebug active
Vanilla JS Div 碰撞检测

我的以下实现可以在jsfiddle net 我有四个div 我的目标是使它们可以在页面上拖动但不允许它们彼此重叠每个都可以使用 mousemove 侦听器在页面上拖动 container addEventListener mousemo
阻止脚本编写者攻击您的网站

我已经接受了答案但遗憾的是我相信我们仍停留在最初的最坏情况验证码大家都在尝试购买垃圾简短说明缓存网络场使得无法跟踪点击量并且任何解决方法发送非缓存网络信标写入统一表等都会比机器人更慢地减慢网站速度思科等公司可能有一些昂
如何正确分类图像中正（亮色）圆圈和负（深色）圆圈的数量

帖子很长请耐心等待为了更好地理解目标是什么以及我到目前为止所做的事情我发布了代码如果需要任何进一步的信息请告诉我我有一个图像如图所示和目标是正确分类正蓝色和负紫色圆圈的数量我不关心图像中的半圆如图所示有29个圆
检测图像中的字体

我有一个非常奇怪的要求即应该检测 JPG 图像中文本的字体如何做呢我想知道有什么办法可以做到这一点提前致谢您可以尝试这些服务什么字体我认为这是识别图像中字体的最准确的服务不是完全自动化的并且有限制它只会匹配 MyFonts
为什么 pynput 不检测数字键盘按下？

我在 Windows 7 上使用 python 3 7 有没有办法检测 pynput 模块中的数字例如 1 按键我尝试了很多其他模块但除了 tkinter 之外我什么也没得到它需要一个窗户但我不想要那个 from pynput i
检测移动或平板设备

我的目标是拥有一个基于 Wordpress 构建的移动网站适用于手机和平板电脑和响应式桌面网站我想要最简单的方法来实现万无一失的设备检测移动网站将拥有许多真正有利于触摸设备的功能并且将为手机和平板电脑定制设计桌面站点将完全不同
检测 Windows Phone 7 是否连接到桌面 Zune 软件

我已经在 Windows Phone 7 应用程序上工作了几个月并且拥有一组有用的检测标志这些标志用于测试代码是否在模拟器中后台前台线程上或在设计时间看完整列表在这里 http silverlightzxing codeplex
opencv颜色检测

使用opencv 可以在图像或视频帧中检测某种颜色在一定范围的rgb值之间吗您需要定义 RGB 阈值并处理图像中适合定义的像素希望不是整个图像而是较小的感兴趣区域可能是移动的前景形状与所讨论的内容类似here http ww
BEV+Transformer感知架构共识下，传感器「火药味」再升级

高阶智能驾驶战火愈演愈烈正带动感知方案卷入新一轮军备竞赛根据高工智能汽车研究院最新发布数据显示 2023年1 9月中国市场不含进出口乘用车前装标配软硬件 NOA交付新车37 73万辆同比上年同期增长151 20 未来几年内 N
用通俗易懂的方式讲解：图解 Transformer 架构

文章目录用通俗易懂方式讲解系列 1 导语 2 正文开始现在我们开始编码从宏观视角看自注意力机制从微观视角看自注意力机制通过矩阵运算实现自注意力机制
Python Opencv自定义控制（增加/减少）视频播放速度

我正在编写一个程序来控制视频播放速度为自定义速率有办法实现这一点吗应该添加什么代码来控制播放速度 import cv2 cap cv2 VideoCapture video mp4 while cap isOpened ret fram
如何检测 Android 设备麦克风中的打击

如何检测用户何时向设备麦克风吹气然后这将用于触发应用程序的某些操作检测用户何时向麦克风吹气的工作可分为两部分 1 从麦克风获取输入 2 监听吹气声音向麦克风吹气的噪音声音由低频声音组成我们将使用低通滤波器来减少进入麦克风的高频声
如何从 silverlight 应用程序检测操作系统？

我有一个 Silverlight3 应用程序旨在在 Windows 和 Mac OS 环境上运行我想在运行时知道我的应用程序是在 Windows 还是 Mac 上运行这样我就可以根据用户在他们选择的操作系统中习惯的方式进行一些调整例
HOG 人体检测器：背景减除图像的误报检测

我正在开展一个需要检测场景中的人员的项目最初在原始帧上运行 HOG 检测器后所有帧上的特定背景对象都被检测为人从而产生 3021 个误报检测因此我采取了合理的步骤通过对所有帧应用背景减法器 BackgroundSubtracto
如何使用 PHP 检测访问我们网站的用户的 MAC 地址？

我知道如何追踪 IP 地址但我需要追踪查看我的页面的用户的 MAC 地址如何做到这一点除非用户与网络服务器位于同一 LAN 上否则无法执行此操作 MAC 地址位于 TCP IP 下面的以太网层并且不包含在从用户本地网络路由出去的
改进 cvFindChessboardCorners

不幸的是我无法找到我的问题的任何解决方案我想做的是使用 OpenCV 方法改进结果cvFindChessboardCorners为了能够实现更好的相机校准因为我认为这就是为什么我在不扭曲校正图像时得到较差结果的原因就像我之前的问题
如何使用mb_detect_encoding检测编码是否正确？

我想检测编码是否正确但我发现 mb detect encoding 总是得到错误结果并且我添加了很多encoding list UTF8 ISO 8859 你试图做的事情只是有时作品编码检测并不是一门精确的科学因此您能做的最好的事
如何检测一个二维数组是否在另一个二维数组内？

因此在堆栈溢出成员的帮助下我得到了以下代码 data needle s which is a png image base64 code goes here decoded data decode base64 f cStringIO

随机推荐

如何使用Tin快速搭建Gitlab-ce？（史上最简单方法）

GitLab是Git代码版本管理平台 xff0c 相比于GitHub xff0c GitLab还免费支持私人仓库 GitLab ce是gitlab的开源版本目前网上Gitlab ce的安装方法有很多 xff0c 但大同小异都需要安装各种依
堆叠降噪自动编码器 Stacked Denoising Auto Encoder（SDAE）

原文链接自动编码器 xff08 Auto Encoder xff0c AE xff09 自动编码器 xff08 Auto Encoder xff0c AE xff09 自编码器 xff08 autoencoder xff09 是神经网络的
PyTorch中 nn.Conv2d与nn.ConvTranspose2d函数的用法

原文链接 1 通道数问题 xff1a 描述一个像素点 xff0c 如果是灰度 xff0c 那么只需要一个数值来描述它 xff0c 就是单通道如果有RGB三种颜色来描述它 xff0c 就是三通道最初输入的图片样本的 channels xf
Python中LSTM回归神经网络的时间序列预测

原文链接这个问题是国际航空乘客预测问题 xff0c 数据是1949年1月到1960年12月国际航空公司每个月的乘客数量 xff08 单位 xff1a 千人 xff09 xff0c 共有12年144个月的数据网盘链接提取码 xff1a
pip安装时 fatal error C1083: 无法打开包括文件: “io.h”: No such file or directory

原文链接使用pip安装模块 xff0c 出现错误 xff1a c users anaconda3 include pyconfig h 68 fatal error C1083 无法打开包括文件 io h No such file or
linux 程序被Killed，查看原因

原文链接 1 查看信息 xff1a 输入以下程序 xff1a dmesg egrep i B100 39 killed process 39 可以输出最近killed的信息 2 设定kill优先度 xff1a xff08 1 xff09 完
Kafka的幂等性与事务性理解

最近在深入理解Flink的Exactly Once xff0c 发现Flink Checkpoint只能保障Flink程序内部的一致性 xff0c 无法保证Sink到外部系统的Exactly Once语义但是Sink到外部如果实现了Two
为什么不直接操作State，而是要额外定义一个变量

最近浏览Flink文章的时候发现一个现象 xff0c 就是在操作State的时候 xff0c 很多文章里面并不会直接操作State xff0c 而是会定义一个相似的变量去操作 xff0c 在 snapshot 和 recover 的时候讲变
了解下SparkSQL中的笛卡尔积

虽然应该尽量避免使用笛卡尔积 xff0c 因为要全量匹配 xff0c 所以运算的效率十分低下 xff0c 但是有些业务有必须得用 xff0c 所以在此了解下SparkSQL中的笛卡尔积 SparkSQL中计算笛卡尔积时有两种Join方式 x
在Redis集群模式下使用pipeline进行批量操作

最近开始又接触到了Redis xff0c 之前在工作中使用Redis的时候 xff0c 由于QPS不高 xff0c 都是直接get set搞定了这次遇到的业务数据量比较大 xff0c 更新也很频繁 xff0c Redis使用是集群模式 x
RDD计算时是把数据全部加载至内存么

RDD的本质 RDD的本质是一个函数而RDD的变换不过是函数的嵌套 RDD有两类输入的RDD 典型如KafkaRDD JdbcRDD转换的RDD 如MapPartitionsRDD RDD的处理流程以如下代码为例 sc textFil
mysql中limit用法详解

Mysql中limit的用法详解在我们使用查询语句的时候 xff0c 经常要返回前几条或者中间某几行数据 xff0c 这个时候怎么办呢 xff1f 不用担心 xff0c mysql 已经为我们提供了这样一个功能 xff0c 尽管语法逻辑很
练习代码遇到的零碎知识

一 xff0c c 43 43 中使用malloc 时 xff0c 出现error malloc was not declared in this scope 1 书写错误 2 没有引用相应的库解决方法 xff1a 引入stdlib h库
ThreadLocal是干嘛用的？

ThreadLocal是通过将变量设置成Thread的局部变量 xff0c 即使用该变量的线程提供一个独立的副本 xff0c 可以独立修改 xff0c 不会影响其他线程的副本 xff0c 这样来解决多线程的并发问题 ThreadLocal主
linux下命令清空回收站

命令行强制清空回收站回收站其实就是一个文件夹 xff0c 存放被删掉的文件 ubuntu 回收站的具体位置是 xff1a HOME local share Trash 进到这个目录下直接rm掉所有文件 xff1a sudo rm fr H
python语言print（）用法应用详解及格式化输出

目录一 print 函数概述 1 1print基本语法 xff1a 1 2 print参数的具体例子 1 2 1 objects基本语法 1 2 2 sep基本语法 1 2 3 end基本语法 1 2 4 file的基本语法二格式化输
数据容器(序列)的切片

目录 1 序列 2 序列的常用操作切片 2 1 基本语法 2 2 例子 3 序列的切片实践 1 序列序列是指 xff1a 内容连续有序 xff0c 可使用下标索引的一类数据容器列表 xff0c 元组 xff0c 字符串 xff0c
一、Win10+非英伟达显卡+Anaconda+Pytorch安装

目录一 Python 二显卡 2 1查看显卡类型 2 2显卡类型简介 2 2 1显示 2 2 2 呈现三安装Anaconda 3 1 安装Anaconda 3 2 创建pytorch环境四安装Pytorch 4 2镜像安装 xf
ssh: error while loading shared libraries: libcrypto.so.1.1: cannot open shared object file: No such

问题描述 xff1a ssh及ssl服务升级后普通用户使用scp及ssh命令报以下错误 xff1a ssh error while loading shared libraries libcrypto so 1 1 cannot open
搭建Swin-Transformer-Detection

前提条件 CUDA10 1Pytorch1 7 0python3 8 下载Swin Transformer Detection源码 git clone https github com cnpmjs org SwinTransformer