coco 输出格式，MPII 输出格式，标注

2023-11-14

pose

1，数据集
- coco 输出格式
- MPII 输出格式
代码：
详解：
- 1、
- 2、blobFromImage函数

1，数据集

BODY25:

COCO: .

MPI: .

coco 输出格式

鼻子– 0，颈部– 1，

右肩– 2，右肘– 3，右手腕– 4，

左肩– 5，左肘– 6，左手腕– 7，

右臀部– 8，右膝– 9 , 右脚踝 – 10,

左臀部 – 11, 左膝盖 – 12, 左脚踝 – 13,

右眼 – 14, 左眼 – 15, 右耳 – 16, 左耳 – 17,

背景 – 18

在这里插入图片描述

MPII 输出格式

0 - 右脚踝 (right ankle)
1 - 右膝盖 (right knee)
2 - 右髋部 (right hip)
3 - 左髋部 (left hip)
4 - 左膝盖 (left knee)
5 - 左脚踝 (left ankle)
6 - 骨盆 (pelvis)
7 - 胸部 (thorax)
8 - 颈部 (neck)
9 - 头顶 (head top)
10 - 左手腕 (left wrist)
11 - 左肘 (left elbow)
12 - 左肩 (left shoulder)
13 - 右肩 (right shoulder)
14 - 右肘 (right elbow)
15 - 右手腕 (right wrist)
以上16个关键点被广泛应用于人体姿态估计领域，可以用于训练和评估各种类型的人体姿态估计模型，如单人姿态估计、多人姿态估计、动态姿态估计等。

代码：

if MODE is "COCO":
    protoFile = "pose/coco/pose_deploy_linevec.prototxt"
    weightsFile = "pose/coco/pose_iter_440000.caffemodel"
    nPoints = 18
    POSE_PAIRS = [ [1,0],[1,2],[1,5],[2,3],[3,4],[5,6],[6,7],[1,8],[8,9],[9,10],[1,11],[11,12],[12,13],[0,14],[0,15],[14,16],[15,17]]

elif MODE is "MPI" :
    protoFile = "pose/mpi/pose_deploy_linevec_faster_4_stages.prototxt"
    weightsFile = "pose/mpi/pose_iter_160000.caffemodel"
    nPoints = 15
    POSE_PAIRS = [[0,1], [1,2], [2,3], [3,4], [1,5], [5,6], [6,7], [1,14], [14,8], [8,9], [9,10], [14,11], [11,12], [12,13] ]

详解：

1、

.prototxt 文件，它指定了神经网络的架构——不同层的排列方式等。
.caffemodel 文件，用于存储训练模型的权重

2、blobFromImage函数

函数cv2.dnn.blobFromImage(image[, scalefactor[, size[, mean[, swapRB[, crop[, ddepth]]]]]])

平均值（mean）
缩放系数（scalefactor）
交换RB通道（swapRB）
图像裁剪（crop）

blobFromImage(InputArray image, 
			  double scalefactor=1.0, 
		      const Size& size = Size(),
			  const Scalar& mean = Scalar(), 
			  bool swapRB = false, 
			  bool crop = false,
			  int ddepth = CV_32F)

inpBlob = cv2.dnn.blobFromImage(frame, 1.0 / 255, (inWidth, inHeight),
                          (0, 0, 0), swapRB=False, crop=False)

作用：
对图像进行预处理，包括减均值，比例缩放，裁剪，交换通道等，返回一个4通道的blob(blob可以简单理解为一个N维的数组，用于神经网络的输入)

各参数的意义

image

输入图像

scalefactor

当我们将图片减去平均值之后，还可以对剩下的像素值进行一定的尺度缩放，它的默认值是1，如果希望减去平均像素之后的值，全部缩小一半，那么可以将scalefactor设为1/2

mean

需要将图片整体减去的平均值，如果我们需要对RGB图片的三个通道分别减去不同的值，那么可以使用3组平均值，如果只使用一组，那么就默认对三个通道减去一样的值。减去平均值（mean）：为了消除同一场景下不同光照的图片，对我们最终的分类或者神经网络的影响，我们常常对图片的R、G、B通道的像素求一个平均值，然后将每个像素值减去我们的平均值，这样就可以得到像素之间的相对值，就可以排除光照的影响。

swapRB

是否交换RB，OpenCV中认为我们的图片通道顺序是BGR，但是我平均值假设的顺序是RGB，所以如果需要交换R和G，那么就要使swapRB=true

crop

图像裁剪,默认为False.当值为True时，先按比例缩放，然后从中心裁剪成size尺寸

size

输出图像的空间尺寸,如size=(200,300)，Width=200, Height=300

ddepth

当cv2.imshow()处理图像深度为CV_8U（默认范围为[0,255]）时，按原数据显示；当处理图像深度为CV_16U（默认范围为[0,65535]）时，除以256,映射到[0,255]；当图像深度为CV_32F和CV_64F时（默认范围为[0,1]），乘以255映射到[0,255]；当碰到负数时，首先取其绝对值，然后按照上述图像深度将超出数据范围的部分采取截断操作，最后映射到[0,255]显示图像

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

coco 输出格式，MPII 输出格式，标注的相关文章

如何在python中读取多个文件中的文本

我的文件夹中有许多文本文件大约有 3000 个文件每个文件中第 193 行是唯一包含重要信息的行我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数该函数返回给定目录中所有文
InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

sublime text3 英文版转为中文版

简单几步 1 点击菜单栏中 preferences 弹出选项中找到 package control 2 弹出的框中输入 install package 3 弹出的框中在输入 localization 4 然后就汉化了
python下载安装教程（Python 3.10版本）

目录一 Python下载二 Python安装三检查Python是否安装成功今天换了新的电脑需要重新安装python和PyCharm 就简单的写个教程吧一 Python下载 1 进入Python官网官网地址 https www
Nginx的跨域、alias、优化

文章目录 root与alias 反向代理解决跨域 nginx的优化基本配置优化反向代理设置keepalive 压缩缓存操作系统优化 root与alias location alias app html index index htm
计算机组成原理--基于Logisim的汉字的表示的应用（超详细/设计/实验/作业/练习）

目录课程名计算机组成原理内容作用设计实验作业练习学习基于Logisim的汉字的表示一前言二环境与设备三内容四结果与分析课程名计算机组成原理内容作用设计实验作业练习学习基于Logisim
Python 3.6 版本 Pytesseract 图像验证码识别 PyCharm 报错FileNotFoundError

Python 3 6 版本 Pytesseract 图像验证码识别本文首先先说下问题在代码中引入Pytesseract块时总是出现错误程序代码很简单如下 from PIL import Image import pytesserac
基于视觉的捡球机器人

机器人通过自带的摄像头对散落在地上的乒乓球进行识别随后进行拾取本作品的主要难度在于如何在复杂的背景中准确地识别到乒乓球并跟踪以及在识别到乒乓球后如何使机器人准确的向乒乓球运行程序的链接http yueqiuchen blog 163
五、pikachu之RCE

文章目录 1 RCE概述 2 exec ping 3 exec evel 4 连接符 1 RCE概述 RCE emote command code execute 可以让攻击者直接向后台服务器远程注入操作系统命令或者代码从而控制后台系统
算法——因子和阶乘

题目描述输入正整数n 2 lt n lt 100 把阶乘n 1x2x3x xn分解成素因子相乘的形式从小到大输出各个素数 2 3 5 的指数你的程序应忽略比最大素因子更大的素数否则末尾会有无穷对个0 样例输入 5 53 样例输出 5
跨域问题的原理分析

一什么是跨域当页面来源url 的协议域名端口跟页面发出请求获取后端数据的url 的协议域名端口只有要一个不同时即为跨域举个例子我当前先请求blog csdn net nav lang到csdn服务器获取到一个csdn的
Caused by: org.springframework.context.ApplicationContextException: Unable to start ServletWebServer

错误原因 SpringApplication run 中的类名书写错误应该是写成springboot启动类的类名而不是其他的如下所示我启动类的类名为Main 那么在run方法中应该为Main class而不是其它 SpringBoot
RxPermissions简单使用

RxPermissions简单使用描述随着社会的发展人们也开始重视对隐私的保护谷歌也在Android6 0 sdk 23 增加了动态权限申请来保护广大用户的隐私使我们开发者实现起来会很繁琐代码量也会增多但是对于程序员来说永远都是
JWT 身份认证优缺点分析以及常见问题解决方案

JWT 身份认证优缺点分析以及常见问题解决方案之前分享了一个使用 Spring Security 实现 JWT 身份认证的 Demo 文章地址适合初学者入门 Spring Security With JWT 的 Demo Demo 非常
javascript基础第二天笔记

JavaScript 基础第2天理解什么是流程控制知道条件控制的种类并掌握其对应的语法规则具备利用循环编写简易ATM取款机程序能力运算符语句综合案例运算符算术运算符数字是用来计算的比如乘法除法加法减法等等所
Neo4j使用系列4

Part4 1 Cypher基础1 类似于关系数据库中使用的SQL 是Neo4j使用的查询语言 1 特点是一种声明式图形查询语言富有表现力和高效的查询更新和管理设计简单但功能强大可以轻松表达高度复杂的数据库查询 Cypher的结
MySQL和Oracle时间取整

按每15分钟时间取整 mysql SELECT now interval TIME TO SEC now mod 900 second from dual 其中now 可以替换为你自己的字段 oracle select sysdate
第三方库（wordcloud为例）调用出现种种问题

刚刚学习了python 想做点小东西练练手 python有很多好玩的东西 turtle库 wordcloud等等一系列我觉得都可以用来练练手并且真的是挺好玩本来寻思也就十多行代码肯定一会就能调试完没想到真的是我太天真本来就不怎么会
笔记本拓展外接显示器时鼠标移动不到主显示器外的另一块屏上

原因显示面板两个显示器图形表示如下图带有标号的方块摆放顺序不正确把代表左边显示器的图标拖动到左侧即可
从零到熟练编写LaTex数学公式，这两篇就够了

第一篇 LaTex公式编辑方法快速手敲一遍熟悉常用操作第二篇 CSDN官方参考文档有不清楚的随手查阅在线公式编辑实在打不出就在线编辑吧
R语言系统教程（一）：向量及其相关操作

R语言系统教程一向量及其相关操作前言 1 1 向量 Vector 赋值 1 10 4 5 6 3 1 6 4 21 7 运算常用函数 1 2 Generate常用向量 Vector 等差数列等间隔函数重复函数 1 3 逻辑向量
coco 输出格式，MPII 输出格式，标注

pose 1 数据集 coco 输出格式 MPII 输出格式代码详解 1 2 blobFromImage函数 1 数据集 BODY25 COCO MPI coco 输出格式鼻子 0 颈部 1 右肩 2 右肘 3 右手腕 4 左肩 5