OpenMMLab-AI实战营第二期-人体关键点检测与MMPose

2023-11-07

人体关键点检测与MMPose

课程链接:https://www.bilibili.com/video/BV1kk4y1L7Xb
这个课程的大致内容是介绍如何从给定的二维影像中恢复出人体的姿态(2D或者3D),大纲如下所示,基本上可以认为流程是:先是恢复2D的关节点姿态,然后是3D的关节点姿态,最后直接演变成三维模型的姿态(更加精细)。
虽然我对这个研究方向完全不感兴趣,但是学习了解一下也不错。
在这里插入图片描述

2D姿态估计

2D姿态估计就是利用图片恢复人体关键点姿态,其方法思路可以分为基于回归(直接回归关键点的坐标)和基于热力图(预测关键点的位置分布图)两大类。
在这里插入图片描述
基于回归看起来很简单,但是显然无脑 a − b a-b ab的方式很难回归出关键点的正确位姿,比较合理的方式还是预测分布。。。虽然理解起来可能有点困难,但是明显更合理。你不能要求神经网络去学习高频的东西(一张图片上只有一个正确的坐标,其他都是错误的,样本太不均匀)。
在这里插入图片描述
基于热力图听起来就非常合理,根据像素与关节点的位置生成热力图,然后预测一个平滑的分布图即可。当然最终应用的时候,我们只需要一个坐标值,直接加权求和就完了。
在这里插入图片描述
在这里插入图片描述

3D姿态估计

2D的坑看样子没过多久就被填满了,马上就开始回归三维坐标。提到了三种思路:直接猜、连续影像猜和多视角猜。
在这里插入图片描述
结果好像是基于2D预测结果直接猜就不错,多张猜更好。我的感觉是一个好的骨架给定后,由于人四肢躯干的长度都是固定的,2D-3D之前显然存在一个几何变换(当然我也是猜的),所以网络学习起来比较容易。
在这里插入图片描述
在这里插入图片描述
当然直接用三维热力图也是可以的。恍惚之间,在这里想起类BEV,红红火火。
在这里插入图片描述

三维模型

不知道为啥并没有介绍太多3D姿态估计,估计三维模型还是更好一些。基于一些图形学的复杂工具,似乎网路的负担更低了,只需要学习一些固定的参数。
在这里插入图片描述介绍了三种,但是都没看太懂,但是反正就是某种固定的动画模式???反正就是一步一步,又回到了单张出三维模型。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多人姿态估计

我稍微调整了一下PPT的顺序,把某些分成了多人姿态估计。上边说的所有方法都是一个人,但是这太不场景了,更多的还是多人。有两种方法,two-stage和one-shot(目标检测只乎内行)。
在这里插入图片描述
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OpenMMLab-AI实战营第二期-人体关键点检测与MMPose 的相关文章

随机推荐

  • A记录,子域名,CNAME,MX,TXT,SRV

    http zhanghucheng cn post 8 A记录 A Address 记录是用来指定主机名 或域名 对应的IP地址记录 用户可以将该域名下的网站服务器指向到自己的web server上 同时也可以设置您域名的子域名 通俗来说A
  • Git:Unable to negotiate with错误

    今天更新了一下Git版本 发现推送代码的时候提示 Unable to negotiate with xx xx xx xx port 29418 no matching host key type found Their offer ssh
  • JS 如何将数组对象中多个特定值取出形成新数组

    有如下数据 list mainId 581 errMsg null sort null status null nowFarmId null nowPigstyId null insideEarCode MT5687G pigEntityC
  • Linux操作系统原理与应用实验 实验三 实验四 问题总结

    本文是在进行Linux实验三和实验四所遇到的问题或学到的小知识进行总结 以调通程序为内容导向 问题的解决方法或许不难 也都能搜到 但是如果笔者自己总结下来能够节省很多人去搜索解决方法的繁琐步骤 节省大家的时间 实验三 文件操作算法 新版本带
  • gdb调试动态链接库

    转自 http www cnblogs com ybgame archive 2012 03 23 2414078 html 在 Linux 可以用 gdb 来调试应用程序 当然前提是用 gcc 编译程序时要加上 g 参数 我这篇文章里将讨
  • ML学习笔记(二)----交叉验证、偏差和方差分析

    什么是交叉验证 交叉验证是一种模型验证技术 可用于评估统计分析 模型 结果在其它独立数据集上的泛化能力 它主要用于预测 我们可以用它来评估预测模型在实践中的准确度 交叉验证的目标是定义一个数据集 以便于在训练阶段 例如 验证数据集 中测试模
  • JAVA中类的加载过程

    摘自 http soft chinabyte com database 312 12643812 shtml http www cnblogs com yshb archive 2012 11 05 2756194 html 类的生命周期
  • 0.96寸oled显示坏苹果(badapple)

    前言 俗话说 有屏幕的地方就会有badapple 下面带来使用0 96寸OLED屏幕显示badapple的教程 1 获取视频 首先从网上下载badapple的视频 下载地址 badapple 2 抓取视频图片 使用OLED播放视频的思想就是
  • 微信小程序开发课程学习总结(关于电影的内容)

    微信小程序开发课程学习总结 关于电影的内容 最终效果 课程学习网址 让我们开始第一步 一堆页面简介 app js 文件 app json文件 app wxss文件 好了正式开始第一个页面 新闻详情页面 电影模块 关于Template 模板
  • Asp.net可输入下拉框服务器控件 C#版

    备注 改自Ryan Liu dpliu cbdsystem com cn vb net using System using System Collections using System ComponentModel using Syst
  • 错误码:events.js:183 throw er; // Unhandled ‘error‘ event—解决方案

    显示内容 events js 291 throw er Unhandled error event Error listen EADDRINUSE address already in use 80 at Server setupListe
  • watch监听(普通和深度监听)

    普通 data user 定义要监听的对象 watch 普通监听值有变化就打印 newVal oldVal新旧值参数 user newVal oldVal console log user this user 深度监听 监听对象里面的数组或
  • 架构师日记-深入理解软件设计模式

    作者 京东零售 刘慧卿 一 设计模式与编程语言 1 1 什么是设计模式 设计模式 Design pattern 由软件开发人员在软件开发中面临常见问题的解决方案 是经过长时间的试验积累总结出来的 它使设计更加灵活和优雅 复用性更好 从实用的
  • vue2里设置input光标位置

    人狠话不多 直接上业务需求 垃圾需求 凑合看 我的业务是在企微应用里 图片识别 然后点客户姓名 手机号 输入框 识别的结果可以点击回填到输入框内 这里思考回填的情况 1 可能是 直接输入 然后点下面识别的字回填 输入框是空的 直接点一个字拼
  • 【小甲鱼C语言】课后笔记第一章第一节——打印(printf)

    目录 1 打印 就是 输出 的意思 2 使用 GCC 编译程序 gcc 源代码 o 可执行文件 3 printf 是格式化输出函数 a 函数概要 b 函数原型 c 参数分析 d 返回值 e 演示 4 转义字符 5 反斜杠的奥义 6 课后习题
  • Qt自定义标题栏-移动窗口

    前情提要 众所周知 一个最简单的窗口也是有标题栏的 Windows默认提供的标题栏上有 图标 窗口标题 Min Max Close按钮 但是 这未免太过局限 高自由度的自定义是极客 Geek 精神不可或缺的一部分 如果你想在标题栏上增加 减
  • spring.jpa.hibernate.ddl-auto的配置

    spring jpa hibernate ddl auto 可以显式设置 spring jpa hibernate ddl auto 标准的Hibernate属性值有 none validate update create create d
  • mysql之 mysql 5.6不停机双主一从搭建(活跃双主一从基于日志点复制)

    环境说明 版本 version 5 6 25 log 主1库ip 10 219 24 25主2库ip 10 219 24 22从1库ip 10 219 24 26os 版本 centos 6 7已安装热备软件 xtrabackup 防火墙已
  • A template class for binding C++ to Lua

    A template class for binding C to Lua 标签 classc bindingconstructorluafunction 2006 09 09 15 50 1397人阅读 评论 0 收藏 举报 目录 htt
  • OpenMMLab-AI实战营第二期-人体关键点检测与MMPose

    人体关键点检测与MMPose 课程链接 https www bilibili com video BV1kk4y1L7Xb 这个课程的大致内容是介绍如何从给定的二维影像中恢复出人体的姿态 2D或者3D 大纲如下所示 基本上可以认为流程是 先