OpenMMLab-AI实战营第二期-人体关键点检测与MMPose

2023-11-07

人体关键点检测与MMPose

课程链接：https://www.bilibili.com/video/BV1kk4y1L7Xb
这个课程的大致内容是介绍如何从给定的二维影像中恢复出人体的姿态（2D或者3D），大纲如下所示，基本上可以认为流程是：先是恢复2D的关节点姿态，然后是3D的关节点姿态，最后直接演变成三维模型的姿态（更加精细）。
虽然我对这个研究方向完全不感兴趣，但是学习了解一下也不错。
在这里插入图片描述

2D姿态估计

2D姿态估计就是利用图片恢复人体关键点姿态，其方法思路可以分为基于回归（直接回归关键点的坐标）和基于热力图（预测关键点的位置分布图）两大类。
在这里插入图片描述
基于回归看起来很简单，但是显然无脑 a − b a-b a−b的方式很难回归出关键点的正确位姿，比较合理的方式还是预测分布。。。虽然理解起来可能有点困难，但是明显更合理。你不能要求神经网络去学习高频的东西（一张图片上只有一个正确的坐标，其他都是错误的，样本太不均匀）。
在这里插入图片描述
基于热力图听起来就非常合理，根据像素与关节点的位置生成热力图，然后预测一个平滑的分布图即可。当然最终应用的时候，我们只需要一个坐标值，直接加权求和就完了。

3D姿态估计

2D的坑看样子没过多久就被填满了，马上就开始回归三维坐标。提到了三种思路：直接猜、连续影像猜和多视角猜。
在这里插入图片描述
结果好像是基于2D预测结果直接猜就不错，多张猜更好。我的感觉是一个好的骨架给定后，由于人四肢躯干的长度都是固定的，2D-3D之前显然存在一个几何变换（当然我也是猜的），所以网络学习起来比较容易。
在这里插入图片描述

当然直接用三维热力图也是可以的。恍惚之间，在这里想起类BEV，红红火火。

三维模型

不知道为啥并没有介绍太多3D姿态估计，估计三维模型还是更好一些。基于一些图形学的复杂工具，似乎网路的负担更低了，只需要学习一些固定的参数。
在这里插入图片描述介绍了三种，但是都没看太懂，但是反正就是某种固定的动画模式？？？反正就是一步一步，又回到了单张出三维模型。

多人姿态估计

我稍微调整了一下PPT的顺序，把某些分成了多人姿态估计。上边说的所有方法都是一个人，但是这太不场景了，更多的还是多人。有两种方法，two-stage和one-shot（目标检测只乎内行）。
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenmmLab

人工智能

深度学习

机器学习

OpenMMLab-AI实战营第二期-人体关键点检测与MMPose 的相关文章

【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
Soul App：年轻人的社交状态，还有多少种可能？

查尔斯狄更斯在双城记的开篇写下这是最好的时代这是最坏的时代这是智慧的时代这是愚蠢的时代这是信仰的时期这是怀疑的时期人们面前有着各样事物人们面前一无所有既然万事万物都和狄更斯所说般好坏参半那又何必执着于过去苦恼于
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
机器学习算法实战案例：LSTM实现多变量多步负荷预测

文章目录 1 数据处理 1 1 数据集简介 1 2 数据集处理 2 模型训练与预测 2
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
CorelDRAW2024官方中文版重磅发布更新

35年专注于矢量设计始于1988年并不断推陈出新致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

A记录,子域名,CNAME,MX,TXT,SRV

http zhanghucheng cn post 8 A记录 A Address 记录是用来指定主机名或域名对应的IP地址记录用户可以将该域名下的网站服务器指向到自己的web server上同时也可以设置您域名的子域名通俗来说A
Git：Unable to negotiate with错误

今天更新了一下Git版本发现推送代码的时候提示 Unable to negotiate with xx xx xx xx port 29418 no matching host key type found Their offer ssh
JS 如何将数组对象中多个特定值取出形成新数组

有如下数据 list mainId 581 errMsg null sort null status null nowFarmId null nowPigstyId null insideEarCode MT5687G pigEntityC
Linux操作系统原理与应用实验实验三实验四问题总结

本文是在进行Linux实验三和实验四所遇到的问题或学到的小知识进行总结以调通程序为内容导向问题的解决方法或许不难也都能搜到但是如果笔者自己总结下来能够节省很多人去搜索解决方法的繁琐步骤节省大家的时间实验三文件操作算法新版本带
gdb调试动态链接库

转自 http www cnblogs com ybgame archive 2012 03 23 2414078 html 在 Linux 可以用 gdb 来调试应用程序当然前提是用 gcc 编译程序时要加上 g 参数我这篇文章里将讨
ML学习笔记（二）----交叉验证、偏差和方差分析

什么是交叉验证交叉验证是一种模型验证技术可用于评估统计分析模型结果在其它独立数据集上的泛化能力它主要用于预测我们可以用它来评估预测模型在实践中的准确度交叉验证的目标是定义一个数据集以便于在训练阶段例如验证数据集中测试模
JAVA中类的加载过程

摘自 http soft chinabyte com database 312 12643812 shtml http www cnblogs com yshb archive 2012 11 05 2756194 html 类的生命周期
0.96寸oled显示坏苹果(badapple)

前言俗话说有屏幕的地方就会有badapple 下面带来使用0 96寸OLED屏幕显示badapple的教程 1 获取视频首先从网上下载badapple的视频下载地址 badapple 2 抓取视频图片使用OLED播放视频的思想就是
微信小程序开发课程学习总结（关于电影的内容）

微信小程序开发课程学习总结关于电影的内容最终效果课程学习网址让我们开始第一步一堆页面简介 app js 文件 app json文件 app wxss文件好了正式开始第一个页面新闻详情页面电影模块关于Template 模板
Asp.net可输入下拉框服务器控件 C#版

备注改自Ryan Liu dpliu cbdsystem com cn vb net using System using System Collections using System ComponentModel using Syst
错误码：events.js:183 throw er； // Unhandled ‘error‘ event—解决方案

显示内容 events js 291 throw er Unhandled error event Error listen EADDRINUSE address already in use 80 at Server setupListe
watch监听（普通和深度监听）

普通 data user 定义要监听的对象 watch 普通监听值有变化就打印 newVal oldVal新旧值参数 user newVal oldVal console log user this user 深度监听监听对象里面的数组或
架构师日记-深入理解软件设计模式

作者京东零售刘慧卿一设计模式与编程语言 1 1 什么是设计模式设计模式 Design pattern 由软件开发人员在软件开发中面临常见问题的解决方案是经过长时间的试验积累总结出来的它使设计更加灵活和优雅复用性更好从实用的
vue2里设置input光标位置

人狠话不多直接上业务需求垃圾需求凑合看我的业务是在企微应用里图片识别然后点客户姓名手机号输入框识别的结果可以点击回填到输入框内这里思考回填的情况 1 可能是直接输入然后点下面识别的字回填输入框是空的直接点一个字拼
【小甲鱼C语言】课后笔记第一章第一节——打印（printf）

目录 1 打印就是输出的意思 2 使用 GCC 编译程序 gcc 源代码 o 可执行文件 3 printf 是格式化输出函数 a 函数概要 b 函数原型 c 参数分析 d 返回值 e 演示 4 转义字符 5 反斜杠的奥义 6 课后习题
Qt自定义标题栏-移动窗口

前情提要众所周知一个最简单的窗口也是有标题栏的 Windows默认提供的标题栏上有图标窗口标题 Min Max Close按钮但是这未免太过局限高自由度的自定义是极客 Geek 精神不可或缺的一部分如果你想在标题栏上增加减
spring.jpa.hibernate.ddl-auto的配置

spring jpa hibernate ddl auto 可以显式设置 spring jpa hibernate ddl auto 标准的Hibernate属性值有 none validate update create create d
mysql之 mysql 5.6不停机双主一从搭建（活跃双主一从基于日志点复制）

环境说明版本 version 5 6 25 log 主1库ip 10 219 24 25主2库ip 10 219 24 22从1库ip 10 219 24 26os 版本 centos 6 7已安装热备软件 xtrabackup 防火墙已
A template class for binding C++ to Lua

A template class for binding C to Lua 标签 classc bindingconstructorluafunction 2006 09 09 15 50 1397人阅读评论 0 收藏举报目录 htt
OpenMMLab-AI实战营第二期-人体关键点检测与MMPose

人体关键点检测与MMPose 课程链接 https www bilibili com video BV1kk4y1L7Xb 这个课程的大致内容是介绍如何从给定的二维影像中恢复出人体的姿态 2D或者3D 大纲如下所示基本上可以认为流程是先

热门标签