2D姿态估计就是利用图片恢复人体关键点姿态,其方法思路可以分为基于回归(直接回归关键点的坐标)和基于热力图(预测关键点的位置分布图)两大类。 基于回归看起来很简单,但是显然无脑
a
−
b
a-b
a−b的方式很难回归出关键点的正确位姿,比较合理的方式还是预测分布。。。虽然理解起来可能有点困难,但是明显更合理。你不能要求神经网络去学习高频的东西(一张图片上只有一个正确的坐标,其他都是错误的,样本太不均匀)。 基于热力图听起来就非常合理,根据像素与关节点的位置生成热力图,然后预测一个平滑的分布图即可。当然最终应用的时候,我们只需要一个坐标值,直接加权求和就完了。