对每个ROI来说,多任务损失函数如下:
![这里写图片描述](https://img-blog.csdn.net/20170503162550667?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGFueXV4dWFuMTAw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
mask分支对于每个RoI有Km2 维度的输出。K个(类别数)分辨率为m*m的二值mask。
因此作者利用了a per-pixel sigmoid,并且定义 Lmask 为平均二值交叉熵损失(the average binary cross-entropy loss).
对于一个属于第k个类别的RoI, Lmask 仅仅考虑第k个mask(其他的掩模输入不会贡献到损失函数中)。这样的定义会允许对每个类别都会生成掩模,并且不会存在类间竞争。
![这里写图片描述](https://img-blog.csdn.net/20170503162246553?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGFueXV4dWFuMTAw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
附录:
sigmoid函数解释如下:
http://blog.163.com/liyanhua_08/blog/static/1172002772009927111741738/
softmax函数解释如下:
https://www.zhihu.com/question/23765351
交叉熵损失函数的解释如下:
http://blog.csdn.net/u012162613/article/details/44239919
各种损失函数的解释如下:
http://blog.csdn.net/u014114990/article/details/47802993