- 深度学习高手笔记(卷2):经典应用
- 刘岩(@大师兄)
- 434字
- 2024-09-05 16:45:42
第1章 双阶段检测
1.7.1 权值迁移函数T
MaskX R-CNN基于Mask R-CNN(见图1.22)。Mask R-CNN通过向Faster R-CNN中添加一个分割的分支任务来达到同时进行实例分割和目标检测的目的。在RPN之后,FCN和Fast R-CNN是完全独立的两个模块,此时若直接采用数据集C分别训练两个分支的话是行得通的,其实这就是YOLO9000的训练方式。
但是MaskX R-CNN不会这么简单就结束的,它在检测分支(Fast R-CNN)和分割分支中间加了一条叫作权值迁移函数的线路,用于将检测的信息传播到分割任务中,如图1.26所示。
![](https://epubservercos.yuewen.com/5A0139/30471754407902306/epubprivate/OEBPS/Images/1-26.jpg?sign=1739694662-UaoEBg5pG64eKIeJ3aZEZ8zviY3U5tHU-0-99111a1601add60e7a364809d21cbf7d)
图1.26 MaskX R-CNN检测以及分割流程
图1.26所示的整个流程是搭建在Mask R-CNN之上的,除了最重要的权值迁移函数,还有几点需要强调一下:
● T的输入参数是权值(图1.26中的两个八边形),而非特征图;
● 虽然Mask R-CNN中解耦了分类和分割任务,但是权值迁移函数T是类别无关的。
对于一个类别c,表示检测任务的权值,
表示分割任务的权值。权值迁移函数将
看作自变量,
看作因变量,学习两个权值的映射函数T:
![](https://epubservercos.yuewen.com/5A0139/30471754407902306/epubprivate/OEBPS/Images/112.jpg?sign=1739694662-jqCRqbRDm05CaxcbZbsRF7Z2nEjDH79o-0-7735815b648b60ee4d0681dd118686f9)
(1.16)
其中,θ是类别无关的、可学习的参数。T可以使用一个小型的MLP。可以是分类的权值
、检测框的预测权值
或是两者拼接到一起
。