对图像分割里的mask详细解释

文章目录[隐藏]

mask在不同任务中有不同的用法,分类的结果叫label。分割的结果叫mask。记录了分割结果真值,像素级别的分类标签。

图像分割里的情况

1,前背景分割这样一个二分类任务:mask就可以是(h,w,1)的二值图,1表示前景,0表示背景。
2,实例分割中:例如使用OpenCV库在python中实现,为每个对象分配颜色标签,可视化也叫mask。
3,在深度学习里,以mask-rcnn为例子:
**第一步:**假如一个输入含有s个对象,ROI区域对应到14×14大小的feature map 中。将14×14大小feature map通过反卷积变换为28×28×s【这样会更加精确,保留了空间信息】。【提取ROI区域的特征图以便于进入全连接进行分类与mask的预测】,先进行分类和bbox的回归,然后使用其结果进入FCN进行mask的生成。
**第二步:**取对应的 ROI 的正区域输入FCN,在每一个ROI内进行FCN操作。网络使用FCN预测的所有掩码。
FCN具体工作原理:FCN则是从抽象的特征中反卷积恢复出每个像素所属的类别。是对第一步的特征对齐的特征图,取每个像素在特征图中的类别可能性最大的像素值,作为这个像素最后的预测像素值,这样可以为每个像素预测一个类别(softmax分类),这样就得到了binary mask。这个mask是对特征图空间结构的编码,提取空间结构,二进制地表示出对象的空间布局。如下图:
在这里插入图片描述

版权声明:本文为CSDN博主「_seeker_wmy」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_37002116/article/details/117106655

_seeker_wmy

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

mmdetection常用命令

(注意:文中--eval bbox适用于目标检测模型,其他模型--eval 需要换参数)
1. Test
python tools/test.py configs/ballon/mas

目标检测简介和滑动窗口

一、目标检测简介
目标检测是计算机视觉中一个重要的研究方向。人眼可以轻松、准确地识别出图片中的物体是什么、这个物体在图片中的哪个位置。 对于计算机来说,在以数字形式表示的图片中寻找目标物体,并判断这个物体是什么&#

yolov4项目记录4-测试过程

目录 一、概述
二、测试过程
1.参数准备
2.定义模型
3.获取必要数据
4.输入模型
5.锚框筛选
①利用物体置信度筛选
②获取种类
③按照物体置信度排序
④非极大抑制
6.画出外接框
三、代码汇总 一、概述
训练