Complementary Trilateral Decoder for Fast and Accurate Salient Object Detection(速读啊)内含与u-shape的对比

文章目录[隐藏]

今天早早起来了

吃完饭就开始干活了

十点开始读论文

所以速读适合没有很长事假你的情况下,你只需要读懂大意就可以了

QAQ,bhys,以后一定精读,好好找找里面的专业名词整理下来呜呜呜

这次策略跟以前差一点,读一段就写一段的感想吧,这样就可以看到自己的意识流的变化(因为这些我也是第一次读,但是如果是再读的话有印象了就很难写出自己意识的变化)

abstract

上来就一个专业词汇salient object detection(SOD)显著目标检测,接下来一句应该是说他好,然后说他的缺点
其实觉得读论文也是读自己的知识的扩充,同时可以提高自己阅读英文的能力

接下来提了本文的主角CTD(complement trilateral decoder,直译一下就是互补的三边的decoder)

它有三个分支:Semantic Path, Spatial Path and Boundary Path.
在这里插入图片描述
底下说它好: improves the region accuracy and boundary quality

提供的两个vision:CTDNet-18 (11.82M, 180FPS) and CTDNet-50 (24.63M, 110FPS)

(对于小白来说,很多东西都不知道,比如这个11.82M是指参数量,FPS是 frame per second 处理速度)

在这里插入图片描述
底下有一个图片:对比性能的
在这里插入图片描述
不过这里小白有个问题(感谢大佬的解答

在这里插入图片描述

好了,没时间了,赶紧进intro

introduction

前面基本是将SOD的好处啥的

后来说抛弃了u-shape(abandon这个单词才是重点啊,第一次我眼睛的注意力根本没聚焦再这呜呜呜,还以为又是一个u-shape
在这里插入图片描述
在这里插入图片描述
更注重语义信息

最后的那几点跟前面说的差不多。

在这里插入图片描述
更注重语义,将三种东西分开

method

时间不太够了马上又要干活了

赶紧把最重要的一个图给弄好
在这里插入图片描述
前面shared encoder是公用的
后面的decoder是分开了三个分支
按照 “coarse-fine-finer” 的策略(直译由粗到细再更细

(底下有一些具体的实现得留给精读了嘤嘤嘤

不过咱可以给一篇博客
sxc大佬的%%%%
https://zhuanlan.zhihu.com/p/449005045

conclusion

提出了一种基于的 Semantic Path、Spatial Path 和 Boundary Path 的互补三边解码器。这三个分支分别解决了 dilution of emantic information, loss of spatial, and absence of boundary information
为了方便在不同环境下的实际应用,作者提供了CTDNet-18 (11.82M, 180FPS) 和 CTDNet-50 (24.63M, 110FPS) 两个版本

emmmm

总觉得看论文没有一种醍醐灌顶的感觉QAQ,就没有那种“我怎么想不到呢”的感觉。

如果仅是想要快速get内容的话也就还可以吧,但是精读需要多看看具体实现,就是看着他的思路把代码写写,想想为啥要这么放那些层那些conv,emmmm

最近这几天忙过了,就要开始正式操作了

还差很远呀~~

版权声明:本文为CSDN博主「安之若醇」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_49599247/article/details/122768220

安之若醇

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

FPN 特征金字塔 理解

Feature Pyramid Networks 对于Faster Rcnn使用FPN,cocoAP提升2.3个点,pascalAP提升3.8个点 1*1的conv,调整通道数,原论文中