车道线检测：LaneATT———Keep your Eyes on the Lane

文章目录[隐藏]

相关研究
本文贡献
详细解读
代码复现

Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection

论文地址：https://arxiv.org/pdf/2010.12035.pdf
Github地址：https://github.com/lucastabelini/LaneATT

本文提出一个基于锚框的深度车道线检测模型，目前在Culane数据集上F1 Score排名第一名。

本文贡献

LaneATT是一种基于锚的单级模型，类似YOLOv3或SSD。

提出了一种在大型复杂数据集上比现有最先进的方法更精确的实时车道检测方法；
比其他大多数模型更快，检测速度达到了250FPS；
提出了一种新的基于锚的车道检测注意机制。

详细解读

输入一幅图像，LaneATT使用Resnet作为特征提取，生成一个特征映射，然后汇集起来提取每个锚的特征。这些特性与一组由注意力模块产生的全局特征相结合，通过结合局部和全局特征，这在遮挡或没有可见车道标记的情况下可以更容易地使用来自其他车道的信息。最后，将组合特征传递给全连接层，以预测最终的输出车道。
模型整体架构

与Line-CNN一样，anchor是图像平面中的一条虚拟线，由位于图像的边界（顶部边界除外）的原点O=(

X_{orig}

$X_{o r i g}$ ，

Y_{orig}

$Y_{o r i g}$ )和方向θ定义。

注意力机制：
每个anchor都有对应的特征向量

a^{loc}_{i}

$a_{i l o c}$ .
在这里插入图片描述

损失函数如下：其中第一项代表车道线类型的分类损失，第二项代表以anchor为参考的车道线位置的回归损失。

模型输出由三个主要组成部分组成：
（一）K+1概率(K条车道线类型和一个类别的背景)；
（二）水平偏移x0，x1…（预测与锚线之间的水平距离)；
（三）车道线长度

$l$ 。
最后通过非极大值抑制NMS给出最后的预测结果。

代码复现

// 先配置好相关环境，cd到相关文件夹
git clone https://github.com/lucastabelini/LaneATT
cd lib/nms;
python setup.py install; 
cd -

//train，my_r18_culane为自定义实验名称
python main.py train --exp_name my_r18_culane --cfg cfgs/laneatt_culane_resnet18.yml

//test，--view all可视化
python main.py test --exp_name my_r18_culane  --view all