机器视觉 6 次浏览 0 条评论 分享 场景文本识别—Mask TextSpotter v1 & v2 & v3 V1:以mask rcnn为基础,基于分割来进行端到端的文本识别。mask分支不仅能预测分割图来分割文本区域还可以预测字符概率图。 V2:在v1基础上在识别部分加入空间注意力以提升框架的文本识别能力。