目标检测、目标分割:常用框架与流程(流程包括:数据集标注与格式预处理、训练与推理、训练优化、算法代码以及原理)

1.目标检测(矩形框):

①常用模型YOLO5

1°入门使用,具体见这篇博客

YOLOv5训练自己的数据集(超详细完整版)_深度学习菜鸟的博客-CSDN博客_yolov5训练自己的数据

(补充说明:其中的数据一开始是VOC格式自定义数据集,因此建议直接使用labelImg来标注自己的数据,导出直接是VOC格式)

训练技巧与优化:

Tips for Best Training Results 📌 - YOLOv5 Documentation

2°训练结束后看训练结果,看这些博客:

yolov5 训练结果解析_sinat_37322535的博客-CSDN博客_yolov5训练结果分析

目标检测中的mAP是什么含义? - 知乎

3°YOLO5代码解读与原理

Yolov5总结文档(理论、代码、实验结果)

深入浅出Yolo系列之Yolov5核心基础知识完整讲解_江南研习社-CSDN博客_yolov5

②常用框架:mmdetection

mmdetection/README_zh-CN.md at master · open-mmlab/mmdetection · GitHub

其中,

1°安装(可以参考里面的“从零开始设置脚本”那一节):https://github.com/open-mmlab/mmdetection/blob/master/docs/zh_cn/get_started.md

2°自定义数据集看这篇:

mmdetection/2_new_data_model.md at master · open-mmlab/mmdetection · GitHub

其中,建议使用COCO格式的自定义数据集,因此我们可以使用labelme工具标记数据(矩形框),然后可以参考这篇:

​​​​​​目标检测前奏:labelme的矩形框标记好数据以后,转成COCO格式_starDu-CSDN博客_labelme转coco 目标检测

③常用框架:百度飞浆paddlepaddle

Paddle/README_cn.md at develop · PaddlePaddle/Paddle · GitHub

https://github.com/PaddlePaddle/awesome-DeepLearning  (工业项目案例,建议以此作为入门实战,例如目标检测的话可以学习里面的头盔检测,包括优化模型思路)

④YoloX模型:

“白话”目标检测系列:YOLO X

【深度学习】解决YOLOX训练时AP为0_MangoloD的博客-CSDN博客_扫描到的ap数目为0

2.目标分割(多边形框):

①常用框架mmdetection

mmdetection/README_zh-CN.md at master · open-mmlab/mmdetection · GitHub

其中,自定义数据集看这篇:

mmdetection/2_new_data_model.md at master · open-mmlab/mmdetection · GitHub

建议使用COCO格式的自定义数据集,因此我们可以使用labelme工具标记数据(多边形框),可以参考这篇来制作COCO数据集(多边形):

labelme标注格式转coco格式_1037号森林里一段干木头的博客-CSDN博客

(备注:转化建议在linux下可成功运行,windows下运行可能会报错)

②常用框架:百度飞浆paddlepaddle

Paddle/README_cn.md at develop · PaddlePaddle/Paddle · GitHub

https://github.com/PaddlePaddle/awesome-DeepLearning  (工业项目案例,建议以此作为入门实战,目标分割的话例如里面的钢材缺陷检测)

3.推理异步(并行)加速:

①框架mmdetection是直接带有并行推理的例子的;

②其他的话(yolo系列,paddlepaddle等)可以官网教程看看是否支持,假如需要自己写的话,也可以学习以下常用模式:python的并发例子+flask等web框架提供算法post端口+docker封装

Python3 多线程 | 菜鸟教程

使用Web框架 - 廖雪峰的官方网站

4.把以上算法的推理做成应用

①例如集成到C/S架构单机版的时候,做界面的常用方法有:C#的话有自带图形界面控件;c++的话有MFC、C++版本的QT;python的话可以选择PyQT(【第五节】PyQt5事件和信号-PyQt5中文教程)

②B/S架构

版权声明:本文为CSDN博主「starRunner」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/baidu_26408419/article/details/122239607

starRunner

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

基于AI的图像视觉处理技术

计算机视觉是一门研究如何使机器”看“的科学,作为一个学科,它试图建立能够从图像或多维数据中获取”信息“的人工智能系统。 一、检测跟踪 ​ 1.MTCNN MTCNN是比较经典快速的人脸检测技术,它可实