Day 14 - 安装与执行 YOLO

Day 14 - 安装与执行 YOLO

介绍影像辨识的处理流程 - Day 10 有提到 YOLO 模型是由 Joseph Redmon 所提出,而到了 YOLOV4 后才换成另外一群人继续发展,YOLOV4 的作者是 Alexey Bochoknovskiy, Chien-Yao Wang, 与 Hong-Yuan Mark Liao,YOLOV5 的作者 Glenn Jocher

安装 YOLO

今天会将 YOLOV3 安装在 Amazon Linux 2,首先从 Joseph Redmon 所建立的 Darknet 进入安装步骤,首先去 darknet 的 github 官网下载套件,接着修改 Makefile 编译组态档,将 GPU,CUDNN 打开,因为这个版本的 AMI 已经有安装 CUDA 等驱动程式,此外还要设定 GPU 架构,因为 gx4n 这类 EC2 使用的是 Tesla T4 的 GPU,所以要去查相对应的架构,可以在 Matching CUDA arch and CUDA gencode for various NVIDIA architectures 这个网站中查到,下图中一个显示 Makefile 的内容,一个透过指令来查 GPU 的使用状况。

git clone https://github.com/pjreddie/darknet.git
cd darknet
# 检查 GPU 的型号与记忆体容量
nvidia-smi
# 修改 Makefile 编译组态档
vi Makefile
make

Makefile

GPU=1 # enable GPU
CUDNN=1 # enable CUDNN
OPENCV=0
OPENMP=0
DEBUG=0

ARCH= -gencode arch=compute_30,code=sm_30 \
      -gencode arch=compute_35,code=sm_35 \
      -gencode arch=compute_50,code=[sm_50,compute_50] \
      -gencode arch=compute_52,code=[sm_52,compute_52]\
      -gencode arch=compute_75,code=[sm_75,compute_75]
# for Tesla T4

在这里插入图片描述
图 1、修改 Makefile 设定

在这里插入图片描述
图 2、检查 GPU 的型号与记忆体容量

执行 YOLO

执行 yolov3 演算法,用来辨识 dog.jpg 这张图片,使用的是事先训练好的模型 yolov3.weights,采用 cfg/yolov3.cfg 的组态设定。

# 下载预先训练好的权重模型
wget https://pjreddie.com/media/files/yolov3.weights
# 注意一下执行的所在文件夹应为 /home/ec2-user/fishRecognition/fishsite/darknet
./darknet detector test cfg/coco.data cfg/yolov3.cfg yolov3.weights data/dog.jpg

下图中可以看出来,总共辨识出三种物件,分别是狗、卡车跟脚踏车,所花的辨识时间为 0.0934 秒,主要是因为有开启 GPU。

在这里插入图片描述
图 3、利用预先训练好的模型来辨识图片

下图为待预测的图片 data/dog.jpg。

在这里插入图片描述
图 4、待预测的图片

下图为预测后的图片,预设会存为 predictions.jpg。

在这里插入图片描述
图 5、预测后的图片

而之所以会辨识为 dog, truck, bicycles,是在 cfg/coco.data 内定义的。

使用 Python 执行 YOLO

我们这里用的方法并不是全部用 Python 重写一遍,而是在 Python 中呼叫 c 语言所提供的呼叫介面,存取 libdarknet.a 这个静态函式库。

darknet 已经将 Python 呼叫 C 语言函式库的介面写好了,放在 python/darknet.py 这个档案里,唯一需要修改的是将 154 行中的语法改成 Python 3的语法,如下图所示。

在这里插入图片描述
图 6、修改 darknet.py 的代码

接着撰写 fishRecognition.py 这个档案,就是把命令列中的参数,都直接放到 Python原始码内就可以。最后呼叫 dn.detect 方法来进行预测。

fishRecognition.py

# 引入 python/darknet.py 
import python.darknet as dn
from datetime import datetime

print('load view model')
net = dn.load_net(str.encode("./cfg/yolov3.cfg"),
                  str.encode("./yolov3.weights"), 1)
meta = dn.load_meta(str.encode("./cfg/coco.data"))
print('start to predict...\n')
n = datetime.now()
r = dn.detect(net, meta, str.encode("./data/dog.jpg"))
print(r, '\n', datetime.now()-n)

下图是执行结果,不只是得到每个物件的名称,准确度,还有方块框的座标,最后一个是我们写来判断预测所花的时间,约 0.11 秒

在这里插入图片描述
图 7、使用 Python 语法呼叫 darknet 函式库

参考资料

  • YOLOv5 Documentation, https://docs.ultralytics.com/
  • Darknet, https://github.com/pjreddie/darknet
  • Installing Darknet, https://pjreddie.com/darknet/install/
  • Matching CUDA arch and CUDA gencode for various NVIDIA architectures, https://arnon.dk/matching-sm-architectures-arch-and-gencode-for-various-nvidia-cards/
  • Calculating Time Difference, https://stackoverflow.com/questions/3426870/calculating-time-difference

版权声明:本文为CSDN博主「Yehchitsai」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/m0_50614038/article/details/121001347

Yehchitsai

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

GiraffeDet:Heavy Neck的目标检测框架

关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 获取论文:关注并回复“GD” 计算机视觉研究院专栏 作者:Edison_G 在传统的目标检测框架中,从图像识别模型继承的主

目标检测中的数据格式转换工具Roboflow

目标检测中的数据格式转换工具、Roboflow Roboflow提供了您需要的所有工具,将原始图像转换为定制的训练有素的计算机视觉模型,并部署它在您的应用程序中使用。 Roboflow支持检测目标和分类模型。 支持多种标注格式的转换: