神经网络学习小记录66——Keras版 Vision Transformer(VIT)模型的复现详解
学习前言
视觉Transformer最近非常的火热,从VIT开始,我先学学看。
什么是Vision Transformer(VIT)
Vision Transformer是Tran
学习前言
视觉Transformer最近非常的火热,从VIT开始,我先学学看。
什么是Vision Transformer(VIT)
Vision Transformer是Tran
先说方法,关闭加载预训练,在train.py进行如下修改
def create_model(input_shape, anchors, num_classes, load_pretrainedFalse, free
开始写几篇博客吧,一是整理,二是记录。 这是当初实习做的一个小东西,太久远了忘了是参考哪位大佬的了。。其实就是把yolo的bbox位置写进xml里,当时用cvat纯手动标注图片࿰
算法小白,尝试使用yolov3算法检测自己的数据集,最开始自己制作了数据集(167张图像)用于训练,训练后进行检测时发现,无法有效框出目标物体,输出如下: 自认