好用的标注工具和标注数据处理代码

一. 标注工具

1.Labelme(官网链接)
windows环境:
首先安装Anaconda,Python3+版本。
安装成功后,打开Anaconda Prompt,然后依次输入以下命令。

# python3
conda create --name=labelme python=3.6 #创建虚拟环境
conda activate labelme #激活虚拟环境
pip install pyqt5  # pyqt5 can be installed via pip on python3
pip install labelme
labelme

ubuntu环境:
conda create --name=labelme python=3.6 #创建虚拟环境
conda activate labelme #激活虚拟环境
sudo apt-get install python3-pyqt5 #还没安装pyqt5,需要安装pyqt5
pip install pillow #还没安装pillow,安装pillow
pip install labelme
labelme

多边形、矩形、圆、线和点的图像注释。
用于分类和清理的图像标志注释。
视频注释。
GUI 自定义(预定义标签/标志、自动保存、标签验证等)。
导出用于语义/实例分割的 VOC 格式数据集。(语义分割,实例分割)
导出 COCO 格式的数据集以进行实例分割。(实例分割)
标注界面
2.labelImg
在线体验:图像标注工具
windows环境:
首先安装Anaconda,Python3+版本。
安装成功后,打开Anaconda Prompt,然后依次输入以下命令。

# python3
conda create --name=labelImg python=3.6 #创建虚拟环境
conda activate labelImg #激活虚拟环境
git clone https://github.com/tzutalin/labelImg.git 
conda install pyqt=5
conda install -c anaconda lxml
pyrcc5 -o libs/resources.py resources.qrc
python labelImg.py

ubuntu环境:
conda create --name=labelImg python=3.6 #创建虚拟环境
conda activate labelImg #激活虚拟环境
sudo apt-get install pyqt5-dev-tools
sudo pip3 install -r requirements/requirements-linux-python3.txt
make qt5py3
python3 labelImg.py

在这里插入图片描述
3.EasyData智能数据服务平台(百度)
easydata是一个提供数据采集、标注、清洗、加工等一站式数据服务。
支持多人标注,分配标注任务,总体使用的感觉还不错,目前还是免费使用阶段。
图像分类:单图单标签模板、单图多标签模板
物体检测:矩形框标注模板
图像分割:图像分割模板
文本分类:单文本单标签模板 短文本匹配:短文本匹配模板 情感倾向分析:情感倾向分析模板 文本实体抽取:文本实体抽取模板
音频分类:短音频单标签模板
视频分类:短视频单标签模板
在这里插入图片描述

4.CVAT (intel)
在线体验:Computer Vision Annotation Tool
CVAT 是Intel出品的开源标注工具,发布于2018年6月。其支持视频、图片等多种数据类型的标注,功能全面。CVAT也提供了丰富的高级选项,例如:
支持使用Git LFS: Git Large File Storage, 大文件的git管理插件。
调整图片质量:通过降低图片质量(压缩比)来加快高清图片的加载。
作业数和重叠数:如果一个任务中的图片量很大,可以将其分成多个作业。再配合重叠数,可以实现分配一张图片到多个作业的效果,不过暂时没有想到重叠数的使用场景。
在这里插入图片描述

5.ModelArts__华为云
华为出品的机器学习平台,发布于2018年10月,其中包含了数据标注模块。其支持从数据导入到模型运维的全流程开发,训练速度较快。
官方流程图
在这里插入图片描述

ModelArts将图像标注类型设定在了数据集层面,即创建数据集时就需要区分标注类型.华为图片处理提供的能力主要包括:设置图片效果(亮度、对比度、锐化、模糊)、设置缩略、旋转图片、剪切图片、设置水印、转化格式、压缩图片。
人工标注的特点:
目标检测标注支持多达6种形式的标注:方形、多边形、正圆、点、单线、虚线
高效的标签选择方式:在画完选框后会自动弹出标签下拉框已经展开的添加标签弹窗
图片分组:此功能会使用聚类算法或根据清晰度、亮度、图像色彩对图片进行分组。

6.dataset-tools
这个网站汇总了一些标注工具,感兴趣的额可以取体验一下
在这里插入图片描述
在这里插入图片描述

二.标注数据可视化处理

1.coco数据格式,json标注文件在图片上显示标注框

![在这里插入图片描述](https://img-blog.csdnimg.cn/b0b875f392ff4c04bceac16c06bcfdff.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5LiN5Lya5bCx6KaB5a2m5Lmg,size_19,color_FFFFFF,t_70,g_se,x_16)
import json
import shutil
import cv2

def select(json_path, outpath, image_path):
    json_file = open(json_path)
    infos = json.load(json_file)
    images = infos["images"]
    annos = infos["annotations"]
    categories=infos["categories"]
    assert len(images) == len(images)
    for i in range(len(images)):
        im_id = images[i]["id"]
        im_path = image_path  + images[i]["file_name"]
        img = cv2.imread(im_path)
        for j in range(len(annos)):
            if annos[j]["image_id"] == im_id:
                x, y, w, h = annos[j]["bbox"]
                x, y, w, h = int(x), int(y), int(w), int(h)
                x2, y2 = x + w, y + h
                label_number=annos[j]["cate_id"]
                label_name=categories[label_number-1]['name']
                img = cv2.rectangle(img, (x, y), (x2, y2), (255, 0, 255), thickness=2)
                cv2.putText(img, str(label_name),(x,y+20),cv2.FONT_HERSHEY_SIMPLEX, 0.7,(0, 250, 250),thickness=2)
                img_name = outpath + images[i]["file_name"]
                print(img_name)
                cv2.imwrite(img_name, img)
                # continue
        # print(i)

if __name__ == "__main__":
    json_path = "label_test1/Annotations/1-1-1.json"#放标注json的地址
    out_path = "label_test1/result/"#结果放的地址
    image_path = "label_test1/Images/"#原图的地址
    select(json_path, out_path, image_path)

2.voc数据集,利用xml分割目标框图片保存

from __future__ import division
import os
from PIL import Image
import xml.dom.minidom
import numpy as np
ImgPath = 'pic/'         #原图放的地方
AnnoPath = 'xml/'       #xml标注文件放的地方
ProcessedPath = 'train_pic/'  
imagelist = os.listdir(ImgPath)
for image in imagelist:
    image_pre, ext = os.path.splitext(image)
    imgfile = ImgPath + image
    print(imgfile)
    if not os.path.exists(AnnoPath + image_pre + '.xml'): continue
    xmlfile = AnnoPath + image_pre + '.xml'
    DomTree = xml.dom.minidom.parse(xmlfile)
    annotation = DomTree.documentElement
    filenamelist = annotation.getElementsByTagName('filename')  # [<DOM Element: filename at 0x381f788>]
    # filename = filenamelist[0].childNodes[0].data
    objectlist = annotation.getElementsByTagName('object')
    i = 1
    for objects in objectlist:
        namelist = objects.getElementsByTagName('name')
        objectname = namelist[0].childNodes[0].data
        savepath = ProcessedPath + objectname
        if not os.path.exists(savepath):
            os.makedirs(savepath)
        bndbox = objects.getElementsByTagName('bndbox')
        cropboxes = []
        for box in bndbox:
            x1_list = box.getElementsByTagName('xmin')
            x1 = int(x1_list[0].childNodes[0].data)
            y1_list = box.getElementsByTagName('ymin')
            y1 = int(y1_list[0].childNodes[0].data)
            x2_list = box.getElementsByTagName('xmax')
            x2 = int(x2_list[0].childNodes[0].data)
            y2_list = box.getElementsByTagName('ymax')
            y2 = int(y2_list[0].childNodes[0].data)
            w = x2 - x1
            h = y2 - y1
            obj = np.array([x1, y1, x2, y2])
            shift = np.array([[1, 1, 1, 1]])
            XYmatrix = np.tile(obj, (1, 1))
            cropboxes = XYmatrix * shift
            img = Image.open(imgfile)
            for cropbox in cropboxes:
                cropedimg = img.crop(cropbox)
                cropedimg.save(savepath + '/' + image_pre + '_' + str(i) + '.jpg')
                i += 1

三.数据格式转换

参考:
1.https://github.com/DLLXW/objectDetectionDatasets

更多了解请关注:
知乎:FUNNY AI

版权声明:本文为CSDN博主「Funny_AI_LAB」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/sexy19910923/article/details/121395621

Funny_AI_LAB

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

Yolo(3)(项目)Yolo v3 目标检测(85分类)

目录 基础理论 一、 读取文件 二、神经网络初始化 1、搭建神经网络 2、GPU加速 三、打开摄像头、按帧读取图像 四、向神经网络输入 五、获取神经网络输出 1、获取各层名称 2、获取输出层名称 3、获取输出层图像&#xff

GiraffeDet:Heavy Neck的目标检测框架

关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 获取论文:关注并回复“GD” 计算机视觉研究院专栏 作者:Edison_G 在传统的目标检测框架中,从图像识别模型继承的主

yolov4训练测试自己的数据集关键点总结

在实习中,有一个任务是训练出一个车辆检测的yolov4模型。感觉yolov4的功能好强大啊!特此记录一下自己在使用过程中的一些改动。 yolov4论文,yolov4源码 首先肯定是要配置相关的环境&#