6D姿态估计和3D 目标检测(区别)

1.物体的6D姿态(相机系下的重心xyz+三轴的夹角abc)更完备,有物体的3D模型才有对应的6D姿态,这样就可以再计算得到size(s1,s2,s3);而目前3D检测,输入是重力方向校正的,得到的是对应完整物体的中心x,y,z,以及水平面内的夹角a,以及估计的size(s1,s2,s3);
2.6D姿态的角度范围可以是360度,但3D检测只能得到180度,因为物体旋转180度,3D包围盒不变;3.6D姿态准确度高,但受限于实例级别物体的应用,3D检测可扩展性强,但因为没有物体实例,只能基于整体的3D包围盒开展应用,如果想要对物体上的局部操作,需要依靠6D姿态得到具体局部位置或者进行语义理解;

通俗的说,物体6D位姿预测的是三个角度,而3D检测是一个角度;6D位姿目前主要是实例级别的,而3D检测更多的是类别级的;6D姿态的文章通常用空间三个角度旋转的包围盒展示6D位姿的预测结果,由于模型已知,物体的3D模型可以结合6D位姿投影到2D得到物体的mask区域;而3D检测只是在水平面上旋转的包围盒,而且投影到2D后只能得到BBox区域;有了6D的物体位姿,可以指定物体的机器人抓取部位,而只有3D检测,可以做一些避障的工作;

版权声明:本文为CSDN博主「视觉患者leon」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_39455125/article/details/112113126

视觉患者leon

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

单目3D目标检测调研

单目3D目标检测调研 一、 简介 现有的单目3D目标检测方案主要方案主要分为两类,分别为基于图片的方法和基于伪雷达点云的方法。   基于图片的方法一般通过2D-3D之间的几何约束来学习,包括目标形状信息&#xff0

目标检测简介和滑动窗口

一、目标检测简介 目标检测是计算机视觉中一个重要的研究方向。人眼可以轻松、准确地识别出图片中的物体是什么、这个物体在图片中的哪个位置。 对于计算机来说,在以数字形式表示的图片中寻找目标物体,并判断这个物体是什么&#

object detection with faster rCNN

Proposal and CropAndResize 1 custom plugin config.py 是为convert_to_uff 命令定义的。config.py文件中应该通过修改op字段将自定义层映射到TensorRT中的插件名称