6D姿态估计和3D 目标检测(区别)

1.物体的6D姿态(相机系下的重心xyz+三轴的夹角abc)更完备,有物体的3D模型才有对应的6D姿态,这样就可以再计算得到size(s1,s2,s3);而目前3D检测,输入是重力方向校正的,得到的是对应完整物体的中心x,y,z,以及水平面内的夹角a,以及估计的size(s1,s2,s3);
2.6D姿态的角度范围可以是360度,但3D检测只能得到180度,因为物体旋转180度,3D包围盒不变;3.6D姿态准确度高,但受限于实例级别物体的应用,3D检测可扩展性强,但因为没有物体实例,只能基于整体的3D包围盒开展应用,如果想要对物体上的局部操作,需要依靠6D姿态得到具体局部位置或者进行语义理解;

通俗的说,物体6D位姿预测的是三个角度,而3D检测是一个角度;6D位姿目前主要是实例级别的,而3D检测更多的是类别级的;6D姿态的文章通常用空间三个角度旋转的包围盒展示6D位姿的预测结果,由于模型已知,物体的3D模型可以结合6D位姿投影到2D得到物体的mask区域;而3D检测只是在水平面上旋转的包围盒,而且投影到2D后只能得到BBox区域;有了6D的物体位姿,可以指定物体的机器人抓取部位,而只有3D检测,可以做一些避障的工作;

版权声明:本文为CSDN博主「视觉患者leon」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_39455125/article/details/112113126

视觉患者leon

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

单目3D目标检测调研

单目3D目标检测调研 一、 简介 现有的单目3D目标检测方案主要方案主要分为两类,分别为基于图片的方法和基于伪雷达点云的方法。   基于图片的方法一般通过2D-3D之间的几何约束来学习,包括目标形状信息&#xff0

CVPR2021: Sparse R-CNN新的目标检测模型

今天我们将讨论由四个机构的研究人员提出的一种方法,其中一个是字节跳动人工智能实验室。他们为我们提供了一种新的方法,称为稀疏R-CNN(不要与 Sparse R-CNN 混淆,后者在 3D 计算机视觉任务