机器视觉 142 次浏览 0 条评论 分享 论文阅读:ViP-CNN:Visual Phrase Guided Convolutional Nerual Network(CVPR17) 第一阶段:triplet proposal 输入图片并用卷积层提取特征, 先看上面,使用RPN提取目标物体,假设得到N个物体 那么排列组合后就有了N2个主宾对,为了去除冗余&