机器视觉资讯20240502

行业资讯

SORA:OpenAI 的新文本到视频生成模型:2024-05-01T14:49:03+00:00

视频生成模型简介

生成式 AI 已经风靡全球,包括 ChatGPT-4、Stable Diffusion 3、Devin AI 和现在的 SORA。

SORA 是由 OpenAI 提供的图像或文本到视频生成工具。生成模型是这些令人敬畏的视频序列和逼真的小说内容背后的动力源泉。这些模型经过训练

...... 长按二维码访问原文

Paper1:回顾一篇“理解对比学习”的文章 2024-05-02 18:08

这篇论文的名字是“Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere”,发表在ICML2020上,引用也已经达到了1500+,质量非常非常高。Arxiv的链接为:https://arxiv.org/pdf/2005.10242 大家感兴趣的话,可以看原文(强烈推荐)。

这篇论文的作者都是来自MIT CSAIL,实力非常非常强了

在三四年前,对比学习在实践中取得了巨大的成功(尤其是SimCLR和MoCo),激发了很多学者的研究兴趣,无论是理论,还是将对比学习技术应用到很多很多的下游任务上,真的是看到了很多基于MoCo系列(MoCo单篇引用11k+),SimCL

......长按二维码访问原文

用于高分辨率图像合成的整流变压器缩放: 2024-05-01 22:04

...... 长按二维码访问原文

MotionLCM:实时动作生成与控制模型 2024-05-01 11:40

介绍一下 @wxDai 最新发布的MotionLCM,一个支持实时动作生成和可控生成的单步扩散模型!论文、代码、demo、项目主页、视频展示等均已公开。

MotionLCM聚焦文生动作的基础任务,旨在生成合理、逼真的人体动作。以往基于diffusion model的工作面临的最大的挑战就是效率问题,即推理时间非常长。受到consistency model的启发,MotionLCM提出了在隐空间一步生成合理的latent,并通过decoder获得合理的动作。MotionLCM支持1-4步的推理管线,1步和4步的效果几乎无异。其效率和diffusion-based models相比有了很大的提高。下面是FID和速度的比较。我们生成一个~200帧的动作大概只需要30ms,平均到每一帧计算的话可以近似成~6k fps

......长按二维码访问原文

透明点胶质量检测:机器视觉技术的全方位应用 2024-05-02 18:10

在工业生产中,透明点胶作为一种常见的粘合材料,其质量的好坏直接关系到产品的性能和外观。传统的点胶质量检测往往依赖于人工目检,不仅效率低下,而且容易受到主观因素的影响。随着机器视觉技术的快速发展,越来越多的企业开始采用机器视觉系统对透明点胶进行质量检测。本文将探讨透明点胶质量检测中,机器视觉技术可以应用于哪些方面。

一、点胶位置与形状检测

机器视觉系统可以通过图像处理和识别算法,精确检测透明点胶的位置和形状。无论是点胶的位置是否准确,还是点胶的形状是否符合要求,机器视觉都能够提供准确的数据。这对于保证产品组装的准确性和可靠性具有重要意义。

二、点胶量检测

机器视觉系统还可以通过图像处理和分析,对透明点胶的用量进行精确测量。通过对比预设的标准用量和实际图像中的点胶量,机器视觉系统能够准确判断点胶量是否合格。

......长按二维码访问原文

YOLOv9/YOLOv8算法改进【NO.127】引入迈向参数高效的动态卷积改进YOLO算法 2024-05-02 15:06

前 言

YOLO算法改进系列出到这,很多朋友问改进如何选择是最佳的,下面我就根据个人多年的写作发文章以及指导发文章的经验来看,按照优先顺序进行排序讲解YOLO算法改进方法的顺序选择。具体有需求的同学可以私信我沟通:

首推,是将两种最新推出算法的模块进行融合形成最为一种新型自己提出的模块然后引入到YOLO算法中,可以起个新的名字,这种改进是最好发高水平期刊论文。后续改进将主要教大家这种方法,有需要的朋友可私信我了解。

第一,创新主干特征提取网络,将整个Backbone改进为其他的网络,比如这篇文章中的整个方法,直接将Backbone替换掉,理由是这种改进如果有效果,那么改进点就很值得写,不算是堆积木那种,也可以说是一种新的算法,所以做实验的话建议朋友们优先尝试这种改法。

第二,创新特征融合网络,这个同理第

......长按二维码访问原文

目标检测核心之正负样本匹配与均衡问题 2024-05-01 20:27

培养孩子资源很重要,然后也要引导孩子从资源中学好。资源与引导的关系,对应到AI模型中,就是数据与引导模型训练的关系。数据固然最重要,但是如何引导模型让其学习到数据的规律,也是非常重要的。可以说,相同的模型和相同的数据,在不同人手中训练结果也会是不一样吧。

本文便是讨论目标检测模型训练的引导方式——正负样本匹配,以及样本均衡。

0 引言

AI模型的正负样本问题由来已久,实际应用中样本数量不均衡,假如一视同仁势必造成小样本的信息无法被模型掌握(模型训练时小样本的loss容易被忽略),通常需要从数据、模型架构、训练、loss等方面去做优化。

这个问题在目标检测中更为突出,因为图像里除目标外的大量背景往往都是负样本。比如以包含1000张车辆和1000张背景的图像训练集为例:1)如果只做图像分类,那么正负样本比例

......长按二维码访问原文

视觉魔法师

我还没有学会写个人说明!

相关推荐