机器视觉资讯20240408

文章目录[隐藏]

行业资讯

Teledyne e2v宣布推出用于实时2D视觉和3D深度数据的Topaz5D图像传感器--机器视觉网 2024-04-08 14:27:20

2024-04-08 14:27:20 来源: 中国机器视觉网

Teledyne e2v宣布推出Topaz5D™,一款全高清CMOS图像传感器,旨在将2D视觉与3D深度图生成结合在一起。在挑战性照明条件下使用的单个Topaz5D传感器可根据检测到的对比度提供3D物体深度信息,非常适合各种物流应用、AR/VR头显、访问控制设备、家用清洁机器人和自主移动机器人(AMR)。

Topaz5D将2D视觉与3D深度图生成相结合

Topaz5D将小型2.5 µm全局快门像素与后处理衍射层结合来创建角度敏感像素。这样可以生成3D角度信号原始数据,然后由5D版本SDK进行处理。Topaz5D是Teledyne e2v热门产品Topaz 2M的3D变体,广泛应用于物流/零售市场和智能工厂。

Topaz5D具有2百万像素(1

......长按二维码访问原文

长芯盛推出Camera Link长距离高柔混合光纤数据线新品--机器视觉网 2024-04-08 14:08:30

2024-04-08 14:08:30 来源: 中国机器视觉网

长芯盛(武汉)科技有限公司(以下简称“长芯盛”)成立于2013年,是湖北省第四批专精特新“小巨人”企业之一。公司拥有自主研发光电转换芯片、特种耐弯折光纤等核心技术优势,并致力于深耕光纤通信行业。产品广泛应用于机器视觉、虚拟现实、视频会议、数据中心和数字标牌等工业和终端消费领域,为众多知名企业提供配套产品解决方案,在行业内树立了广泛的知名度并获得一致认可。

为满足市场需求,尤其是解决机器视觉行业Camera Link相机在实际应用中的长距离连接问题,长芯盛加大了研发投入力度,并成功推出了首款传输距离可达40米的Camera Link 2.1高柔混合光纤数据线。这一创新产品填补了市场空白,受到业界和工程领域的积极关注与好评。

Camera Lin

......长按二维码访问原文

越疆机器人发布了 AI 训练机器人 X-Trainer--机器视觉网 2024-04-08 11:35:55

2024-04-08 11:35:55 来源: 中国机器视觉网

4月2日,智能协作机械臂厂商越疆机器人发布了 AI 训练机器人 X-Trainer。视频显示了 X-Trainer 采用模仿学习神经网络+ 视觉大语言模型,训练 2 小时,获得了自主刷盘子的能力,相较普遍的训练时长,节省了 70% 的训练时间。

从带有红色食物残留物的盘子、放在黄色盘子上的海绵,以及后面挂着碟子的金属架,推理出清洗盘子并收纳到金属架的任务。

擦拭三连,不放过一点残留的污渍。

机器人刷完盘子准备放进盘架时,突然被人为干预再次弄脏盘子,但机器人迅速捕捉到这一变化,并立即做出反应。

实际上,X-Trainer 融合了智能机器人与 AI 最前沿技术,使得机器人能够快速模仿学习人类复杂动作,最终实现行为克隆。

越疆科技联合创始

......长按二维码访问原文

复旦微电超高频标签芯片获GS1 Gen2V2认证--机器视觉网 2024-04-08 11:15:07

2024-04-08 11:15:07 来源: 中国机器视觉网

近日,上海复旦微电子集团股份有限公司UHF RFID(超高频)标签芯片FM13UF0051E经第三方权威机构(中国物品编码中心)检测,成功通过GS1 EPC global Gen2V2认证。该机构是亚太地区唯一一家获得国际物品编码组织(GS1)授权的认证测试机构。

GS1(国际物品编码组织)是负责制订、管理和维护全球统一标识系统和国际标准的非营利性国际组织。全球现已有150多个国家和地区的116个编码组织加入GS1,200多万家企业注册使用GS1的厂商识别代码;GS1系统已在快消、零售、制造、物流、电子商务、食品安全追溯、医疗卫生、建材等30多个行业和领域得到广泛应用。

复旦微电本次获得的GS1 EPC global Gen2V2认证就是由G

......长按二维码访问原文

无需贴点、效率倍增,跟踪式激光扫描系统在大尺寸精密测量中显身手--机器视觉网 2024-04-08 16:04:15

2024-04-08 16:04:15 来源: 中国机器视觉网

精准测量是支撑高质量制造的基石。先临三维的高精度工业3D扫描技术作为一种光学测量工具,凭借其高精度、高效率、非接触等优势,为高端制造的精密三维尺寸检测提供保障。当下,这项技术已经渗透至到汽车工业、航天制造、电子电器、教育科研等行业,满足了不同用户对三维尺寸检测的需求。

在工业领域,激光3D扫描仪得到了广泛应用。然而,传统的激光3D扫描仪需要在被测物体上粘贴标志点,以实现高精度三维数据的拼接与获取。在大型工件的三维尺寸检测中,这种方式动辄需要粘贴和去除成百上千个标志点,耗费大量时间。

先临三维的跟踪式激光扫描系统以动态跟踪、不贴点的独特优势,以及激光扫描高精度、高效率、材质适应性佳的稳定表现,为大型工件精准的三维尺寸检测提供了破题思路。通过在扫

......长按二维码访问原文

视展光电偏振智能高温监控摄像机--机器视觉网 2024-04-08 15:58:18

2024-04-08 15:58:18 来源: 中国机器视觉网

光的偏振原理

光的偏振是光的基本属性,反映了光在传播过程中振动方向随时间的变化规律,光的偏振态蕴含着丰富的目标和环境信息。偏振成像是同时获取光的强度、光谱、偏振的新一代成像技术,将视觉信息从二维扩展到更高维度,为获取目标与环境信息提供了新路径

应用背景

由于高温、强光、浓烟与粉尘的影响,传统监控设备与人工观测无法获取清晰的一线生产画面只能依赖于人工观测,导致操作可靠性低,人员劳动强度大。

偏振智能高温监控摄像机采用全新偏振光机组件,内置多种偏振重构与强光抑制算法,可实现对炼铁、热轧、焦化等复杂场景的可视化成像。在实际应用中能够显著提升生产安全系数,降低工人在恶劣环境下劳动强度,为生产智能化提供视觉支持。

功能特点

穿烟透雾:偏振成像可

......长按二维码访问原文

迁移科技3D视觉引导拆码垛方案:耐火材料产线的智能化升级之选--机器视觉网 2024-04-08 15:51:18

2024-04-08 15:51:18 来源: 中国机器视觉网

随着先进科技的不断发展,工业自动化已经成为耐火材料产线的重要发展方向。其中,3D视觉技术在拆码垛环节的应用,更是推动了耐火材料产线生产效率与安全性的双重提升。

迁移科技作为行业领先的3D工业相机和3D视觉机械臂引导系统供应商,持续深耕耐火砖拆码垛场景,已携手集成商合作伙伴在东北、华北、华中等地区成功落地多个3D视觉引导耐火砖拆垛项目,充分印证了迁移科技耐火砖拆码垛解决方案的高效性、稳定性和可靠性。

本文将详细解析这一方案的核心技术及其在实际应用中所展现的卓越优势与重要价值。

耐火砖拆码垛场景挑战

耐火砖是一种由耐火黏土或其他耐火原料烧制而成的多规格耐火材料,可用作建筑窑炉和各种热工设备建筑,其生产效率和质量稳定性对整体产业链有着至关重要的

......长按二维码访问原文

ISRA PARSYTEC板坯&中厚板的3D自动检测系统方案--机器视觉网 2024-04-08 15:41:46

2024-04-08 15:41:46 来源: 中国机器视觉网

ISRA PARSYTEC研发的3D传感器,集成了传统由表面灰度为基准的2D成像技术和由激光三角测量法的可测量高度,深度的3D成像技术。3D传感器解决了传统2D传感器因钢板纹理过重无法检测的难题。

通常板坯和中厚板车间的环境极为恶劣"之所以决定与 ISRA PARSYTEC 合作,是因为 ISRA PARSYTEC 采用了创新技术,将二维和三维技术集成到同一个传感器中。此外,该系统的可扩展性和灵活性使我们可以先使用底部解决方案,然后再增加顶部解决方案。"美国著名中厚板生产商轧制和精加工主管。

......长按二维码访问原文

大帧科技面结构光3D相机成像原理介绍--机器视觉网 2024-04-08 15:21:46

2024-04-08 15:21:46 来源: 中国机器视觉网

什么是结构光成像?使用特定的光图案和2D相机来捕获物体表面的三维轮廓的一种成像方法。

原理:将特定的窄带光投影到三维形状物体的表面上会产生一条照明线,该照明线从投影器的其他角度来看存在一定的变形,利用这种被三维形状调制的变形照明线来实现物体的三维轮廓重建。

面结构光3D相机的成像方法与实现

面结构光3D相机主要使用光学投射模组与2D相机搭建而成,主要使用移相法来实现。

移相法的一般计算步骤:A. 图片的包裹相位计算;B. 绝对相位计算;C. 三维坐标计算。

多频法、多频外差法

相移+格雷码

面结构光的3D相机实现方法

标定示意

珩图科技研发和生产的面扫结构光3D相机

· 3D工业相机产品-高精度迅猛龙

搭载NVIDIA CU

......长按二维码访问原文

倍福助力铝合金3D打印,精度高速度快--机器视觉网 2024-04-08 15:07:33

2024-04-08 15:07:33 来源: 中国机器视觉网

格劳博集团是一家在全球范围内运作的家族企业,自 95 年前成立以来,一直致力于为全球知名的汽车制造商研发以及生产各种系统和机床。在当今这个日新月异的时代,他们不仅致力于追求技术创新,更具有很强的市场开拓能力。他们于 2019 年成功研制出的增材制造领域的第一台机床样机。其新型液态金属打印机 GMP300 配备了基于 PC 的自动化控制技术,它能够经济高效地使用铝合金线材进行高精度、高速度的 3D 打印。

来自格劳博集团增材制造团队的 Emanuel Engelsberger 和团队负责人 |ohannes Glaschrōder 博士,以及倍福慕尼黑分公司经理 Darius wala (从左到右)在外观优雅的新型 GMP300 前合影留念

......长按二维码访问原文

祝贺小米物流北京仓柔性自动化开机仪式圆满成功―新闻频道- 视觉系统设计 2024/4/7 21:45:43

4月3日下午,小米物流北京仓柔性自动化开机仪式顺利举行,本次开机是小米智能化战略布局的重要一步。

新的仓储展现新的实力。海康机器人参与并见证该智能仓圆满开机!

随着业务的快速发展和市场多样性的需求,此次小米物流北京仓进行了全面升级。引入海康机器人智慧物流解决方案,真正实现了仓库的柔性化运营。

该方案立足于对仓储空间的极致利用和对货物智能化拣选的深度挖掘,不仅应用了高效率、高存储、高稳定性的料箱机器人,同时应用了高效灵活的潜伏机器人,实现效率与存储双赢。

站在AI全面爆发的新风口,小米决心要把软硬深度融合的升级版科技战略,全面贯彻到从设计生产到仓储物流的每个环节。海康机器人发力于智能制造和智慧物流,双方深度合作,进一步提升终端消费者的购物体验。

本次开机仪式不仅代表着小米仓储服务能力的进一步提升,也预示

......长按二维码访问原文

海伯森高端智能传感器受邀亮相三大展会―新闻频道- 视觉系统设计 2024/4/7 21:42:34

随着工业4.0时代的深入推进,智能制造已成为全球制造业转型升级的重要方向。在刚刚落幕的韩国智能工厂及自动化展、成都AI+机器视觉技术工业应用创新论坛和ITES深圳工业展上,海伯森系列展品精彩亮相,以多元的应用方案与观众互动,展现了品牌在高端智能传感器领域的领先实力与创新思维。

产品亮相

海伯森技术(深圳)有限公司,作为一家持续多年为海内外500强名企提供高性能传感器产品及优质技术服务的国产高端智能传感器制造企业,在光学精密测量、工业2D/3D检测、机器人智能应用等领域已形成成熟的产品矩阵。主力产品包括3D闪测传感器、3D线光谱共焦传感器、点光谱共焦位移传感器、超高速工业相机、六维力传感器、激光对刀仪、激光对针传感器及各类激光检测传感器。

应用演示

在展会上,我们展示了在技术创新方面的成果,包括光谱共焦传

......长按二维码访问原文

凌云光AI+Vision为工业制造注入新动能―新闻频道- 视觉系统设计 2024/4/7 22:10:06

近日,第七届国际智能工业大会在深圳盛大开幕,凌云光知识理性研究院副院长全煜鸣在会上发表《AI+Vision在工业中的应用》主题报告。

人工智能迅速发展,AI技术已成为推动工业发展的关键力量。凌云光将AI技术与机器视觉相结合,有效解决工业质检中的难题,特别是在难以用传统方法描述和量化的质量管理问题上取得了突破。

在视觉感知方面,凌云光应用人眼视觉模型建立科学品质基准,用工业质检1000万数据集练就预训练视觉大模型,用模型剪枝知识蒸馏方法轻量化分类分割模型进行端侧提效。

同时,凌云光工业AI质检平台F.Brain可完成工业质检AI的数据管理、模型迭代、模型评估优化和部署,结合质量管理系统GMQM,完成工厂级数据闭环,小端处理、边云计算,大大提高视觉AI的应用效率。

在精密组装领域,凌云光推出了自动化3.0“

......长按二维码访问原文

GTS系列-超高精度激光3D轮廓测量仪―产品聚焦频道- 视觉系统设计 2024/4/7 22:33:31

光图智能推出的激光3D轮廓测量基于激光三角测量原理,以超高速度对物体轮廓进行采样,可实现对物体表面的高精度三维重建,微米级的细微特征也能清晰分辨,由此实现对物体的非接触式的高精度测量/检测。

GTS系列X轴分辨率最高可达8µm,Z轴重复测量精度最高可达0.1µm,最高测量速度达40000轮廓/秒,每条轮廓提供2048个数据点;抗干扰性强,适用于各种低反射率与高反射率的物体材质,可同时输出2D深度图+校准的3D点云数据,IP67防护等级,坚固的连接器和高韧性电缆确保传感器稳定运行,支持 Halcon、VisionPro、EVT、C# 、C++等第三方软件进行开发,满足不同行业测量需求。可广泛应用于汽车制造、3C电子、半导体、锂电池组件、橡胶轮胎以及航空航天、医疗器械领域的精细几何尺寸测量及表面缺陷检测。

光图

......长按二维码访问原文

德国机床制造商成CCMT最大外国展团―新闻频道- 视觉系统设计 2024/4/8 14:26:54

上海,2024年4月8日 - 140家德国企业将参加4月8日至12日在上海举行的2024年数控机床展览会(CCMT)。德国公司拿下了4675平方米的净空间,成为最大的外国展团。VDW(德国机床制造商协会)执行董事Markus Heering博士表示:“经过长时间的新冠肺炎限制,我们的行业将在疫情后于上海首次展示他们的创新。”

新冠疫情带来了前所未有的挑战。在2020年和2022年的展会相继被取消后,今年CCMT的展馆数量从10个增加到了17个。

CCMT 2024吸引了来自德国的约140家参展商。德国再次成为最大的外国展团之一,总面积4675平方米。

......长按二维码访问原文

“计算机视觉女神”被IEEE期刊封杀 2024-04-07 20:23

来源 | 量子位 ID | QbitAI

计算机学术界的女神“Lenna”被IEEE“封杀”了——

IEEE计算机协会宣布,4月1日起不再接收包含该图像的论文。

△Lenna图

IEEE技术&会议活动副主席Terry Benzel在邮件里这样写道:

IEEE本着坚持促进开放、包容及公平文化的承诺,同时尊重照片主体Lena Forsén本人的意愿,决定不再接收包含Lenna图像的论文。

也就是说,之后委员会或审稿人会特地留意论文中是否有这张图,如果有的话,会要求作者用替换图片。

“Lenna图”的时代彻底结束了?要知道,这张图曾经的火爆程度belike:

“计算机视觉女神”

Lenna图最初是登在1972年11月期的《花花公子》(Playboy)杂

......长按二维码访问原文

CVPR 2024 | 异常检测新网络!InCTRL:学习基于少量正常样本提示的上下文差异实现通用异常检测 2024-04-07 17:13

InCTRL:一种通才异常检测新网络,引入上下文残差学习,在多个数据集上性能表现SOTA!优于WinCLIP等网络,泛化性极强!代码即将开源!单位:新加坡管理大学

点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

快点击进入:异常检测和缺陷检测技术交流平台

文章:https://arxiv.org/pdf/2403.06495

代码:https://github.com/mala-lab/InCTRL

CVPR 2024 论文和开源项目合集请戳—>https://github.com/amusi/CVPR2024-Papers-with-Code

背景:

异常检测(AD)是计算机视觉领域的一个重要任务,其目的是识别出与数据集中大多数样本显著不同的样本。这

......长按二维码访问原文

NVIDIA最新GSNeRF 通用语义神经辐射场与增强的3D场景理解 2024-04-07 15:01

本文提出的GSNeRF方法在解决通用的新视角合成和语义分割问题上具有创新性和实用性。通过将视觉特征提取和深度图预测结合起来,GSNeRF能够在不需要重新训练的情况下泛化到未见过的场景,这在实际应用中具有重要意义。实验结果表明,GSNeRF在真实世界和合成数据集上取得了良好的表现,优于现有方法。这表明GSNeRF是一种有效的方法,可以应用于各种需要新视角合成和语义分割的场景。

1 引言

这篇论文介绍了一种名为GSNeRF的通用语义神经辐射场,旨在同时解决通用化新视角合成和语义分割的问题。GSNeRF通过学习场景的视觉特征、深度信息和语义信息,能够在未见场景上渲染新的视角图像,并生成相应的语义分割掩码。该方法包括两个关键学习阶段:语义地理推理和深度引导视觉渲染。前者用于推导场景的视觉特征和聚合源视图的深度信息,

......长按二维码访问原文

Visium CytAssist 图像的手动较准过程 2024-04-07 09:06

前面我们在“一秒搞懂Visium空间转录组图像!科研进阶指南!”介绍了Visium CytAssist 的图像类型。

在用Space Ranger 进行CytAssist 的基因表达分析时,需要 CytAssist 载玻片上仪器生成的图像以及标准载玻片上相同组织切片的显微镜图像(明场图)。Space Ranger使用自动图像配准算法来对齐和优化两个输入图像的叠加。但是,对于荧光图像,或者在基准标记物受阻或组织边界不清晰的情况下,需要手动配准图像。

Loupe Browser提供用于手动图像配准的指导,指导用户上传两个图像、选择图像之间的关键地标点以及优化对齐方式、导出包含图像配准结果的独立对齐文件,或继续使用Loupe Browser的手动基准对齐流程生成组合对齐文件。

Loupe Browser8.0对

......长按二维码访问原文

FocusFlow:提升自动驾驶中关键点光流估计 2024-04-08 13:32

作者:自动驾驶专栏 | 原文出处:公众号【自动驾驶专栏】

摘要

本文介绍了FocusFlow:提升自动驾驶中关键点光流估计。基于关键点的场景理解是自动驾驶应用的基础。同时,光流在很多视觉任务中发挥着重要作用。然而,由于所有点上同等注意力的隐含偏差,经典的数据驱动光流估计方法在关键点上的性能不太令人满意,限制了它们在关键点关键的安全相关的场景中的实现。为了解决这些问题,本文引入一种基于点的建模方法,其明确要求模型学习与关键点相关的先验。基于这种建模方法,本文提出FocusFlow,该框架包含:1)混合损失函数与经典光度损失函数相结合,以及本文提出的用于不同点监督的条件点控制损失(CPCL)函数;2)通过本文提出的条件控制编码器(CCE)代替传统特征编码器的条件控制模型。CCE包括从帧中提取特征的图像帧特征编码

......长按二维码访问原文

深度学习特征提取新突破!42个涨点方案,让模型性能、效率倍增 2024-04-08 18:26

作为数据预处理的一个重要步骤,特征提取是CV领域一个复杂但不可或缺的过程。它通过某种变换或映射,从原始数据中提取出对目标任务更有帮助的信息,以提高模型性能、降低计算成本、提升数据可解释性和模型泛化能力。

目前,特征提取主要有2大类主流方法:基于检测器的方法、无检测器的方法。基于检测器的方法依赖于手工设计的特征或者通过训练得到的深度神经网络来提取特征点,而无检测器的方法则直接从数据中提取特征,两者各有优势。

在实际应用中,选择合适的特征提取方法对后续模型的性能提升至关重要。本文介绍这2大类主流特征提取方法,并细分了7个具体方向,每种方法都附有代表论文以及相应代码(共42篇),方便同学们pick合适的方法,高效涨点。

论文原文+开源代码需要的同学关注“学姐带你玩AI”公号(不懂的看我主页签名),那边回复“特征

......长按二维码访问原文

Mamba再下一城!Sigma:多模态语义分割的孪生Mamba网络 2024-04-08 17:46

Sigma:第一个成功将Mamba应用于多模态语义分割的新工作,采用 Siamese 编码器并创新 Mamba 融合机制,有效地从不同模态中选择重要信息,在多个数据集上性能表现SOTA!代码已开源!

点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

快点击进入:Mamba和Transformer技术交流平台

Sigma

Sigma: Siamese Mamba Network for Multi-Modal Semantic Segmentation

单位:CMU, 大连理工大学

代码:https://github.com/zifuwan/Sigma

论文:https://arxiv.org/abs/2404.04256

CVPR 2024 论文和开源

......长按二维码访问原文

[NIPS 2023]Directional Diffusion Models for Graph Representation Learning: 2024-04-07 21:02

......长按二维码访问原文

光伏电池检测新的思路,视觉也可以做到这一步! 2024-04-08 16:45

随着清洁能源技术的飞速发展,光伏电池作为太阳能发电的核心部件,其质量和性能的稳定与否直接关系到整个太阳能发电系统的运行效果。因此,光伏电池的严格检测成为了生产过程中不可或缺的一环。而机器视觉技术作为一种高效、精确的自动化检测方法,正逐渐在光伏电池检测领域展现出巨大的应用潜力。

传统的光伏电池检测往往依赖于人工目视或简单的机械测量,这种方法不仅效率低下,而且容易受到人为因素的影响,导致检测结果的准确性和稳定性难以保证。而机器视觉技术通过模拟人眼的视觉功能,结合计算机图像处理和分析技术,能够实现对光伏电池表面缺陷、尺寸精度、电性能等多方面的全面检测。

在光伏电池表面缺陷检测方面,机器视觉技术可以通过高分辨率相机捕捉电池表面的图像,并利用图像处理算法对图像进行去噪、增强和分割等操作,从而提取出缺陷的特征信息。通过

......长按二维码访问原文

[分享][每日更新][2024.04.05][CV_arxiv_papers] 2024-04-08 11:39

2024-04-05

Enhancing Breast Cancer Diagnosis in Mammography: Evaluation and Integration of Convolutional Neural Networks and Explainable AI

增强乳房 X 光检查中的乳腺癌诊断:卷积神经网络和可解释人工智能的评估和集成

Maryam Ahmed, Tooba Bibi, Rizwan Ahmed Khan, Sidra Nasir

null

......长按二维码访问原文

基于单目图像的道路使用者检测、跟踪和预测的端到端框架 2024-04-08 13:18

作者:自动驾驶专栏 | 原文出处:公众号【自动驾驶专栏】

摘要

本文介绍了基于单目图像的道路使用者检测、跟踪和预测的端到端框架。感知涉及到多目标检测和跟踪以及轨迹预测,这是自动驾驶的两个主要任务。然而,它们目前大多数是单独研究的,这导致大多数轨迹预测模块都是基于真值轨迹开发的,而没有考虑到在现实世界场景中从检测和跟踪模块提取的估计是有噪声的。这些带噪声的轨迹可能对轨迹预测器的性能产生重要影响,并且可能导致严重的预测误差。在本文中,我们构建了一个用于检测、跟踪和轨迹预测的端到端框架,称为ODTP(在线检测、跟踪和预测)。它采用了最先进的在线多目标跟踪模型QD-3DT进行感知,并且直接基于检测结果来训练轨迹预测器DCENet++,而不完全依赖于真值轨迹。我们在广泛使用的自动驾驶nuScenes数据集上评估ODT

......长按二维码访问原文

太牛了!视觉模型与大语言模型结合邦加德问题研究成果:评估机器视觉现实世界少样本推理的新基准 2024-04-08 10:43

投稿:橡皮 编辑:June

论文链接:https://arxiv.org/abs/2310.10207[1]

项目主页:https://joyjayng.github.io/Bongard-OpenWorld.github.io[2]

摘要:

我们推出了 Bongard-OpenWorld,这是一个用于评估机器视觉现实世界少样本推理的新基准。它起源于经典的邦加德问题(BP):给定两组图像(正图像和负图像),模型需要通过归纳视觉概念来识别查询图像所属的集合,该视觉概念仅由正集合中的图像来描述。我们的基准继承了原始 BP 的少镜头概念归纳,同时添加了两个新颖的挑战层:1)开放世界自由形式概念,因为 Bongard-OpenWorld 中的视觉概念是来自开放词汇表的术语的独特组合,范围从对象类别到抽象的视觉属

......长按二维码访问原文

机器视觉学习之路,有坎坷也有希望。 2024-04-08 13:03

我姓代 2023年3月份 在广东东莞上班, 做了几份工作都不太理想, 有快递, 电焊,混了3-4年,没赚到钱也看不到希望。有天刷抖音 看到了 常州龙熙机器视觉培训班, 标题吓我一跳, 90%月薪 1.8万。 想想我一个本科生,虽然专业差点意思, 是环境工程, 不太靠边, 但是目前也就一个月7000多, 省吃俭用,一个月也就存个3000多元钱。 但是1.8万是我不敢想的。

第一印象 不太靠谱啊 。 然后我去智联上搜了下, 机器视觉工程师 的工作内容, 是涉及到了编程开发 , 软件编写,图像处理,人工智能。 感觉还是对于我来说挺难的。 毕竟本科就学了点c语言基础, 最多学到了数组和指针,就没有继续了。当时没有放在心上。

隔了两天 又刷抖音 这次无意间点到了 一个小美女在培训班的直播间直播。 单身多年的我, 多看

......长按二维码访问原文

PixArt α to Σ: All about Efficient Diffusion Models: 2024-04-08 10:57

前言

自年初Sora和Stable Diffusion 3推出以来,笔者就开始关注基于Diffusion Transformer的工作。在我的往期文章《Diffusion Transformer Family:关于Sora和Stable Diffusion 3你需要知道的一切》和《一文解读:Stable Diffusion 3究竟厉害在哪里?》中我们分析到,Sora和Stable Diffusion 3的成功说明了两点:(1) Diffusion Transformer能够有效建模视频帧之间的联系,进而生成超长连续的视频流 ;(2) Diffusion Transformer能够有效建模图像块之间的联系,进而在文字/高分辨率图像等比较难的setting下有所突破 。

而就在上一个月,华为诺亚方舟实验室在ar

......长按二维码访问原文

CVPR 2024的554高分论文GenN2N:一个统一的NeRF-to-NeRF的转换框架,适用于各种NeRF转换任务 2024-04-08 12:26

作者提出了一个统一的NeRF-to-NeRF的转换框架,适用于各种NeRF转换任务,例如NeRF编辑、着色、超分辨率、修复等,性能均表现极其出色!代码即将开源!欢迎各位大佬关注呀!

1、项目主页:GenN2N: Generative NeRF2NeRF Translation

2、论文地址:https://arxiv.org/pdf/2404.02788.pdf

3、代码地址:GitHub - Lxiangyue/GenN2N: [CVPR'24 - Rebuttal Score 554] GenN2N: Generative NeRF2NeRF Translation

摘要:作者提出了GenN2N,这是一个统一的NeRF到NeRF转换框架,用于各种NeRF转换任务,如文本驱动的NeRF编辑、着色、超分

......长按二维码访问原文

[分享][每日更新][2024.04.05][CV_arxiv_papers] 2024-04-08 11:42

2024-04-05

Enhancing Breast Cancer Diagnosis in Mammography: Evaluation and Integration of Convolutional Neural Networks and Explainable AI

增强乳房 X 光检查中的乳腺癌诊断:卷积神经网络和可解释人工智能的评估和集成

Maryam Ahmed, Tooba Bibi, Rizwan Ahmed Khan, Sidra Nasir

null

......长按二维码访问原文

案例分享 | 某全球性医药健康品牌:采用工业视觉技术检测产品质量 2024-04-07 17:08

工业视觉检测产品质量

LINKWIN 案例分享

企业概况

该客户是一家知名的全球性医药健康公司,总部位于英国伦敦。其专注于新药物和新疫苗开发,2022年营收293.24亿英镑,产品遍及全球市场。

自动化生产面临的挑战与项目需求

➢ 自动化生产面临的挑战

在生产时,工厂通常会遇到以下产品质量问题:

尺寸不一致: 尺寸可能会有轻微差异,但如差异过大,可能会导致包装不合适或无法密封。

尺寸可能会有轻微差异,但如差异过大,可能会导致包装不合适或无法密封。 形状变形: 产品可能会在运输或储存过程中受到挤压或变形,导致外观不佳或无法正常使用。

产品可能会在运输或储存过程中受到挤压或变形,导致外观不佳或无法正常使用。 颜色不匹配: 印刷颜色可能会有偏差,导致产品颜色与预期不符。

印刷颜色可能会有偏

......长按二维码访问原文

Ei & Scopus双检索 | 第八届视觉、图像与信号处理国际会议(ICVISP 2024) 2024-04-08 11:59

会议简介 Brief Introduction

2024年第八届视觉、图像与信号处理国际会议(ICVISP 2024)

会议时间:2024年12月27日-29日

召开地点:中国·西双版纳

大会官网:https://www.icvisp.org/

由云南师范大学主办,中山大学、深圳大学计算机与软件学院和大数据系统计算技术国家工程实验室协办, CoreShare科享学术交流中心协办的2024年第八届视觉、图像与信号处理国际会议(ICVISP 2024)将于2024年12月27日至29日在中国西双版纳召开。会议将围绕“视觉、图像与信号处理”的最新研究领域而展开,为研究人员、工程师、专家学者以及行业专业人士提供一个交流与探讨最新研究成果的平台,并为与会者们交流新的思想和应用经验建立业务或研究关系。在会议期间您

......长按二维码访问原文

机器视觉培训班哪家强? 2024-04-08 12:35

机器视觉课程 我个人理解是 界面设计, 图像处理 ,相机sdk 二次开发 ,机器人sdk二次开发,3维点云处理,深度学习, 拖拽框架的搭建。

编程语言有 c# c++ qt , 图像处理库 halcon opencv 。

我个人感觉 机器视觉,首先是要和设备实战的, 比较机器人 ,六轴的, 相机, (包含2d 3d 双目 线激光,线扫),所以尽量选择有线下培训班那种。 前期可以网络班 掌握下 语言编写的语法, 结构体 数据结构 , 类 ,封装 , 线程 数据库 通信 这些基础的。

后期结合相机, 机器人 ,流水线, 完成 一些视觉的测量 检测, 三维抓取 焊缝轨迹引导, 拖拽框架,深度学习检测,这些。

你查看下 智联招聘 boss直聘 也可以了解到企业的人才需求等情况。

个人推荐 常州龙熙机器视觉培训

......长按二维码访问原文

视觉魔法师

我还没有学会写个人说明!

相关推荐