机器视觉资讯20240429

文章目录[隐藏]


视觉招聘小黑板

欲了解详情,请在公众号后台回复:240429



行业资讯

颠覆传统:机器人与AI大模型的结合,开启智能自动化的黄金时代! 2024-04-28 11:01

"未来已来:AI大模型引领机器人革命,开启智能自动化新纪元!"

©作者|TW

来源|神州问学

1. 引言:机器人技术与大模型的结合趋势

随着科技的迅速发展,机器人技术与大模型的结合已经成为必然趋势。这种结合不仅仅是技术的简单叠加,而是一种深层次的互补与融合,为机器人技术的应用开辟了新的可能性。大模型,能够处理和分析海量的数据,提供更为精准的决策支持。当这些能力与机器人的物理执行功能结合时,可以极大地扩展机器人在复杂环境下的应用范围,提升其自主性和适应性。这种趋势不仅推动了工业自动化的进程,也为服务机器人的智能化升级提供了强有力的技术支持,预示着未来机器人技术在多个行业的广泛应用。

2. 什么是任务级交互

任务级交互是一个机器人领域的术语,其重要性体

......长按二维码访问原文

亮源激光自主研发“白泽系列”新品激光测距模组震撼上市--机器视觉网 2024-04-29 16:56:21

2024-04-29 16:56:21 来源: 中国机器视觉网

4月28日上午,亮源激光自主研发的“白泽系列”激光测距模组新品正式发布,“白泽系列”包括两款模组:3公里铒玻璃激光测距模组和1.5公里半导体激光测距模组。这两款模组均基于人眼安全的激光技术,并搭载了亮源激光自主研发的算法和芯片。

3公里铒玻璃激光测距模组

采用波长1535nm的铒玻璃激光器,其测距精度高达0.5米。值得一提的是,该产品的所有关键器件均由亮源激光自主研发和生产。此外,其体积小、重量轻(33克),不仅便于携带,还保证了产品的一致性。

1.5公里半导体激光测距模组

基于波长905nm的半导体激光器。其测距精度在全程可达0.5米,近距离测距更是精确至0.1米。该模组以成熟稳定的器件、强大的抗干扰能力、小巧的体积和轻便的重量(10克

......长按二维码访问原文

司眸®机器视觉发布RGBD动态包裹体积测量智能相机--机器视觉网 2024-04-29 16:49:13

2024-04-29 16:49:13 来源: 中国机器视觉网

在物流、仓储、生产制造领域,货物吞吐量是衡量物流运输和货物处理效率的重要指标,因此,快速、准确获取包裹的体积数据对于优化流程、提升效率至关重要。

然而,因缺乏有效的解决方案,包裹的动态体积测量难题一直存在,特别在高速场景中对特殊件的体积测量是难题中的附加题。海内外各类传统与新兴机器视觉厂家提供的方案,都因价格过于昂贵,产品难以使用,维护难度大且成本高而无法大量落地推广。

司眸®机器视觉推出了基于双目 3D 视觉 + AI 技术智能相机PEA020-800-X60,具有水平100°大视场角,支持单相机下大包裹测量,同时解决了超薄件测量难题,对非规则和表面特殊材质包裹也能精确测量,具有遥遥领先的易用性、行业顶级的读取率,其稳定的性能也得到市场认可

......长按二维码访问原文

智能道路检测车搭载宸曜科技人工智能推理平台--机器视觉网 2024-04-29 15:44:47

2024-04-29 15:44:47 来源: 中国机器视觉网

智能道路检测搭载了人工智能推理平台,大大减少了人为因素可能导致的问题,检测结果也更为统一,系统可通过5G/ 4G无线网络迅速发送给中央控制中心,多台车辆可以同时进行部署和检测。

地球上各大城市都有千千万万条道路。道路网络的交织连接关系到大到经济发展、小到日常生活的方方面面,是大城市基建的重要一环。一个设计成熟的道路网络包含交通灯、禁止标识、对交通负载量的考量、区域人口密度等因素,以确保整体的交通运行流畅。然而,道路是人为铺设的,并承受大量汽车轮胎碾压、烈日照射和倾盆大雨冲蚀,造成道路的缺陷和损害(道路病害),成为危险的隐患。

道路病害可分为以下个类型——

行业痛点

进行道路病害检测和检查需要大量人力、设备、工时和预算。而某些路面损害更是需

......长按二维码访问原文

广州斯睿特在钣金件缺陷的应用--机器视觉网 2024-04-29 15:39:14

2024-04-29 15:39:14 来源: 中国机器视觉网

应用背景

随着汽车工业的飞速发展,汽车钣金件作为汽车的重要组成部分,其质量直接关系到汽车的整体性能和使用安全。

因此,对汽车钣金件进行缺陷检测显得尤为重要。涉及到多种不同类型的钣金工件,它们的大小尺寸各异,缺陷类型也多种多样且不可预测。传统的人工检测方法不仅效率低下,容易漏检,而且随着劳动力成本的上升,人工成本也成为一个不可忽视的问题。

为了解决这些问题,需要采用先进的机器视觉技术和人工智能算法进行处理和分析,实现高效、准确、全面的检测。

解决方案

斯睿特钣金件缺陷检测智能装备工作站,具备高度柔性化,适应各种复杂多样的钣金件种类,基于高速控制相机拍照的位置 和姿态及自动变焦控制算法,实现对各类大小尺寸不同、工件表面凹凸不平、缺陷种类繁多

......长按二维码访问原文

深视智能高速相机为你揭秘汽车座椅碰撞安全性测试--机器视觉网 2024-04-29 15:21:47

2024-04-29 15:21:47 来源: 中国机器视觉网

小米首款电动汽车小米SU7一经上市便引发市场的广泛关注,新能源汽车已成为我国汽车产业发展最亮眼的底色。

台车碰撞试验

台车碰撞试验是用于 评估汽车安全性 和 座椅安全性能 的重要手段。在这类试验中,高速相机发挥了至关重要的角色,因为它可提供关键的视频数据来分析在撞击瞬间和事故发生过程中各部件的动态响应。这些数据不仅对于提高汽车设计的安全性至关重要,也对科研人员在汽台车碰撞动力学领域的理解提供了实质性帮助。

碰撞试验通常在短短几毫秒内发生, 高速相机 能够以每秒数千甚至数万帧的速度捕捉到这些快速事件。通过逐帧分析碰撞过程,实现精确的运动分析。

汽车座椅碰撞安全性测试

实验使用深视智能 SH6-2101-C 系列相机进行拍摄, 51

......长按二维码访问原文

工业4.0如何重新定义制造业--机器视觉网 2024-04-29 15:00:14

2024-04-29 15:00:14 来源: 中国机器视觉网

工业4.0是推动不同行业领域现代化进程的重要催化剂,尤其是制造业在此浪潮下,重新定义了中国制造商的生产和运营模式,也为企业的数字化进程带来了时代的机遇。

现代制造业的三大支柱

工业4.0结合了自动化、大数据和连接性等关键要素,为制造业带来了显著的影响,将推动其发展步入前所未有的现代化时代。首先,自动化由机器人、人工智能 (AI) 等技术进步所驱动,使复杂任务的执行变得高效。麦肯锡发布的报告显示,中国制造商对工业4.0抱有极大的热情和期待,认为技术革命有利于提升竞争力;因此,中国制造要抓住工业4.0的机遇,关键之一在于主动适应自动化的发展趋势,打造自动化的生产线和数字化的管理系统等,降低人力成本,提高生产效率,进而提升产品的质量和利润。

其次

......长按二维码访问原文

AI质检+智能数据管理加持 高端制造业开启“飞驰人生”--机器视觉网 2024-04-29 14:03:23

2024-04-29 14:03:23 来源: 中国机器视觉网

当前,全球制造业面临客户需求个性化、生产成本不断攀升、劳动力资源短缺、竞争不断加剧等诸多挑战。智能制造的推进成为企业发展战略的重要支撑手段。为此,各大制造企业竞相运用云计算、大数据、人工智能等先进技术,推动智能制造发展。

以数据为中心的智慧工厂业务架构

5G、云计算、物联网、大数据、AI、数字孪生等技术的大力发展,帮助企业实现智能设备、智能产线、智能车间、智慧工厂等生产模式的创新。这些先进技术的背后,会产生海量的图片、文档、音频和视频等非结构化数据,其文件个数和数据量都呈现爆发式增长。

图1 智能制造浪潮下,海量数据产生

以AI质检场景为例,机器视觉质检工序的引入提高了产品质检效率和生产效率,同时也产生了海量非结构化数据。杉岩数据调研的某

......长按二维码访问原文

新应用探索,联瑞10G单电口网卡支持MacOS--机器视觉网 2024-04-29 17:21:16

2024-04-29 17:21:16 来源: 中国机器视觉网

Marvell AQC113以太网控制器支持苹果操作系统(MacOS),进一步扩展搭载了AQC113设备的应用领域。众所周知,苹果操作系统应用生态完善,是业内备受瞩目的巨头级操作系统,其应用领域覆盖了游戏、社交、娱乐、工具,甚至NAS存储、工作站、家用PC及其他嵌入式应用等。

Marvell AQC113器件由高性能、可扩展mGig、以太网MAC+PHY控制器组成,支持6种速度选项,包括10Mbps、100Mbps、1Gbps、2.5Gbps、5Gbps和10Gbps,以满足不断增长的网络需求,被广泛应用于各类设备应用。

LR-LINK联瑞的10G单电口网卡LRES2051PT正是采用了Marvell AQC113以太网控制器,与市场上的同类

......长按二维码访问原文

探索GigE Vision在工业4.0中的巨大潜力―新闻频道- 视觉系统设计 2024/4/28 23:32:37

在过去几十年中,人们开发了多种机器视觉接口。近年来,适用于嵌入式视觉的MIPI CSI接口也开始应用于一些基于嵌入式系统应用。我们会一连三期的重点介绍CameraLink、GigE Vision、USB3Vision(于2013年1月发布)和CoaXPress(于2010年发布)机器视觉接口。

PCI Express接口虽然仅用于少数相机设备中,但却是一种高速串行标准,主要用作计算机主板接口,以连接硬盘驱动器、显卡等各种外围设备。

用于工业机器视觉的GigE Vision接口

2006年,千兆以太网(GigE)接口作为GigE Vision接口引入工业机器视觉领域。基于Internet协议(IP)标准,它传输视频和控制数据。原先各厂商使用自家驱动,导致互操作性问题。GigE Vision标准化,由自动成像

......长按二维码访问原文

思特威推出超小尺寸高帧率全局快门CMOS图像传感器―产品聚焦频道- 视觉系统设计 2024/4/28 23:43:53

近日,技术先进的CMOS图像传感器供应商思特威(SmartSens,股票代码688213),全新推出0.16MP超小尺寸背照式全局快门CMOS图像传感器新品——SC020HGS。此款新品采用了思特威先进的SmartGS™-2 Plus和Lightbox IR®近红外增强技术,具备超高帧率、高感光度、超低功耗等多方面性能优势,其芯片尺寸仅为1.75毫米x1.75毫米,一体化封装尺寸小至2毫米x2毫米,可充分适配微型摄像头模组,满足AR/VR类智能穿戴设备的虹膜识别、眨眼检测、眼球追踪、动作识别等面捕功能需求。

SmartGS™-2 Plus技术加持

图像捕捉准确流畅

AR/VR类智能穿戴设备的诸多视觉及面部交互功能,都依靠高精度眼球跟踪和面部动作捕捉来实现。搭载思特威先进SmartGS™-2 Plus技术的

......长按二维码访问原文

海康机器人全新TOF感知RGBD相机―产品聚焦频道- 视觉系统设计 2024/4/28 23:15:47

为了满足不同行业对3D感知的需求,海康机器人在近期的机器视觉新品发布会上推出了全新的TOF感知RGBD相机。

除具备高帧率、轻松集成、体积小巧、供电稳定等特点外,该相机将AI和3D感知相结合,通过高帧率+AI算法,实现了对不同场景的快速捕捉与智能分析。

产品介绍

MV-DT01SDU 型号TOF 感知相机,是一款低成本、小体积、配置全面的立体相机,凭借硬件级的深度图像处理方案,可高速同步输出深度图及彩色图,适用于体积测量、识别、定位等行业应用。

产品四大特点

1、高帧率高精度数据输出

通过采用飞行时间技术,相机的深度图完整度高,边缘轮廓更立体、扫描帧率最高可达30fps,支持RGB 与深度图同步高帧率输出,高效输出毫米级精度深度图,可以快速精准的对物体进行测量、定位、识别。

2、轻松集成

出厂完

......长按二维码访问原文

SICK太阳能光伏行业应用方案―技术与应用频道- 视觉系统设计 2024/4/28 23:39:17

随着全球对可再生能源需求的日益增长,全球太阳能和光伏产业正成为发展势头强劲的新兴行业。而在国家对于太阳能光伏行业的长期投入以及政策支持下,国内早已拥有相当成熟且规模化的相关产业链,并已成为全球太阳能光伏设备的主要制造中心,持续为全球的可持续发展做出贡献。

从硅原料的采集到太阳能电池板的制造,每一个环节都需要高精度的自动化生产流程。太阳能电池和太阳能玻璃模块的生产面临着行业的特定挑战。在从硅晶片到电池单元再到模块化安装的整个流程中,SICK智能传感技术能帮助您从容应对这些挑战。

您可能正面临的挑战

智能检测

提高太阳能电池和电池组件效率的关键在于不断减少太阳光辐射在电池表面的反射损失。SICK所提供的传感器和视觉相机可以在红外和紫外谱段范围内运行,进行稳定检测。

精密生产

提升太阳能电池效率的关键在于

......长按二维码访问原文

算法升级助力3D智能线激光相机抓取半透表面―技术与应用频道- 视觉系统设计 2024/4/28 23:26:27

背景知识

消费电子产品表面很多都是玻璃或者塑料材质,材质本身具有透明、部分透明的特性,产品出厂之前需要对这类表面做质量检测,保证产品无划痕、无污渍、表面平整,符合设计要求。

另外,生产过程的涂胶工艺质量管控,需要对涂胶的胶体宽度、胶体高度做检测,以保证生产质量,而许多涂胶的材料也具有部分透明的特性。实现此类材料表面精准检测,为客户提供可靠的质量管控,对智能检测产品提出较高的要求。

检测需求

部分半透明场景检测要点:

·涂胶: 胶宽、胶高

·手机屏: 表面划痕、平面度

方案对比

*可以得出,线激光相机是检测屏幕、涂胶等场景的最优选择

检测难点

3D线激光相机基于激光三角法测得对应点的高度信息,因此,需要被测物表面散射激光至相机镜头,才可以采集到该点的高度。如果玻璃表面、涂胶等材料表面散射弱、透

......长按二维码访问原文

Mamba为什么能颠覆Transformer在计算机视觉的统治地位? 2024-04-28 18:40

0. 引言

深度神经网络(DNNs)已经在各种人工智能(AI)任务中展现出了显著的性能,而基本架构在确定模型能力方面起着至关重要的作用。传统神经网络通常包括多层感知器(MLP)或全连接(FC)层。卷积神经网络(CNNs)引入了卷积和池化层,特别适用于处理像图像这样的平移不变数据。循环神经网络(RNNs)利用循环单元处理顺序或时间序列数据。为了解决CNN、RNN和GNN模型仅捕获局部关系的问题,Transformer于2017年提出,在学习远距离特征表示方面表现出色。Transformer主要依赖于基于注意力的注意力机制,例如自注意力和交叉注意力,来提取内在特征并改善其表示能力。例如GPT-3这样的预训练大规模基于Transformer的模型在各种NLP数据集上表现出色,擅长自然语言理解和生成任务。Transf

......长按二维码访问原文

Transformers in Vision: A Survey: 2024-04-28 16:15

......长按二维码访问原文

GSDF论文阅读笔记 2024-04-28 19:13

项目网页:https://city-super.github.io/GSDF/

核心内容

GSDF将重建过程分为GS-branch和SDF-branch两个分支,两个分支之间互相提供一定的几何指导,最终再通过联合优化加强两个分支之间的联系,以此来想要达到既保持3DGS快速训练的优势,又获取SDF的精确几何的目的。

相关介绍

目前神经场景表示(Neural Scene Representation)已经达到了较高的渲染质量,但是NeRF类方法的隐式表达使其难以支持下游应用,例如robotics,physical simulations以及XR相关应用,因为在这些场景中可编辑是一个很重要的特性,而非显式的场景表达很难实现可控编辑。在NeRF类方法的探索中,有很多工作尝试通过神经表面重建(Neural Sur

......长按二维码访问原文

CVPR 2024 | REAL:检索增强提升zero-shot性能,深挖视觉语言模型中的长尾分布现象 2024-04-28 19:00

公众号:将门创投(thejiangmen)

作者:seven_

以CLIP为代表的视觉语言大模型(VLMs)在zero-shot识别等领域表现出了优异的性能,这改变了很多下游任务的学习范式,研究者们纷纷尝试如何将VLMs集成到现有的框架中来提高下游性能。虽然CLIP在ImageNet等代表性数据集达到了较高的准确率,但是其不可避免的出现了长尾数据识别较差的现象。例如对于“night snake”等十多个长尾类别,模型的识别准确率下降到10%以下。

本文介绍一篇发表在计算机视觉顶级会议CVPR 2024上的论文,本文系统的对VLMs中的长尾概念分布问题进行了分析,并通过使用大型语言模型(LLMs)来对VLMs预训练数据集中的概念频率进行测量。作者通过实验发现,目前流行的VLM数据集(例如LAION)

......长按二维码访问原文

VIFNet:端到端的可见光-红外光图像去雾网络 2024-04-29 13:17

论文:VIFNet: An End-to-end Visible-Infrared Fusion Network for Image Dehazing

作者:Meng Yu, Te Cui, Haoyang Lu, Yufeng Yue

编译:董亚微

01 引言

本文研究了通过可见光与红外光的融合来去除图像中的雾霾。由于雾霾会散射光传播,影响成像过程并降低图像质量,因此去除雾霾是自动驾驶等领域中的一项重要任务。本文提出了一个端到端的可见光-红外光图像去雾网络(VIFNet),通过探索两种模态的深层结构特征并进行不匹配融合,以提高去雾性能。

02 提出的方法

本文提出了一种称为VIFNet的可见光-红外融合网络,用于图像去雾。VIFNet是一个端到端的可见光-红外融合去雾网络,由三个主要阶段组成:深层

......长按二维码访问原文

论文分享!“Zoom-and-Reasoning” 2024-04-29 10:13

题目:Zoom-and-Reasoning: Joint Foreground Zoom and Visual-Semantic Reasoning Detection Network for Aerial Images

期刊:IEEE SIGNAL PROCESSING LETTERS(中科院二区)

单位:The Academy for Engineering & Technology, Fudan University

年份:2022

背景与问题

这篇论文的背景是航拍图像的目标检测,这一领域面临的主要挑战包括小对象的密集聚集以及类间相似性和类内多样性的混淆。由于航拍图像的特殊性,如视角高、拍摄范围广等,传统的目标检测方法在准确性和效率上常常受到限制。

以往的处理方式

以往的处理方式通常采用的是

......长按二维码访问原文

立体视觉技术的发展与应用 2024-04-29 12:06

立体视思维导图

一、在眼视力方面什么是立体视

立体视觉,是生物体或机器系统通过双眼或类似的多传感器观察物体,从而获得物体三维空间信息的能力。

立体视觉基于双眼视差原理,即两只眼睛从稍微不同的角度观察物体,大脑通过综合这两个不同的视觉信号,形成立体的景象。

二、在生物界的立体视有哪些应用

在生物界,例如,鸟类和猫科动物能够利用立体视觉来精准判断猎物的距离和位置。

对人类而言,立体视觉使我们能够更准确地感知周围环境,进行空间判断和交互操作。

三、立体视觉的技术发展趋势如何

早期立体视觉技术主要依赖于简单的视觉辅助工具,如立体镜片和立体画片。

随着计算机视觉和图像处理技术的发展,现代立体视觉技术取得了突破,如基于机器视觉的三维重建技术、多传感器融合等。

四、计算机立体视觉系统组成

计算机立体视觉

......长按二维码访问原文

Mamba再下一城!MambaUIE:第一个基于SSM构建的水下图像增强新网络 2024-04-28 22:56

这应该就是海蛇(Mamba)吧!

MambaUIE:第一个基于SSM构建的水下图像增强新网络,设计了高效的Mamba块,在宏观层面引入视觉状态空间(VSS)块来捕获全局上下文信息,同时在微观层面挖掘局部信息,仅用2.8个GFLOPs就实现了SOTA性能!代码即将开源!

点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

快点击进入:Mamba学习技术交流群

MambaUIE

MambaUIE: Unraveling the Ocean's Secrets with Only 2.8 FLOPs

单位:北京信息科技大学

代码:https://github.com/1024AILab/MambaUIE

论文:https://arxiv.org/abs/240

......长按二维码访问原文

[学习记录-深度学习-框架]Detectron2(二) 2024-04-29 10:52

最近有时间,继续记录以下Detectron2这个框架的一些学习内容。

detectron2.config.get_cfg的基本内容:

这是一个获取构建模型等基本设置的操作:

from detectron2.config import get_cfg cfg = get_cfg ()

cfg的内容

看一下默认得到的cfg包含哪些内容

type(cfg) cfg.keys() dict_keys(['VERSION', 'MODEL', 'INPUT', 'DATASETS', 'DATALOADER', 'SOLVER', 'TEST', 'OUTPUT_DIR', 'SEED', 'CUDNN_BENCHMARK'

......长按二维码访问原文

[分享][每日更新][2024.04.26][CV_arxiv_papers] 2024-04-29 12:05

2024-04-26

Ag2Manip: Learning Novel Manipulation Skills with Agent-Agnostic Visual and Action Representations

Ag2Manip:通过与代理无关的视觉和动作表示来学习新颖的操作技能

Puhao Li, Tengyu Liu, Yuyang Li, Muzhi Han, Haoran Geng, Shu Wang, Yixin Zhu, Song-Chun Zhu, Siyuan Huang

null

......长按二维码访问原文

机器视觉系统的组成部分 2024-04-29 14:52

一般来说,一个完整的机器视觉系统由光学系统(光源、镜头、工业相机)、图像采集单元、图像处理单元、执行器和人机界面等模块组成。各功能模块缺一不可、相辅相成。

1.照明(光源)

照明是影响机器视觉系统输入的重要因素。光源系统的设计非常重要,因为它直接关系到输入数据,即图像质量和应用效果。工程师首先应确定有效的照明条件,并根据用户需求和产品特性选择相应的照明装置。这样就可以保证在该光照条件下生成的图像能够突出用户需要的目标信息特征。一般来说,光源可分为可见光源和不可见光源。工业上常用的光源有LED、卤素灯、荧光灯等。不可见光源主要分为近红外光、紫外光、X射线等。目前,LED光源是应用最广泛的机器视觉光源,具有高效、长寿命、防潮等特点、防震、节能、环保。是工程师设计照明系统的最佳选择。不可见光源主要用于满足特定需求

......长按二维码访问原文

Skeleton2Point: Recognizing Skeleton-Based Actions as Point Clouds: 2024-04-29 15:10

Homepage: Skeleton2Point: Recognizing Skeleton-Based Actions as Point Clouds (yyyybq.github.io)

We propose a skeleton-to-point net- work (Skeleton2Point) that consists of two trunk branches. In the first branch, referred to as the human skeleton branch, skeleton data is encoded with given space-time information and then fed into a graph transformer neural n

......长按二维码访问原文

北邮 | OMEGAS:大场景中的目标分割、网格提取、遮挡目标重建最新SOTA 2024-04-29 17:10

读者个人理解

这篇文章介绍了一个名为OMEGAS的框架,旨在从大规模场景中提取指定对象的网格。OMEGAS框架通过多步方法实现,首先使用SAM模型引导3DGS的分割,构建目标对象的基本3DGS模型。接着,利用大规模扩散先验(如Stable Diffusion)进一步优化3DGS模型的细节,特别是处理原始场景视图中的不可见或被遮挡的部分。然后,将3DGS模型重新渲染到场景视图中,实现准确的物体分割并有效移除背景。最后,将目标对象的图像和3DGS模型输入SuGaR模型中,进行进一步优化并提取最终网格。实验结果显示,OMEGAS在目标对象网格重建中具有显著的性能优势,特别是在纹理细节和抗遮挡性方面。

原文:北邮 | OMEGAS:大场景中的目标分割、网格提取、遮挡目标重建最新SOTA

OMEGAS框架在从大场景

......长按二维码访问原文

视觉魔法师

我还没有学会写个人说明!

相关推荐