机器视觉资讯20240409 - 云禅网络-机器视觉资讯

文章目录[隐藏]

视觉招聘小黑板
行业资讯

视觉招聘小黑板

欲了解详情，请在公众号后台回复：240409

行业资讯

Chip10 Science | 基于事件驱动视觉传感器的脉冲神经网络 2024-04-08 17:55

工作简介

传统的图像传感器具有固定的帧率，无论像素点的光强有没有发生变化，都会在每一帧记录下所有像素的绝对光强，因此包含了大量的冗余视觉数据和有限的信息。基于事件的视觉传感器只有在像素点发生光强变化的时刻才会发放一个脉冲信号，当处于一个动态变化的场景时会异步地发放一系列稀疏的脉冲序列，产生很少但是包含有价值的数据。目前市面上已经存在的神经形态视觉传感器（DVS），首先需要用包含了光电探测器、电容器、放大器和比较器等复杂的像素电路检测光强的变化。然后这些模拟信号需要经过ADC转化为数字信号，最后被FPGA 标上时间戳，产生一系列包含像素地址, 光强变化极性(光强增加或者减小)，时间信息的数字事件。这些由ADC 和FPGA 完成的模拟信号处理步骤限制 DVS 的时间分辨率在几十微秒量级。除

......长按二维码访问原文

【4.4 九点标定】视觉检测实战项目 2022-08-14 14:57

本文介绍九点标定方法

已知 9 个点的图像坐标和对应的机械坐标，直接计算转换矩阵，核心原理即最小二乘拟合

\left\{ \begin{array}{l} x' = ax + by +c \\ y' = a'x + b'y + c' \end{array} \right.

\left[ \begin{array}{l} x_1& y_1 & 1 \\ x_2 & y_2 & 1 \\ \vdots & \vdots & \vdots \\ x_9 & y_9 & 1\\ \end{array} \right] \left[ \begin{array}{l} a & a'\\ b & b'\\ c & c'\\ \end{array} \right] = \left[ \begin{array}{l} x'

......长按二维码访问原文

传统图像处理还有前景吗？ 2019-10-11 19:40

反对把传统图像处理和计算机视觉对立起来，这俩是你中有我、我中有你的关系。搞计算机视觉的并不是一点图像处理的基础都没有，也需要花大量时间预处理图像。搞图像处理的，如果一点深度学习都没学过，那也是前途堪忧，至少侧面反映了学习驱动力不足。

至于导师的研究方向，深度学习是2012年之后才火起来的，在这之前拿到博士学位的，99.9%不是搞深度学习出身。大家都是半路出家，临时转方向，但为啥有的导师转方向很成功，团队一年顶会、顶刊文章十几篇，有的导师却守着自己陈旧的研究方向死磕呢？（我不否认坚持传统领域的导师里面有理想主义者，特立独行、不跟风，为了学术甘愿忍受寂寞；可我相信更多人都是实用主义者，能转方向早转了，转不了的则是因为年纪大，杂事多，没有学习动力，对新鲜事物丧失兴趣的缘故……）导师的研究方向，一定程度反映了他的上进

......长按二维码访问原文

基于点云的机器人抓取识别综述 2020-11-05 20:58

Date：2020-7-14

作者：小毛

来源：公众号【3D视觉工坊】

原文链接：基于点云的机器人抓取识别综述

欢迎加入国内最大的3D视觉交流社区，1700+的领域从业者正在一起学习~

机器人作为面向未来的智能制造重点技术，其具有可控性强、灵活性高以及配置柔性等优势，被广泛的应用于零件加工、协同搬运、物体抓取与部件装配等领域，如图1-1所示。然而，传统机器人系统大多都是在结构化环境中，通过离线编程的方式进行单一重复作业，已经无法满足人们在生产与生活中日益提升的智能化需求。随着计算机技术与传感器技术的不断发展，我们期望构建出拥有更加灵敏的感知系统与更加智慧的决策能力的智能化机器人系统。

图1-1 机器人的应用领域

图1-2 机器人抓取的操作流程与步骤

机器人抓取与放置是智能化机器人系统的集中体

......长按二维码访问原文

机器视觉技术路线的总结与讨论 2022-04-18 13:32

各位好，本人电子工程硕士，从事机器视觉算法和系统研究接近10年时间。在这些过程中，大部分是自己独立解决工程应用问题，因此养成了善于思考，善于总结的习惯。这个领域研究论文很多，针对各个项目各个行业均有涉足，但是没有一篇整体把握的文章。结合自己将近10年做过各种项目，看过很多文献，希望对这个领域发表一下自己的看法，让后来者有章可循，有据可依，在项目开展之前，能清楚地知道什么项目能做，什么项目不能做，推动行业的进步。

本文不会像一般论文那样，先把什么是机器视觉，机器视觉发展历史先介绍一遍。虽然那样对于写论文来说是必要的，但是在这里显得啰嗦。直接上核心内容。

必要的叙述还是要的，机器视觉是计算机视觉在工业领域的分支。而计算机视觉是人工智能的重要分支。人工智能的发展水平直接影响计算机视觉和机器视觉的发展水平。人工智能

......长按二维码访问原文

Teledyne e2v宣布推出用于实时2D视觉和3D深度数据的Topaz5D图像传感器--机器视觉网 2024-04-08 14:27:20

2024-04-08 14:27:20 来源: 中国机器视觉网

Teledyne e2v宣布推出Topaz5D™，一款全高清CMOS图像传感器，旨在将2D视觉与3D深度图生成结合在一起。在挑战性照明条件下使用的单个Topaz5D传感器可根据检测到的对比度提供3D物体深度信息，非常适合各种物流应用、AR/VR头显、访问控制设备、家用清洁机器人和自主移动机器人（AMR）。

Topaz5D将2D视觉与3D深度图生成相结合

Topaz5D将小型2.5 µm全局快门像素与后处理衍射层结合来创建角度敏感像素。这样可以生成3D角度信号原始数据，然后由5D版本SDK进行处理。Topaz5D是Teledyne e2v热门产品Topaz 2M的3D变体，广泛应用于物流/零售市场和智能工厂。

Topaz5D具有2百万像素（1

......长按二维码访问原文

长芯盛推出Camera Link长距离高柔混合光纤数据线新品--机器视觉网 2024-04-08 14:08:30

2024-04-08 14:08:30 来源: 中国机器视觉网

长芯盛(武汉)科技有限公司（以下简称“长芯盛”）成立于2013年，是湖北省第四批专精特新“小巨人”企业之一。公司拥有自主研发光电转换芯片、特种耐弯折光纤等核心技术优势，并致力于深耕光纤通信行业。产品广泛应用于机器视觉、虚拟现实、视频会议、数据中心和数字标牌等工业和终端消费领域，为众多知名企业提供配套产品解决方案，在行业内树立了广泛的知名度并获得一致认可。

为满足市场需求，尤其是解决机器视觉行业Camera Link相机在实际应用中的长距离连接问题，长芯盛加大了研发投入力度，并成功推出了首款传输距离可达40米的Camera Link 2.1高柔混合光纤数据线。这一创新产品填补了市场空白，受到业界和工程领域的积极关注与好评。

Camera Lin

......长按二维码访问原文

越疆机器人发布了 AI 训练机器人 X-Trainer--机器视觉网 2024-04-08 11:35:55

2024-04-08 11:35:55 来源: 中国机器视觉网

4月2日，智能协作机械臂厂商越疆机器人发布了 AI 训练机器人 X-Trainer。视频显示了 X-Trainer 采用模仿学习神经网络+ 视觉大语言模型，训练 2 小时，获得了自主刷盘子的能力，相较普遍的训练时长，节省了 70% 的训练时间。

从带有红色食物残留物的盘子、放在黄色盘子上的海绵，以及后面挂着碟子的金属架，推理出清洗盘子并收纳到金属架的任务。

擦拭三连，不放过一点残留的污渍。

机器人刷完盘子准备放进盘架时，突然被人为干预再次弄脏盘子，但机器人迅速捕捉到这一变化，并立即做出反应。

实际上，X-Trainer 融合了智能机器人与 AI 最前沿技术，使得机器人能够快速模仿学习人类复杂动作，最终实现行为克隆。

越疆科技联合创始

......长按二维码访问原文

吉诺科技产品新增国际UL认证，品质保障升级--机器视觉网 2024-04-09 14:38:03

2024-04-09 14:38:03 来源: 中国机器视觉网

近日，吉诺科技宣布项目成功获得了UL认证，这不仅是对我们产品质量的高度肯定，更是对我们管理体系的一次全面升级。获得这一国际认证，标志着吉诺科技的产品已经完全符合国际标准，将在全球市场上获得更广泛的认可和使用。

UL作为一家拥有着127年历史的全球安全科学专家和标准开发机构，其在行业内的权威地位无人能撼。对于全球制造商而言，UL是值得信赖的合格评估提供者之一。

历经无数次的研讨和改进，天津吉诺科技有限公司的精英团队与全球知名的UL认证机构进行了深入的交流与合作，倾注了极大的心血和汗水。吉诺科技，勇破国际市场壁垒，创新不止！凭借十多年的坚持与拼搏，产品在国际市场赢得了客户的广泛赞誉和一致好评。我们将继续秉承“质量第一，客户至上”的理念，不断追求卓

......长按二维码访问原文

凌华科技发布基于 Intel® Amston-Lake 处理器的模块化电脑，适合加固级边缘解决方案--机器视觉网 2024-04-09 11:15:16

2024-04-09 11:15:16 来源: 中国机器视觉网

凌华科技发布基于 Intel® Amston-Lake 处理器的模块化电脑，最多支持 8核和 12W TDP，适合加固级边缘解决方案。采用高性能的 Intel Atom x7000RE 和 x7000C 系列处理器，支持板贴内存和军用宽温级选择，可实现工业级的稳定性。

摘要

凌华科技推出两款基于最新Intel® Atom处理器的模块化电脑，一款是COM Express、一款是SMARC。

cExpress-ASL:COM.0 R3.1 Type 6 紧凑型计算模块，支持 2/4/8核 Intel Atom x7000RE & x7000C 系列处理器, 最大支持 16GB LPDDR5 内存, 8x PCIe Gen3 和 2.5GbE，T

......长按二维码访问原文

大恒图像短波红外相机，开启非可见光新“视”界--机器视觉网 2024-04-09 10:55:42

2024-04-09 10:55:42 来源: 中国机器视觉网

近日，大恒图像MARS-138-95GM-P-TN-SWIR短波红外相机正式发布。该相机可替代传统的“可见光相机+短波红外相机”双相机检测方案，降低系统成本、提高处理速度、扩大检测范围。

产品简介

新款相机搭载Sony SenSWIR IMX990 InGaAs传感器，内置多种图像预处理功能，采取TEC制冷提高信噪比，输出更优质的图像，通过GigE接口实时传输，具备高帧率 89.7fps（突发采集高速模式下，Sensor 位深 BPP8模式下，采集帧率可达 134fps）。400nm~1700nm宽光谱成像,将可见光+短波红外融于一台相机，在半导体、光伏、农业、印刷等行业的AOI设备中更为适用。

光谱曲线图

产品优势

更高帧率；TEC

......长按二维码访问原文

数之联3大项目入选四川省科技厅2024年人工智能领域首批项目--机器视觉网 2024-04-09 10:38:54

2024-04-09 10:38:54 来源: 中国机器视觉网

日前，四川省科学技术厅按照《四川省科技计划管理办法》要求公示了2024年人工智能领域首批项目。其中，数之联凭借其卓越的技术实力和创新思维，成功入选了三项重要项目，分别是「知识和数据联合驱动的认知学习模型研究及应用项目」[领域AI大模型关键技术研究及应用项目」以及「面向新型显示产品的缺陷智能检测系统研制及推广项目」。

这些项目的入选，不仅体现了数之联在人工智能领域的深厚积累与卓越实力，更彰显了其致力于推动科技创新、助力产业发展的坚定决心。

当前，四川将人工智能作为“1号创新工程”。而这批项目将围绕四川人工智能产业的发展现状与技术需求展开，致力于将更多的科研“成果”转化为实际应用的“结果”，进而打造出产业的成熟“成品”。

数之联拥有20余年数据

......长按二维码访问原文

无需贴点、效率倍增，跟踪式激光扫描系统在大尺寸精密测量中显身手--机器视觉网 2024-04-08 16:04:15

2024-04-08 16:04:15 来源: 中国机器视觉网

精准测量是支撑高质量制造的基石。先临三维的高精度工业3D扫描技术作为一种光学测量工具，凭借其高精度、高效率、非接触等优势，为高端制造的精密三维尺寸检测提供保障。当下，这项技术已经渗透至到汽车工业、航天制造、电子电器、教育科研等行业，满足了不同用户对三维尺寸检测的需求。

在工业领域，激光3D扫描仪得到了广泛应用。然而，传统的激光3D扫描仪需要在被测物体上粘贴标志点，以实现高精度三维数据的拼接与获取。在大型工件的三维尺寸检测中，这种方式动辄需要粘贴和去除成百上千个标志点，耗费大量时间。

先临三维的跟踪式激光扫描系统以动态跟踪、不贴点的独特优势，以及激光扫描高精度、高效率、材质适应性佳的稳定表现，为大型工件精准的三维尺寸检测提供了破题思路。通过在扫

......长按二维码访问原文

视展光电偏振智能高温监控摄像机--机器视觉网 2024-04-08 15:58:18

2024-04-08 15:58:18 来源: 中国机器视觉网

光的偏振原理

光的偏振是光的基本属性，反映了光在传播过程中振动方向随时间的变化规律，光的偏振态蕴含着丰富的目标和环境信息。偏振成像是同时获取光的强度、光谱、偏振的新一代成像技术，将视觉信息从二维扩展到更高维度，为获取目标与环境信息提供了新路径

应用背景

由于高温、强光、浓烟与粉尘的影响，传统监控设备与人工观测无法获取清晰的一线生产画面只能依赖于人工观测，导致操作可靠性低，人员劳动强度大。

偏振智能高温监控摄像机采用全新偏振光机组件，内置多种偏振重构与强光抑制算法，可实现对炼铁、热轧、焦化等复杂场景的可视化成像。在实际应用中能够显著提升生产安全系数，降低工人在恶劣环境下劳动强度，为生产智能化提供视觉支持。

功能特点

穿烟透雾：偏振成像可

......长按二维码访问原文

迁移科技3D视觉引导拆码垛方案：耐火材料产线的智能化升级之选--机器视觉网 2024-04-08 15:51:18

2024-04-08 15:51:18 来源: 中国机器视觉网

随着先进科技的不断发展，工业自动化已经成为耐火材料产线的重要发展方向。其中，3D视觉技术在拆码垛环节的应用，更是推动了耐火材料产线生产效率与安全性的双重提升。

迁移科技作为行业领先的3D工业相机和3D视觉机械臂引导系统供应商，持续深耕耐火砖拆码垛场景，已携手集成商合作伙伴在东北、华北、华中等地区成功落地多个3D视觉引导耐火砖拆垛项目，充分印证了迁移科技耐火砖拆码垛解决方案的高效性、稳定性和可靠性。

本文将详细解析这一方案的核心技术及其在实际应用中所展现的卓越优势与重要价值。

耐火砖拆码垛场景挑战

耐火砖是一种由耐火黏土或其他耐火原料烧制而成的多规格耐火材料，可用作建筑窑炉和各种热工设备建筑，其生产效率和质量稳定性对整体产业链有着至关重要的

......长按二维码访问原文

新能源汽车电驱动，智能检测实现质造蜕变--机器视觉网 2024-04-10 16:33:59

2024-04-10 16:33:59 来源: 中国机器视觉网

行业发展推动工艺变革

今年春节，老家的新能源汽车肉眼可见的多了不少。据公安部统计显示，截至2023年12月底我国新能源汽车保有量已达2041万辆。伴随行业的高速发展，也推动了电驱动系统的变革，包括HEV车型在内的扁线电机渗透率已超75%电驱动产业正在加速全面扁线化。驱动电机的质量关乎消费者的生命安全，质量检测成为至关重要的一道工序，不少企业正寻找方案以保证稳定的生产质量。

扁线电机对产品的一致性、稳定性要求高，繁多的组件与工艺，使零部件在生产组装过程中极易产生各种问题，严重影响良品率与成品质量。依托对扁线电机核心工序上的研究和理解，结合项目落地应用形成的行业Know-how微亿沉淀了系统化检测方案，实现电驱工序全覆盖。从电机定子、转子的生产过

......长按二维码访问原文

关于兆龙 Class EA 布线系统，新建项目 “有话说”--机器视觉网 2024-04-09 16:12:04

2024-04-09 16:12:04 来源: 中国机器视觉网

在当前数字化背景下，新建项目的综合布线系统可能面临 “多方面” 的挑战。在规划和设计方面，需要考虑项目需求与规模，包括布线拓扑、线缆类型、线槽管道等；在技术难题方面，要确保与各设备和系统的兼容性，满足高速数据传输要求，兼顾移动和扩展性，并避免信号干扰；在实施与管理方面，要考量施工难度和成本，同时进行严格测试和验收，建立管理和维护机制，控制成本，以及考虑特殊项目的安全和保密措施。

面对这些挑战，兆龙 Class EA ( 6A 类）布线系统凭借其卓越的性能和全面的解决方案，成了很多新建项目的 “最佳选择” 和 “坚强保障” 。

为什么建议采用 6A 类布线系统？

原因如下：

6A 类布线系统支持10 Gb/s应用达到 100 m；6A

......长按二维码访问原文

威格勒激光线扫相机在钢铁行业的典型应用--机器视觉网 2024-04-09 15:43:50

2024-04-09 15:43:50 来源: 中国机器视觉网

钢铁行业的制成品应用领域广泛，催生了不同领域的应用需求，如对钢铁制品的宽度、直径、角度、焊缝等进行测量和控制。机器视觉产品在钢带和钣金，钢管，型钢和圆钢，及压下制动器/角钢生产的过程中，都分别有典型的应用。本期介绍钢管和压下制动器/角钢生产过程中的几项应用。

钢管表面检测

不同尺寸、不同表面的钢管应分别检测和测量。对于不同类型的钢管，检测分为动态和静态测量，公差为±0.5 mm。

· 测量系统的典型要求

直径检测精确到±0.5 mm；各种表面和材料的检测；对环境光和污垢不敏感；可检测所有管道表面。

钢管全方位检测

为了进一步加工，应根据直径、圆度和笔直度对管道进行全方位的测量。要测量的管道直径为400至1500 mm，钢管表面可能不同

......长按二维码访问原文

跨维智能国际化业务再添新标杆赋能海外客户包装产线升级--机器视觉网 2024-04-09 15:07:55

2024-04-09 15:07:55 来源: 中国机器视觉网

近期，国内某知名机器制造商携手跨维智能，在俄罗斯、哥伦比亚等多个国家落地了跨维智能3D视觉引导拆垛解决方案，成功赋能多家海外包装线生产客户产线智能化升级改造。

跨维智能3D视觉引导拆垛解决方案早已在物流、电商、消费电子等行业积累了丰富的落地经验。此次，针对海外客户产线的升级，再次验证了跨维智能3D视觉技术在拆垛自动化领域的巨大潜力，成为其国际化业务另一新标杆。

3D视觉引导拆垛解决方案

跨维智能3D视觉引导拆垛解决方案利用计算机视觉和机器学习等先进技术来实现自动拆垛的过程，基于跨维智能自研的3D智能相机可以获取作业范围内的点云信息及高清的2D图像，结合跨维3D工业视觉软件，利用三维几何深度学习模型进行实体分割，计算出分割后各个实体(麻袋/箱

......长按二维码访问原文

一文读懂晶体生长如何做到高质高效--机器视觉网 2024-04-09 14:49:19

2024-04-09 14:49:19 来源: 中国机器视觉网

随着全球能源结构转型深入推进，太阳能利用技术获得长足发展动力，已成为世界快速、稳定发展的新兴产业之一。在我国节能减排的发展战略下，太阳能发电等光伏产品应用率逐渐提升，产业逐渐由居民生活向工业生产渗透，市场规模逐渐扩大。

作为光伏产业的重要原材料之一，下游需求拉动我国单晶硅片市场需求上涨，同时相关的晶体生长设备需求显著增长。

案例背景

案例用户为国内某光电功能材料专用晶体生长设备解决方案商，为保障其设备稳定运行，用户对其核心计算单元-工业计算机的品质与性能提出了极高要求：1.为保障控制系统精准、稳定运行，需要具备极强算力；2.为实现外接温度传感器、称重传感器等多功能模块，需要具备极强扩展性；3.为实现7*24小时持续稳定工作，需要适用于严苛的

......长按二维码访问原文

以柔性集成视觉方案解决顶盖焊接检测难点--机器视觉网 2024-04-09 14:35:28

2024-04-09 14:35:28 来源: 中国机器视觉网

新能源行业中，顶盖焊接是方形动力锂电池封口焊接过程中的重要一环，关系到锂电池能否安全稳定工作，相关焊接质量问题不容小觑。受到激光功率、保护气体以及产品材质等因素影响，焊接过程中极易发生爆点、焊坑、孔洞、断焊、漏焊、翻边等缺陷，严重的焊接缺陷会造成漏液、短路等安全事故。

大族视觉以柔性的综合集成视觉方案解决顶盖焊接检测的痛点难点，高效分析捕捉爆点、焊坑、孔洞、断焊、漏焊等问题，避免电解液渗漏、接触不良或其他焊接不良引发的质量问题。

案例解析

检测项目：电芯顶盖焊缝外观缺陷检测

项目难点：检测速度快，节拍要求高，高反光材料，影响成像稳定性。

解决方案：2D检测算法、3D检测算法与AI深度学习相结合。

通过三维图像的高度信息获取图像，采用结

......长按二维码访问原文

德国机床制造商成CCMT最大外国展团―新闻频道- 视觉系统设计 2024/4/8 14:26:54

上海，2024年4月8日 - 140家德国企业将参加4月8日至12日在上海举行的2024年数控机床展览会（CCMT）。德国公司拿下了4675平方米的净空间，成为最大的外国展团。VDW（德国机床制造商协会）执行董事Markus Heering博士表示：“经过长时间的新冠肺炎限制，我们的行业将在疫情后于上海首次展示他们的创新。”

新冠疫情带来了前所未有的挑战。在2020年和2022年的展会相继被取消后，今年CCMT的展馆数量从10个增加到了17个。

CCMT 2024吸引了来自德国的约140家参展商。德国再次成为最大的外国展团之一，总面积4675平方米。

......长按二维码访问原文

X-FAB通过背照式技术增强图像传感器性能―新闻频道- 视觉系统设计 2024/4/9 19:52:48

全球领先的模拟/混合信号和特色工艺代工厂X-FAB，近期宣布其光学传感器产品线有了重大补充。该公司的CMOS图像传感器制造能力，现在能够提供与其流行的XS018 180nm CMOS半导体工艺相关的背照式（BSI）技术。

背照式CMOS图像传感器剖面架构图

通过背照式技术，CMOS图像传感器的性能特征可以得到显着增强。这意味着后端工艺金属层不会阻挡入射光到达感光像素，从而将填充因子提高至100%。这在低照度情况下非常有益——因为可以实现更高的像素感光度。背照式技术还提供了额外的优势，即由于光路较短而显着减少相邻像素之间的串扰，从而实现更好的成像质量。

尽管，用于300mm晶圆的小像素背照式技术方案很常见，但用于200mm晶圆的具有融合大像素排列的背照式技术选项却很少，特别是在需要额外定制的时候。新的X-F

......长按二维码访问原文

梅卡曼德携先进AI+3D视觉技术亮相数控机床展―新闻频道- 视觉系统设计 2024/4/8 22:24:28

今日，第十三届中国数控机床展览会（CCMT 2024）在上海新国际博览中心盛大开展。时隔六年，CCMT 2024重磅来袭，展会首次启用上海新国际博览中心全部17个室内展馆，展会总面积达20万平方米，是至今为止国内乃至亚洲规模最大的机床专业展览会。展会共有来自28个国家和地区的近2000家机床相关企业参展，展示最前沿的新产品、新技术，以及行业数智融合的最新成果。

梅卡曼德首次亮相CCMT，为现场观众带来了3D视觉引导小圆环高速抓取、3D视觉引导黑色异形件深筐抓取、副车架在线测量等典型智能机器人应用，以及AI+3D视觉技术对各类典型工件精准的成像和识别效果。本次展会为期五天，诚邀您莅临梅卡曼德展位（W2馆，A302展位），深入了解AI+3D视觉多元化应用场景。

先进AI+3D视觉技术

助力机加工产线智能化、自

......长按二维码访问原文

Rocky 装卸车全球亮相―新闻频道- 视觉系统设计 2024/4/8 21:58:55

3 月，星猿哲科技（XYZ Robotics）携 Rocky 移动操作机器人和装卸车解决方案接连亮相三场海外大展，2024 上半年海外巡展圆满落下帷幕。

行业内备受瞩目的三场国际展会：MODEX、LogiMAT 和 SF+AW 分别于 3 月 11-14 日、17-19 日和 27-29 日在美、德、韩三国盛大举办，观众规模共计 19 万人次。

星猿哲科技在规模空前的业内海外大会中展现了卓越的技术创新和全球化实力，与行业伙伴深入交流、碰撞的同时，获得了现场观众的广泛关注。

展会现场，RockyOne 和 RockyDual 机器人为观众展示了高效、灵活的装卸车解决方案。

依托前沿的 3D 视觉感知和机器人控制技术，赋予机器人以手眼足协调能力，致力解决仓储物流“最后一公里”自动化难题。

RockyOne

......长按二维码访问原文

埃塞力达Optem FUSION显微成像系统―产品聚焦频道- 视觉系统设计 2024/4/9 20:00:05

Optem® FUSION模块化显微镜平台是新一代显微成像镜头系统，适用于从可见光到SWIR波长的高精度、高倍率应用。广泛的即用模块使其成为市场上最全面的镜头系统。无论是高通量自动检测还是高分辨率缺陷检测，该系统都能够满足当今OEM显微成像应用不断发展的需求。

Optem FUSION镜头系统将统一的机械接口与双向无限远光学系统相结合，在三项不同的核心光学功能方面提供无与伦比的互换性、性能多样性和功能灵活性：固定放大倍率、7:1变焦镜头和12.5:1变焦镜头。将这三项核心功能中的任何一项与各种通用相机接口、相机镜筒、下游功能模块和物镜快速结合起来，以指定精确的镜头形式、功能和性能来满足您的成像要求。

......长按二维码访问原文

大恒图像短波红外相机―产品聚焦频道- 视觉系统设计 2024/4/8 22:12:12

产品简介

光谱曲线图

产品优势&参数特点

01.更高帧率

02.TEC制冷图像更清晰

03.曝光时间更短

......长按二维码访问原文

Teledyne e2v独特的5D图像传感器可提供实时2D视觉和3D深度数据―产品聚焦频道- 视觉系统设计 2024/4/8 21:48:42

Teledyne科技旗下公司、全球成像解决方案创新者Teledyne e2v宣布推出Topaz5D™，一款全高清CMOS图像传感器，旨在将2D视觉与3D深度图生成结合在一起。在挑战性照明条件下使用的单个Topaz5D传感器可根据检测到的对比度提供3D物体深度信息，非常适合各种物流应用、AR/VR头显、访问控制设备、家用清洁机器人和自主移动机器人（AMR）。

Topaz5D将2D视觉与3D深度图生成相结合

Topaz5D具有2百万像素（1,920 x

......长按二维码访问原文

晶合集成5000万像素BSI量产―新闻频道- 视觉系统设计 2024/4/9 20:30:27

继90nm制程CIS和55nm堆栈式CIS实现量产之后，晶合集成CIS再添新产品。近期，该公司55nm单芯片、高像素背照式图像传感器（BSI）迎来批量量产，极大赋能智能手机的不同应用场景,实现由中低端向中高端应用跨越式迈进。晶合集成规划CIS产能将在今年内迎来倍速增长，出货量占比将显著提升, 成为显示驱动芯片之外的第二大产品主轴。

近年来，5000万像素CIS已在智能手机配置上加速渗透。晶合集成与国内设计公司合作，基于自主研发的55nm工艺平台，使用背照式工艺技术复合式金属栅栏，不仅提升了产品进光量，还兼具高动态范围、超低噪声、PDAF相位检测对焦等优势。此外，该技术采用单芯片技术架构，既减少芯片用量，也缩短了芯片生产周期，同时将像素规格微缩20%，像素尺寸达到0.702μm，整体像素提高至5000万水准，将

......长按二维码访问原文

FocusFlow：提升自动驾驶中关键点光流估计 2024-04-08 13:32

作者：自动驾驶专栏 | 原文出处：公众号【自动驾驶专栏】

摘要

本文介绍了FocusFlow：提升自动驾驶中关键点光流估计。基于关键点的场景理解是自动驾驶应用的基础。同时，光流在很多视觉任务中发挥着重要作用。然而，由于所有点上同等注意力的隐含偏差，经典的数据驱动光流估计方法在关键点上的性能不太令人满意，限制了它们在关键点关键的安全相关的场景中的实现。为了解决这些问题，本文引入一种基于点的建模方法，其明确要求模型学习与关键点相关的先验。基于这种建模方法，本文提出FocusFlow，该框架包含：1）混合损失函数与经典光度损失函数相结合，以及本文提出的用于不同点监督的条件点控制损失（CPCL）函数；2）通过本文提出的条件控制编码器（CCE）代替传统特征编码器的条件控制模型。CCE包括从帧中提取特征的图像帧特征编码

......长按二维码访问原文

深度学习特征提取新突破！42个涨点方案，让模型性能、效率倍增 2024-04-08 18:26

作为数据预处理的一个重要步骤，特征提取是CV领域一个复杂但不可或缺的过程。它通过某种变换或映射，从原始数据中提取出对目标任务更有帮助的信息，以提高模型性能、降低计算成本、提升数据可解释性和模型泛化能力。

目前，特征提取主要有2大类主流方法：基于检测器的方法、无检测器的方法。基于检测器的方法依赖于手工设计的特征或者通过训练得到的深度神经网络来提取特征点，而无检测器的方法则直接从数据中提取特征，两者各有优势。

在实际应用中，选择合适的特征提取方法对后续模型的性能提升至关重要。本文介绍这2大类主流特征提取方法，并细分了7个具体方向，每种方法都附有代表论文以及相应代码（共42篇），方便同学们pick合适的方法，高效涨点。

论文原文+开源代码需要的同学关注“学姐带你玩AI”公号（不懂的看我主页签名），那边回复“特征

......长按二维码访问原文

Mamba再下一城！Sigma：多模态语义分割的孪生Mamba网络 2024-04-08 17:46

Sigma：第一个成功将Mamba应用于多模态语义分割的新工作，采用 Siamese 编码器并创新 Mamba 融合机制，有效地从不同模态中选择重要信息，在多个数据集上性能表现SOTA！代码已开源！

点击关注 @CVer官方知乎账号，可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

快点击进入：Mamba和Transformer技术交流平台

Sigma

Sigma: Siamese Mamba Network for Multi-Modal Semantic Segmentation

单位：CMU, 大连理工大学

代码：https://github.com/zifuwan/Sigma

论文：https://arxiv.org/abs/2404.04256

CVPR 2024 论文和开源

......长按二维码访问原文

基于单目图像的道路使用者检测、跟踪和预测的端到端框架 2024-04-08 13:18

作者：自动驾驶专栏 | 原文出处：公众号【自动驾驶专栏】

摘要

本文介绍了基于单目图像的道路使用者检测、跟踪和预测的端到端框架。感知涉及到多目标检测和跟踪以及轨迹预测，这是自动驾驶的两个主要任务。然而，它们目前大多数是单独研究的，这导致大多数轨迹预测模块都是基于真值轨迹开发的，而没有考虑到在现实世界场景中从检测和跟踪模块提取的估计是有噪声的。这些带噪声的轨迹可能对轨迹预测器的性能产生重要影响，并且可能导致严重的预测误差。在本文中，我们构建了一个用于检测、跟踪和轨迹预测的端到端框架，称为ODTP（在线检测、跟踪和预测）。它采用了最先进的在线多目标跟踪模型QD-3DT进行感知，并且直接基于检测结果来训练轨迹预测器DCENet++，而不完全依赖于真值轨迹。我们在广泛使用的自动驾驶nuScenes数据集上评估ODT

......长按二维码访问原文

太牛了！视觉模型与大语言模型结合邦加德问题研究成果：评估机器视觉现实世界少样本推理的新基准 2024-04-08 10:43

投稿：橡皮编辑：June

论文链接：https://arxiv.org/abs/2310.10207[1]

项目主页：https://joyjayng.github.io/Bongard-OpenWorld.github.io[2]

摘要：

我们推出了 Bongard-OpenWorld，这是一个用于评估机器视觉现实世界少样本推理的新基准。它起源于经典的邦加德问题（BP）：给定两组图像（正图像和负图像），模型需要通过归纳视觉概念来识别查询图像所属的集合，该视觉概念仅由正集合中的图像来描述。我们的基准继承了原始 BP 的少镜头概念归纳，同时添加了两个新颖的挑战层：1）开放世界自由形式概念，因为 Bongard-OpenWorld 中的视觉概念是来自开放词汇表的术语的独特组合，范围从对象类别到抽象的视觉属

......长按二维码访问原文

案例分享 | 某全球性医药健康品牌：采用工业视觉技术检测产品质量 2024-04-07 17:08

工业视觉检测产品质量

LINKWIN 案例分享

企业概况

该客户是一家知名的全球性医药健康公司，总部位于英国伦敦。其专注于新药物和新疫苗开发，2022年营收293.24亿英镑，产品遍及全球市场。

自动化生产面临的挑战与项目需求

➢ 自动化生产面临的挑战

在生产时，工厂通常会遇到以下产品质量问题：

尺寸不一致：尺寸可能会有轻微差异，但如差异过大，可能会导致包装不合适或无法密封。

尺寸可能会有轻微差异，但如差异过大，可能会导致包装不合适或无法密封。形状变形：产品可能会在运输或储存过程中受到挤压或变形，导致外观不佳或无法正常使用。

产品可能会在运输或储存过程中受到挤压或变形，导致外观不佳或无法正常使用。颜色不匹配：印刷颜色可能会有偏差，导致产品颜色与预期不符。

印刷颜色可能会有偏

......长按二维码访问原文

Ei & Scopus双检索 | 第八届视觉、图像与信号处理国际会议(ICVISP 2024) 2024-04-08 11:59

会议简介 Brief Introduction

2024年第八届视觉、图像与信号处理国际会议(ICVISP 2024)

会议时间：2024年12月27日-29日

召开地点：中国·西双版纳

大会官网：https://www.icvisp.org/

由云南师范大学主办，中山大学、深圳大学计算机与软件学院和大数据系统计算技术国家工程实验室协办， CoreShare科享学术交流中心协办的2024年第八届视觉、图像与信号处理国际会议（ICVISP 2024）将于2024年12月27日至29日在中国西双版纳召开。会议将围绕“视觉、图像与信号处理”的最新研究领域而展开，为研究人员、工程师、专家学者以及行业专业人士提供一个交流与探讨最新研究成果的平台，并为与会者们交流新的思想和应用经验建立业务或研究关系。在会议期间您

......长按二维码访问原文

机器视觉培训班哪家强？ 2024-04-08 12:35

机器视觉课程我个人理解是界面设计，图像处理，相机sdk 二次开发，机器人sdk二次开发，3维点云处理，深度学习，拖拽框架的搭建。

编程语言有 c# c++ qt ，图像处理库 halcon opencv 。

我个人感觉机器视觉，首先是要和设备实战的，比较机器人，六轴的，相机，（包含2d 3d 双目线激光，线扫），所以尽量选择有线下培训班那种。前期可以网络班掌握下语言编写的语法，结构体数据结构，类，封装，线程数据库通信这些基础的。

后期结合相机，机器人，流水线，完成一些视觉的测量检测，三维抓取焊缝轨迹引导，拖拽框架，深度学习检测，这些。

你查看下智联招聘 boss直聘也可以了解到企业的人才需求等情况。

个人推荐常州龙熙机器视觉培训

......长按二维码访问原文

解读EG3D：Efficient Geometry-aware 3D Generative Adversarial Networks 2024-04-09 09:56

此文记录个人学习过程，如有错误欢迎私信交流，十分感谢！

EG3D是一篇nVidia参与的基于单视角的2D图片，生成3D形状的工作，其生成的结果兼具几何和视角上的一致性。EG3D整个工作其实由许多部分和细节组成，文中由于篇幅，以及“科技论文”写作时的要求，对于大量的细节基本就是一带而过，这就导致理解这篇时会非常困难。为了透彻的理解这篇工作，首先需要了解NeRF，GAN，然后进一步要了解StyleGAN系列。因为以及其中用到的一些技术严格来讲横跨StyleGAN，StyleGAN2，StyleGAN3。

除了纸面的“contributions”，EG3D的代码库也已经很有学习价值了，其代码给出了一个非常先进的深度学习项目管线。后面许多的工作都沿用了他们代码的pipeline，例如Next3D，pan

......长按二维码访问原文

用大模型解决视觉任务：《VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks》 2024-04-09 18:28

NIPS2023文章《VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks》简要技术介绍

本文写于2024年4月9日。

本文是关于NIPS最新论文VisionLLM的简要介绍。VisionLLM是一个多模态的大语言模型框架，可以借助大语言模型的力量，实现自定义的传统视觉任务，例如检测、分割、图像标题等。框架最大的特点就是灵活性和适应性，通过语言指令让模型做不限定的视觉任务。本文按照论文顺序和主要内容做介绍。

1. 基础信息

1. 资源

论文题目：VisionLLM: Large Language Model is also an Open-Ended Decoder for Visi

......长按二维码访问原文

多视觉传感器协同弱小目标检测 2024-04-09 09:02

源自：指挥与控制学院

作者：王田，程嘉翔，刘克新，王薇，吕金虎

“人工智能技术与咨询” 发布

摘要

多视觉传感器协同对空实现全区域覆盖的弱小目标检测，在近距离防空领域中具有重要意义。现有的全区域覆盖方法存在覆盖率低、随机性差等问题，弱小目标检测算法存在模型大、定位及分类准确性低等问题。提出了一种高效的对空全区域覆盖算法和轻量级弱小目标检测算法，通过结合最大面积优先法和最小曼哈顿离法改善存在覆盖死角和随机性差等问题。提出密集通道扩展网络（dense and channel expand network，DCENet）模型，基于轻量级稠密拼接和自适应尺寸通道扩展方法，在弱小目标数据集上获得了比原算法更有竞争力的平均精度结果。

关键词

协同目标检测, 全区域覆盖, 弱小目标检测, 轻量级稠密拼接

......长按二维码访问原文

零基础入门—单目深度估计(Depth Estimation) 2024-04-09 16:29

Background

耳闻过的深度估计模型：DINOv2，Depth Anything

DINOv2 demo：较为准确的描述了图像中的远近关系

深度估计定义：为彩色图像的每个像素估计一个深度值。

Question

我之前接触过图像分割和深度相机，带着以下疑问去一探究竟。

深度估计任务类似于语义分割吗？模型训练的label就是对应的深度图吗？网络预测值是什么？深度传感器获取的深度图中像素值缺失时如何处理？

Run Code

阅读Depth Anything论文，论文里着重强调了里程碑工作MiDAS。

根据MiDAS开源代码(Github star 4K)，很容易的就跑通了示例图片，除了深度可视化图片外，还包括一个pfm文件。但是zero-shot的效果并没有特别惊艳，物体的边缘细节处理的不

......长按二维码访问原文

机器视觉+AI，质量管控呈三大趋势 2024-04-09 16:36

【备注】本文节选自《独家解构海康威视「2B数字化+大模型」四重奏｜深度研报（中篇）》，出品方为源泉投研智库

在制造业中，产品质量是企业的生命线。从质量检测到不合格品的判定，再到质量数据的追溯，这在大部分行业都属于通用型需求。

据徐习明介绍，海康通过「云眸企业」构建了完整的质量管理闭环。结合视觉AI、X光、超声、热成像等技术及相关产品，云眸的质检管理工具，针对“来料、工序、成品、出库”四大检验场景，实现了质检数字化。

客户可通过工业听诊、XRay等设备自动完成质检，若发现不良品，将自动记录并进行缺陷分析，记录良品率等数据，以便后续快速进行质量数据追溯。

其次，在烟草行业，过去主要靠人的经验来判断烟草干丝、烟叶的质量成色各方面的指标，很难标准化。现在，技术能否判断什么样的烟叶是好的烟叶，或做烟草的杂质检测？

......长按二维码访问原文

机器视觉软件应该如何选购？ 2024-04-08 20:07

在选购机器视觉软件时，以下是一些建议：

明确应用需求：首先，您需要明确机器视觉系统在您的生产线或应用中需要完成的具体任务。这包括需要处理的图像类型、目标识别、物体定位、质量检测等。评估软件功能：了解机器视觉软件的功能和性能，包括图像处理算法、目标识别能力、测量精度等。确保软件能够满足您的应用需求。考虑易用性和集成性：选择易于使用和集成的软件，以减少培训和开发时间。同时，确保软件能够与您的现有系统和设备兼容，并能够方便地与其他软件或控件接口。评估技术支持和培训：选择能够提供及时有效技术支持和培训的供应商，以确保在使用过程中遇到问题能够得到及时解决。考虑成本和预算：根据您的预算，选择性价比高的机器视觉软件。在评估成本时，除了考虑软件的许可费用，还要考虑维护、升级和培训等长期成本。参考成功案例和用户评价：

......长按二维码访问原文

【YOLO改进】主干插入注意力机制模块CBAM（基于MMYOLO） 2024-04-09 09:35

MMYOLO插入CBAM

由于CBAM是MMYOLO自带的注意力机制模块，所以在插入CBAM的时候直接修改对应的配置文件即可，以 configs/yolov5/yolov5_s-v61_syncbn_8xb16-300e_coco.py为例子，将model里面的backbone修改即可：

model = dict ( backbone = dict ( frozen_stages = 4 , ## 在原有设置的基础上，加上插件的设置 plugins = [ dict ( cfg = dict ( type = 'CBAM' ), stages = ( False , True , True , True )) ], ), bbox_head = dict ( head_module = dict ( num

......长按二维码访问原文

Visual AutoRegressive modeling (VAR) 视觉自回归建模：通过下一尺度预测生成图像的新模型 2024-04-09 14:01

由北京大学和字节跳动联合研究团队近日发布其最新图像生成模型研究成果，论文标题为 "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction" (视觉自回归建模：通过预测下一尺度来生成可扩展图像)，并同步上线项目介绍及演示网站。

项目网站： https://var.vision/

Visual Autoregressive Modeling (VAR) 是一种全新的视觉生成模式，它创造性地调整了图像上的自回归学习 (AR) 预测模式，即从分区标记改为全局下一尺度 (next-scale)，这种简单直观的方法使得自回归变换器能够快速学习图像的视觉分布并良好泛化。通过实验比较，这种类 GPT 风格的图像生

......长按二维码访问原文

计算机视觉------canny算法实现原理 2024-04-08 22:15

看了那么多本书，悟不出一个完整的人生，道不出世间的千姿百态。

......长按二维码访问原文

[分享][每日更新][2024.04.06][CV_arxiv_papers] 2024-04-09 13:43

Publish Date Title Title_CN Authors PDF Code

2024-04-06 InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization InitNO：通过初始噪声优化增强文本到图像的扩散模型 Xiefan Guo, Jinlin Liu, Miaomiao Cui, Jiankai Li, Hongyu Yang, Di Huang http:// arxiv.org/pdf/2404.0465 0v1 null

2024-04-06 Constrained 6-DoF Grasp Generation on Complex Shapes for Improved Dual-

......长按二维码访问原文

一对图像也能标，同济开源最新双目在线标定（ICRA'24） 2024-04-09 08:53

双目标定的“难处”

双目相机外参标定通常以离线方式进行，使用众所周知的棋盘格靶标。其微小误差可能会导致不小的视差误差，这可能会带来严重后果，例如自动驾驶和移动机器人导航，错误计算与附近障碍物的距离可能导致碰撞。

现有的大部分研究将双目在线标定视为视觉里程计的一种特殊形式，在这种形式中，通过对本质矩阵 E = [t]_×R 进行分解获得每个立体图像对的 R 和 t。随后，使用后端优化技术，例如光束法平差（BA）和卡尔曼滤波（KF），推导出 R^∗ 和 t^∗

与直接估计 R 和 t 不同，也有方法提出使用两个独立的旋转矩阵 R_l 和 R_r 分别旋转左右摄像机坐标系。

上述研究主要：

在单对情况下估计 R 和 t

和使用三个欧拉角和三个平移向量分量来量化性能是不实用的

StereoCalibra

......长按二维码访问原文

一文讲清计算机视觉 2024-04-09 17:15

计算机视觉是人工智能（AI）的核心领域之一，专注于创建解决方案，使人工智能应用程序能够“看到”世界并理解它。

当然，计算机没有像我们那样工作的生物眼睛，但它们能够处理图像；无论是从实时相机馈送还是从数字照片或视频中。这种处理图像的能力是创建可以模拟人类视觉感知的软件的关键。

在我们探索图像处理和其他计算机视觉功能之前，考虑图像在计算机程序数据中的实际内容是有用的。

图像作为像素数组

对于计算机来说，图像是数字像素值的数组。例如，考虑以下数组：

拷贝

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 255 255 255 0 0 0 0 255 255 255 0 0 0 0 255 255 255 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

该数组由七行七列组成

......长按二维码访问原文

[分享][每日更新][2024.04.07][CV_arxiv_papers] 2024-04-09 13:44

2024-04-07

GvT: A Graph-based Vision Transformer with Talking-Heads Utilizing Sparsity, Trained from Scratch on Small Datasets

GvT：一种基于图的视觉转换器，具有利用稀疏性的说话头，在小数据集上从头开始训练

Dongjing Shan, guiqiang chen

null

......长按二维码访问原文

身处相机内外参之间 2024-04-09 09:57

此文记录个人学习过程，如有错误欢迎私信交流，十分感谢！

“相机系统是一个非常令我头疼的事情，我真的很不擅长这个。”

这篇blog是为了“解析”我遇到的一些仓库中的关于相机系统的代码，这么说可能会很奇怪，因为对于比较专业的人来说，这些根本不能算是问题；但由于我是一个只知道PyTorch的文盲，所以这对我来说，是问题，而且很大。

哪怕在这里语境下的“相机”只是最最简单的理想模型，但即使这样，想修改与其相关的代码对没有受过相关训练的人来说还是有些困难的。尤其当需要对相机系统做一些更“定制化”的操作时候，浅显且不够直接的理解就不太能支持继续推进下去了。

我曾将我的窘况诉说给一位学长，他听完非常震惊“不是吧这都不会”（此处自动脑补“虾头座椅电脑”表情包）。他建议我去回炉重造，去看GAMES101或者洋

......长按二维码访问原文

手撕DETR 2024-04-08 19:58

DETR是目标检测领域的一个里程碑式的模型。它通过transformer把复杂的目标检测任务建模为集合预测任务，整体结构很简单，不需要anchor相关的设计以及nms操作，是一个端到端的目标检测模型。后续很多工作都基于DETR进行改进或者受到了它的启发。

DETR模型结构

写出DETR的模型结构和推理代码。

......长按二维码访问原文

Try Google's New State of Art Open Model: Gemma on Paperspace Gradient： 2024-04-09T03:18:04.000Z

In the past few months, Google has introduced its Gemini models—large and mid-sized models meant for complex tasks. Gemma is part of the Gemini AI family, aimed at making AI development accessible and safe. This newly launched Gemma, however, is a lightweight, smaller model aimed at helping developers worldwide build AI responsibly, in compliance with Goog

......长按二维码访问原文

视觉招聘小黑板

行业资讯

机器视觉需求20240409

OTA：目标检测的最优运输分配

相关推荐