文章目录[隐藏]
- 行业资讯
- 研华携手承业生医以医规级方案加速复合手术室发展--机器视觉网 2023-12-08 13:59:25
- 凌云光采用知识图谱与大模型等AI技术,新手秒变维修大师--机器视觉网 2023-12-08 11:56:37
- 小机身大能耐,海康机器人MV-DB300S相机为智能测量而生!--机器视觉网 2023-12-08 11:42:30
- 思特威归纳总结智能化图像处理的实际需求,开拓面阵、智能交通系统(ITS)、线阵三大产品系列--机器视觉网 2023-12-08 11:17:12
- 超恩推出搭载Arm-based平台MTA-1010W工业用多点控触电脑--机器视觉网 2023-12-08 11:05:59
- Gocator® 3D视觉解决半导体金线成像难点--机器视觉网 2023-12-08 14:46:30
- Basler自动对焦解决方案助力高效生产,以简御繁,精准高效--机器视觉网 2023-12-08 14:38:33
- 成像和质量检验的交集--机器视觉网 2023-12-08 14:28:57
- 面向工业制造场景的大模型,从“通用”到“应用”--机器视觉网 2023-12-08 14:17:09
- 液态远心镜头原理及应用--机器视觉网 2023-12-08 13:06:28
- Uhnder举办车载雷达数字化转型论坛,携手合作伙伴引领新趋势―新闻频道- 视觉系统设计 2023/12/8 10:49:20
- 苏州感测通发布四组大尺寸MEMS微镜模组,并称已量产交付客户―新闻频道- 视觉系统设计 2023/12/7 23:43:33
- 海康机器人MV-DB300S相机为智能测量而生―产品聚焦频道- 视觉系统设计 2023/12/7 23:40:45
- 超恩推出搭载Arm-based平台MTA-1010W工业用多点控触电脑―产品聚焦频道- 视觉系统设计 2023/12/7 23:36:53
- 多目标跟踪最新综述!(多种方法/数据集/评测) 2023-12-08 08:16
- 复旦最新提出!革命性的LiDAR SLAM统一架构 2023-12-08 09:38
- WarpDiffusion: 高保真虚拟试穿的高效扩散模型 2023-12-07 16:18
- 自动驾驶中视觉感知的corner case盘点及解决方案 2023-12-08 19:02
- 【论文解读】EfficientSAM:提高sam推理效率,MetaAI sam最新研究 2023-12-07 09:54
- 人工智能 | 机器视觉:揭秘计算机如何解读图像的奥秘 2023-12-07 14:52
- 何恺明新作:简单框架达成无条件图像生成新SOTA!与MIT合作完成 2023-12-08 13:30
- Google's Gemini Multimodal Model: What We Know: 2023-12-07T15:50:30.000Z
行业资讯
研华携手承业生医以医规级方案加速复合手术室发展--机器视觉网 2023-12-08 13:59:25
2023-12-08 13:59:25 来源: 中国机器视觉网
“研华产品通过医规认证且功能成熟完整,可根据医疗临床使用需求而设计,因此成为久和医疗推动复合手术室的最佳伙伴。”承业生医COO李明伦。为了追求精准医疗,近年来全球医疗业者纷纷对手术室进行改造工程,将传统手术室打造成结合影像检查与外科手术设备的复合手术室(Hybrid Operating Room;HOR),让外科医师在开刀时,可以运用高质量影像确定病灶位置,进行更精确的手术切除或介入治疗。
医规认证与弹性化系统整合让研华脱颖而出
成立超过22年的久和医疗,是承业生医企业集团的子公司,主要代理欧美大厂的外科医疗设备,如:Cyberdyne外骨骼机器人、Hillrom复合式手术室解决方案、Leica手术显微镜等。
在服务医疗业者的过程中,久和医
......长按二维码访问原文
凌云光采用知识图谱与大模型等AI技术,新手秒变维修大师--机器视觉网 2023-12-08 11:56:37
2023-12-08 11:56:37 来源: 中国机器视觉网
主板维修是一个需要技艺传承和经验积累的领域。最近,凌云光采用知识图谱与大模型等AI技术,成功将老师傅的宝贵经验沉淀下来,让入职三个月的员工也能拥有等同于五年经验的维修能力。
海量数据 经验断层
主板作为电子产品的“心脏”,其可靠性和稳定性直接关系到设备性能和寿命。在制造过程中,常常会有失效或不良主板,需要经验丰富的FA(故障分析)工程师进行失效分析和维修。然而,个体差异和主观性导致维修结果不准确,维修效果不稳定。
检修一块存在未知问题的主板是一项相当复杂的任务,新入门者只能依赖ESOP(标准操作规程)逐步解析,可能需要花上千个步骤。而经验丰富的老师傅可以凭经验和技巧迅速而准确地找到解决方法。
“就跟解魔方一样,初学者需要逐步解法解开,
......长按二维码访问原文
小机身大能耐,海康机器人MV-DB300S相机为智能测量而生!--机器视觉网 2023-12-08 11:42:30
小机身大能耐,海康机器人MV-DB300S相机为智能测量而生!
2023-12-08 11:42:30 来源: 中国机器视觉网
海康机器人全新推出RGB-D 智能立体相机MV-DB300S,该机型采用主动双目立体成像技术,结合彩色摄像头输出高帧率 RGB-D图像,内置深度学习算法,适用于体积测量、机器人抓取等应用。
高帧率高精度数据输出
高性能 Sensor 搭配高能效激光模块,稳定、高效输出毫米级精度深度图,扫描帧率最高可达17fps,可快速精准的对物体进行测量。
小巧身材,大能耐
该相机尺寸仅有98.5mm*55.5mm*33mm,且标配自带安装板,紧凑的机身设计,在实际应用中的安装操作更加灵活方便。
边缘智能
相机内置深度学习算法,无需后端PC处理,在体积测量的同时可以输出被测物体的类别,
......长按二维码访问原文
思特威归纳总结智能化图像处理的实际需求,开拓面阵、智能交通系统(ITS)、线阵三大产品系列--机器视觉网 2023-12-08 11:17:12
2023-12-08 11:17:12 来源: 中国机器视觉网
工业机器视觉一直是生产和制造领域的得力助手,犹如生产线上的"明眸",为质量控制、自动化生产、产品识别和监测等任务提供了无可比拟的精准性和效率。然而,随着科技的飞速发展和应用领域的不断拓展,对图像传感器的需求愈发迫切。据Yole最新预测,未来四年内,工业CIS市场将保持高速增长,到2027年市场规模将达到13.02亿美元。
机器视觉技术正成为现代工业中的核心驱动力。作为创新领域的先行者之一,思特威在全球范围内拥有显著的技术影响力和市场地位。通过其技术领先的全局快门SmartGS®技术在无人机、QRC读取器、智能移动家居设备等有广泛应用。据TSR最新数据,2022全年思特威在无人机、QRC读取器两大领域市场份额均居全球首位。其中,思特威占全球消费类
......长按二维码访问原文
超恩推出搭载Arm-based平台MTA-1010W工业用多点控触电脑--机器视觉网 2023-12-08 11:05:59
2023-12-08 11:05:59 来源: 中国机器视觉网
超恩近日推出Arm-based平台高效能多点触控嵌入式电脑,并可开始接受订单出货。超恩MTA-1010W采用NXP i.MX 8M Plus处理器,无风扇设计可支持-20°C至60°C作业温度,9V至55V宽范围直流输入,工控级产品设计,配置最新OS操作系统,协助您建构智慧大楼、工厂自动化、自助式KIOSK各种边缘端AI等嵌入式应用的理想解决方案。
适用AIoT相关应用
超恩MTA-1010W搭载4核Arm Cortex-A53处理器,整合神经网路处理器(Neural Processing Unit,NPU) 提供2.3 TOPS AI运算力并支持Cortex-M1,展现低功耗与即时程序处理效能。针对工业机器视觉相关应用MTA-1010W支持
......长按二维码访问原文
Gocator® 3D视觉解决半导体金线成像难点--机器视觉网 2023-12-08 14:46:30
2023-12-08 14:46:30 来源: 中国机器视觉网
作为半导体制造的后工序,封装工艺包含背面研磨、划片、芯片键合、引线键合、成型等步骤。所以,每一个步骤对产品性能都有很大的影响。键合中的金线经常出现短路、断裂、塌陷等问题。此外, 由于金线较细,存在高反光、角度偏差,导致普通光学传感器难以进行成像。
LMI Gocator® 提供解决方案
LMI Gocator® 5500系列3D线共焦传感器拥有受专利保护的线共焦成像技术,可实现高速且宽覆盖线扫,同时生成3D形貌、3D多层扫描和2D强度数据,高精度测量引线高度和位置度,同时判断有无断线和弯曲等缺陷。LMI为制造商提供了一种非接触式、高性能并且可扩展的解决方案,可用于半导体材料、元器件和装配过程中的精准3D测量和检测。
Gocator® 550
......长按二维码访问原文
Basler自动对焦解决方案助力高效生产,以简御繁,精准高效--机器视觉网 2023-12-08 14:38:33
2023-12-08 14:38:33 来源: 中国机器视觉网
自动对焦(AF)是消费类相机的常见功能,但在专业成像应用中,它往往是非标准的功能,需要额外的设置程序。在机器视觉应用中,最终用户经常会将工业相机安装在固定位置。在多数情况下,如果目标在特定的景深(DoF)范围内,固定焦距镜头就能满足图像采集的要求。然而,当镜头与目标物体的工作距离不断变化,并且超出DoF时,传统的定焦机器视觉就达到了极限。这时需要自动聚焦的视觉解决方案。
自动对焦解决方案常适用于:物流领域的二维码扫描和包裹分拣,用于质量控制的检测显微镜,以及眼科检查等。
例如,行业一流的零售商需要全自动运作的包装分拣系统,以确保快速完成操作流程;电子组件供应商需要高效的显微镜检测系统来检查多个元件阵列——系统无法每次都花相对较长时间来重新聚焦
......长按二维码访问原文
成像和质量检验的交集--机器视觉网 2023-12-08 14:28:57
2023-12-08 14:28:57 来源: 中国机器视觉网
工业二维(2D)和三维(3D)成像解决方案证明了它们在测试、错误检测和检验方面的可靠性。Teledyne DALSA凭借z-trak2型号系列,为高速在线3D检测提供了经济适用的解决方案。艰难的生产条件不仅需要应用广泛的先进的产品,还需要可靠的支持和制造商提供协助解决客户需求。成功的合作关系可以证明行业能力。
电子组件测试
近年来,总部位于德国普赫海姆的Phil-Vision在包括电子行业在内的广泛行业获得了丰富的经验。电子组件生产其中涉及的一部分是所谓的热处理过程,例如,热化学蒸汽在空白晶圆片上沉积。工艺质量必须经过反复检查。由于生产条件艰难,只有即使在温度范围提升的情况下输出结果依然准确的工业相机适用于此。经过多年发展,Phil-Visi
......长按二维码访问原文
面向工业制造场景的大模型,从“通用”到“应用”--机器视觉网 2023-12-08 14:17:09
2023-12-08 14:17:09 来源: 中国机器视觉网
相较于其他领域,智能制造拥有巨大潜力,有望开启新一轮生产力加速周期。当前,智能制造技术主要应用在一些大批量生产的产品中,这方面的市场已经趋于饱和。而中小批量产品的生产智能化水平并不高,但其市场需求和增长空间远大于大批量产品生产,这将逐步成为智能制造应用的主战场。
阻碍当前智能制造发展的主要困难有:一是市场需求比较碎片化,且没有统一标准。哪怕是同质化需求,其执行标准也往往是不一样的,导致工业数据的可复用性不高,而从零开始进行算法定制化的代价有可能大于智能化改造的收益,使得企业无法从中获利。二是当前的智能化指标不够,无法满足工业生产需求,导致项目实施上需要进行复杂的人机协作培训,甚至可能无法解决当前工业生产的主要瓶颈问题,只能“锦上添花”,无法“雪
......长按二维码访问原文
液态远心镜头原理及应用--机器视觉网 2023-12-08 13:06:28
2023-12-08 13:06:28 来源: 中国机器视觉网
远心镜头主要是为纠正传统工业镜头视差而设计,它可以在一定的物距范围内,使得到的图像放大倍率不会变化,这对被测物不在同一物面上的情况是非常重要的应用。远心镜头由于其特有的平行光路设计一直为对镜头畸变要求很高的机器视觉应用场合所青睐。具有极高分辨率、极佳远心度、超低畸变等优势,但仍具有景深限制。
灵猴机器人自主研发的液态远心镜头,主要为解决传统工业镜头对于高精度和大景深在设计层面上无法同时满足的问题,其主要功能是可以测量不同高度物体(或同一物体不同高度层面)上的细节,使检测更加精准快速,同时克服机械变焦镜头易磨损,制造难度大,响应时间长等缺点。
灵猴液态远心镜头的变焦只需控制器通过调节电流来控制液体透镜的屈光度,从而改变液态远心镜头的焦距,最终实
......长按二维码访问原文
Uhnder举办车载雷达数字化转型论坛,携手合作伙伴引领新趋势―新闻频道- 视觉系统设计 2023/12/8 10:49:20
2023年12月8日,中国上海——数字成像雷达芯片技术头部企业Uhnder于12月6日在上海举行了以“数字化,新潮流”为主题的技术论坛,与业界重量级合作伙伴深入探讨车载雷达数字化转型趋势,并展望未来汽车安全及自动驾驶的发展。来自奥迪汽车股份公司、麦格纳电子、北汽研究院、楚航科技、复睿智行等汽车行业领军代表出席了此次论坛并发表重要演讲。此外,来自当地政府的领导、院校教授以及上汽集团、蔚来汽车、小米汽车、森斯泰克、华域汽车电子、保隆汽车、福瑞泰克、黑芝麻智能、dSPACE、RFbeam等整车厂和系统集成厂商、合作伙伴、投资人、学者和行业专家也出席了本次活动。
Uhnder 团队
在本次论坛上,来自国内外的专家学者和企业代表围绕车载雷达的应用经验、市场前景及技术前瞻等多个方面的细分话题进行了经验分享和思想碰撞。此
......长按二维码访问原文
苏州感测通发布四组大尺寸MEMS微镜模组,并称已量产交付客户―新闻频道- 视觉系统设计 2023/12/7 23:43:33
据麦姆斯咨询报道,近日,苏州感测通信息科技有限公司(以下简称“感测通”)继8月宣布自主研发二维MEMS微镜模组产品后,再次发布可量产的三款不同镜面尺寸的MEMS微镜模组产品,即5 x 7mm、10 x 10mm二维MEMS微镜模组和20 x 12mm一维MEMS微镜模组。
感测通表示其研发的MEMS微镜模组系列产品均已通过车规级可靠性测试,达AEC-Q100标准,具备功耗低、寿命长的特点,在-40℃~105℃的温度范围表现始终如一。感测通MEMS微镜模组通过不同的镜面尺寸与稳定的扫描光学角可适用于各种场景,可被激光雷达厂商、工业机器人等需求3D扫描的行业和从事相关技术产品研发的研究机构和大专院校等采用。
感测通表示此前量产的8 x 8mm MEMS微镜模组已量产交付于激光雷达厂商,并已运用于智能机器人等终端
......长按二维码访问原文
海康机器人MV-DB300S相机为智能测量而生―产品聚焦频道- 视觉系统设计 2023/12/7 23:40:45
海康机器人全新推出RGB-D 智能立体相机MV-DB300S,该机型采用主动双目立体成像技术,结合彩色摄像头输出高帧率 RGB-D图像,内置深度学习算法,适用于体积测量、机器人抓取等应用。
01 高帧率高精度数据输出
高性能 Sensor 搭配高能效激光模块,稳定、高效输出毫米级精度深度图,扫描帧率最高可达17fps,可快速精准的对物体进行测量。
02 小巧身材,大能耐
该相机尺寸仅有98.5mm*55.5mm*33mm,且标配自带安装板,紧凑的机身设计,在实际应用中的安装操作更加灵活方便。
03 边缘智能
相机内置深度学习算法,无需后端PC处理,在体积测量的同时可以输出被测物体的类别,辅助客户拓展其他业务,实现更高效、更智能化的生产和操作。
04 链路稳定,流畅传输
采用千兆网络传输接口,抗干
......长按二维码访问原文
超恩推出搭载Arm-based平台MTA-1010W工业用多点控触电脑―产品聚焦频道- 视觉系统设计 2023/12/7 23:36:53
超恩股份有限公司 (Vecow,以下简称超恩)近日隆重推出Arm-based平台高效能多点触控嵌入式电脑,并可开始接受订单出货。超恩MTA-1010W采用NXP i.MX 8M Plus处理器,无风扇设计可支持-20°C至60°C作业温度,9V至55V宽范围直流输入,工控级产品设计,配置最新OS操作系统,协助您建构智慧大楼、工厂自动化、自助式KIOSK各种边缘端AI等嵌入式应用的理想解决方案。
适用AIoT相关应用
超恩MTA-1010W搭载4核Arm Cortex-A53处理器,整合神经网路处理器(Neural Processing Unit,NPU) 提供2.3 TOPS AI运算力并支持Cortex-M1,展现低功耗与即时程序处理效能。针对工业机器视觉相关应用MTA-1010W支持3840 x 216
......长按二维码访问原文
多目标跟踪最新综述!(多种方法/数据集/评测) 2023-12-08 08:16
论文链接:https://arxiv.org/pdf/2209.04796.pdf
摘要
随着自动驾驶技术的发展,多目标跟踪已成为计算机视觉领域研究的热点问题之一。MOT 是一项关键的视觉任务,可以解决不同的问题,例如拥挤场景中的遮挡、相似外观、小目标检测困难、ID切换等。为了应对这些挑战,研究人员尝试利用transformer的注意力机制、利用图卷积神经网络获得轨迹的相关性、不同帧中目标与siamese网络的外观相似性,还尝试了基于简单 IOU 匹配的 CNN 网络、运动预测的 LSTM。为了把这些分散的技术综合起来,作者研究了过去三年中的一百多篇论文,试图提取出近年来研究者们更加关注的解决 MOT 问题的技术。作者罗列了大量的应用以及可能的方向,还有MOT如何与现实生活联系起来。作者的综述试图展示研究人
......长按二维码访问原文
复旦最新提出!革命性的LiDAR SLAM统一架构 2023-12-08 09:38
1、导读
SLAM是机器人和自动驾驶领域中的一个基本问题,旨在在探索环境的同时重建地图并估计机器人在其中的位置。激光雷达的点云数据被广泛应用于捕捉环境的复杂三维结构。然而,现有的SLAM方法要么依赖于密集的点云数据以实现高精度定位,要么使用通用的描述符来减小地图的大小。这两个方面似乎存在冲突。因此,我们提出了一种统一的架构,DeepPointMap(DPM),在这两个方面都具有出色的优势。
原文链接:
2、研究内容
我们提出了一种名为DeepPointMap的深度学习框架,用于解决LiDAR SLAM中的定位和地图构建问题。传统的LiDAR SLAM方法要么依赖于密集的点云数据以实现高精度定位,要么使用通用的描述符来减小地图的大小。然而,这两个方面似乎存在冲突。为了解决这个问题,本研究提出了一种统一的架
......长按二维码访问原文
WarpDiffusion: 高保真虚拟试穿的高效扩散模型 2023-12-07 16:18
WarpDiffusion: Efficient Diffusion Model for High-Fidelity Virtual Try-on
地址: https://arxiv.org/pdf/2312.03667.pdf
标题:WarpDiffusion: 高保真虚拟试穿的高效扩散模型
摘要:基于图像的虚拟试穿(VITON)旨在将商店中的服装图像转移到目标人物身上。尽管现有方法侧重于调整服装以适应身体姿势,但它们经常忽视服装与皮肤边界周围的合成质量以及调整后的服装上的皱纹和阴影等逼真效果。这些限制极大地降低了生成结果的逼真度,并阻碍了VITON技术的实际应用。借鉴扩散模型在跨模态图像合成方面的显著成功,一些最近的扩散模型方法尝试解决这个问题。然而,它们往往要消耗大量的训练资源,或者难以实现逼真的试
......长按二维码访问原文
自动驾驶中视觉感知的corner case盘点及解决方案 2023-12-08 19:02
问题定义
Corner cases(CC)是指不经常出现或一些极端的场景数据,也是一种长尾问题的表现形式。然而,对于感知模型来说,CC非常重要,因为在自动驾驶系统的推理过程中,它需要训练、验证和提高感知模型的泛化性能。例如,一辆配备了最先进的目标检测器的车辆在高速公路上疾驰,可能无法及时发现失控的轮胎或翻倒的卡车(如下图)。这些自动驾驶目标检测失败的案例可能会导致严重的后果,危及生命。
认定是否为corner-case,也可以使用下面的约束:
危险性:当目标挡住或即将挡住自动驾驶汽车的潜在行进路径,这些目标非常容易被车撞到。不在道路上的静态物体,例如树木和建筑物,不被认为会阻挡车辆。
新奇性:该目标不属于任何自动驾驶基准数据集的类别,或者它是其中类别的新的实例。这样的目标很容易漏检。
当同时满足这
......长按二维码访问原文
【论文解读】EfficientSAM:提高sam推理效率,MetaAI sam最新研究 2023-12-07 09:54
1.背景
sam分割一切模型在视觉上效果虽然很好,但由于比较耗费计算资源,限制了sam的应用场景。也有类似的加速方案,比如mobilesam和fastsam,meta ai提出参数更少,精度更高的EfficientSAM,减少推理时间接近20倍。从对比图看出,在coco数据集上对比,EfficientSAM平均精度接近SAM,EfficientSAM-Tiny的推理时间和MobileSAM接近。
prompt分割结果对比
2.技术路线
模型设计上,EfficientSAM设计思路比较简单,类似mobilesam,也采用了模型蒸馏的思路。sam中最重的模块就是encoder模块的vit,mobilesam是直接蒸馏vit模块,而EfficientSAM采用自监督MAE(何恺明大神提出)的方法,对图像mas
......长按二维码访问原文
人工智能 | 机器视觉:揭秘计算机如何解读图像的奥秘 2023-12-07 14:52
引言: 机器视觉是人工智能领域中的一项核心技术,旨在使计算机能够模拟和理解人类视觉系统的工作方式。通过机器视觉,计算机能够对图像进行分析、理解和识别,为自动驾驶、图像检测、医学影像等领域提供强大支持。本文将深入研究机器视觉的工作机制,揭示计算机如何解读图像的奥秘。
一、图像获取与预处理
图像采集: 机器视觉的第一步是通过传感器或摄像头获取图像数据。这些图像可以来自各种设备,包括摄像头、雷达、激光雷达等。 图像预处理: 图像预处理是为了提高图像质量,使其更适合计算机进行处理。这包括去噪、图像增强、尺寸标准化等操作,以确保图像数据的一致性和可用性。
二、特征提取与表示
特征提取: 在机器视觉中,特征是图像中具有代表性信息的部分。特征提取涉及到从原始图像中提取出关键信息,如边缘、角点、纹理等。 特征表示: 提
......长按二维码访问原文
何恺明新作:简单框架达成无条件图像生成新SOTA!与MIT合作完成 2023-12-08 13:30
丰色 发自 凹非寺
量子位 | 公众号 QbitAI
大佬何恺明还未正式入职MIT,但和MIT的第一篇合作研究已经出来了:
他和MIT师生一起开发了一个自条件图像生成框架,名叫RCG(代码已开源)。
这个框架结构非常简单但效果拔群,直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。
它生成的图像不需要任何人类注释(也就是提示词、类标签什么的),就能做到既保真又具有多样性。
这样的它不仅显著提高了无条件图像生成的水平,还能跟当前最好的条件生成方法一较高下。
用何恺明团队自己的话来说:
有条件和无条件生成任务之间长期存在的性能差距,终于在这一刻被弥补了。
那么,它究竟是如何做到的呢?
类似自监督学习的自条件生成
首先,所谓无条件生成,就是模型
......长按二维码访问原文
Google's Gemini Multimodal Model: What We Know: 2023-12-07T15:50:30.000Z
On December 6th, 2023, Google announced Gemini , a new Large Multimodal Model (LMM) . Referred to by Google as their “largest and most capable AI model”, Gemini is able to interact with and answer questions about data presented in text, images, video, and audio.
Gemini can be used directly through the Google Bard interface or through an API. Support has bee
......长按二维码访问原文