机器视觉资讯20240515

文章目录[隐藏]


视觉招聘小黑板

欲了解详情,请在公众号后台回复:240515



行业资讯

跨维智能完成战略轮融资,联想创投领投,通用具身智能技术公司--机器视觉网 2024-05-15 11:14:27

2024-05-15 11:14:27 来源: 中国机器视觉网

近日,高通用性具身智能技术研发公司「跨维智能」完成由联想创投领投的战略轮融资,融资资金将主要用于产品研发、团队扩充和市场拓展等方面。

跨维智能成立于2021年6月,是一家以Sim2Real为核心,研发高通用性具身智能技术的国家高新技术企业。跨维智能凭借在3D生成式AI、多模态大模型及三维成像方面的长期技术积累,基于Sim2Real打造软硬一体产品矩阵,且已在多场景中实现商业化落地,是具身智能规模化商业落地的引领者。

通用具身智能的发展与落地路径

联想集团高级副总裁、联想创投集团总裁贺志强介绍:具身智能作为AI与物理世界交互的载体,具有高度通用性和泛化性的核心特点。传统机器人为单一或固定任务设计,泛化性较差,难以完成复杂或未知任务,并且需

......长按二维码访问原文

博视像元NIR BC-GN25M12X4相机,近红外(NIR)成像突破者--机器视觉网 2024-05-15 15:28:47

2024-05-15 15:28:47 来源: 中国机器视觉网

面向高端科研、半导体芯片、激光、光伏等工业等领域,博视像元打造了一款功能全面性价比极高的近红外相机BC-GN25M12X4 ,相机搭载Gpixel-GMAX0505全局快门高速CMOS图像传感器。同时兼容可见光和近红外光谱成像,支持 300 nm 至 1100 nm 光谱范围,同时具有高量子效率。一台相机实现同时拍摄可见光和NIR光谱图像,从而降低系统总体成本!

BC-GN25M12X4近红外相机,5120*5120 方形Sensor设计 ,3D-AOI 多光机正方形成像视野的最佳匹配。像元尺寸2.5um*2.5um,可满足检测系统画质、分辨率和精度等方面的高标准要求。机身小巧、重量轻盈,70mm*70mm行业小体积, 为同行同等机型体积的60

......长按二维码访问原文

欧菲光推出双光源ToF架构方案,技术赋能新一代扫地机器人--机器视觉网 2024-05-15 15:24:03

2024-05-15 15:24:03 来源: 中国机器视觉网

石头科技于三月底发布先锋旗舰自清洁扫拖机器人V20,该机型首次搭载了新型3D-ToF双光源发射技术,该技术由石头科技、英飞凌、pmd以及欧菲光共同研发、量产。方案通过发射两种不同模式的激光,让机器人能够通过双光源ToF技术往同样的方向,以不同的感知面积,发送不同类型的光信号,并根据信号的返回时间来计算物体与机器人之间的距离,从而完成空间内的深度、高度、宽度的测量理解,让机器人具备空间感知能力,以便进行定位导航和避障,侦测范围可达10米。

石头旗舰自清洁扫拖机器人V20发布现场

传统扫拖机器人的定位导航与避障需求通常选择两个独立传感器来实现,常用LDS激光雷达实现定位导航,结合其他光学测量传感器实现避障。V20率先使用一组传感器,实现完成避

......长按二维码访问原文

康视达CST分时频闪控制器,新升级“C版本”--机器视觉网 2024-05-15 15:18:33

2024-05-15 15:18:33 来源: 中国机器视觉网

分时频闪,是一种特殊的线阵扫描方式,与传统线阵扫描的恒定照明方式不同,每采集一行图像,其控制器便会自动地切换光源的种类或亮度,使得多种成像效果有序地间隔排列在图像中。采集完成后再对原始图像进行拆分重组,即可在扫描中获取多种光源效果图,从而降低成本,提高兼容性,获得最佳成像效果。

提升用户体验

一、硬件三大模式

1. 单工位模式——所有通道在同一时序下使用。

2. 双工位模式——控制器支持1~4通道和5~8通道两个独立的时序,等同于2台独立控制器。这意味着用户可以在同一台控制器上同时运行两个不同的工作流程或工位,大大提高了设备的使用效率和灵活性。通过合理的配置和设置,用户可以轻松实现两个工位之间的切换和协调,从而满足不同的生产需求。

......长按二维码访问原文

推动电动汽车发展:利用机器视觉和人工智能提升锂离子电池质量--机器视觉网 2024-05-15 16:59:53

2024-05-15 16:59:53 来源: 中国机器视觉网

在迈向可持续未来的过渡期,电动汽车(EV)正在不断发展的绿色能源领域中发挥着关键作用。由于技术进步、经济实惠,加上政府对绿色能源计划的支持,电动汽车销量一直呈指数级增长。

根据世界资源研究所(数据摘自国际能源署)开展的研究分析,在2022年全球销售的乘用车中,10%为纯电动车,相比五年前增加了10倍。挪威的纯电动车销量占乘用车销量的80%,位居世界第一,其次是冰岛(41%)、瑞典(32%)、荷兰(24%)和中国(22%)。

中国是全球最大的汽车市场,地位不容小觑。2022年,中国的电动汽车销量超过世界其他地区的总和。中国还对电动汽车制造开展战略投资,中国消费者可选的电车类型高达300多种。

相比之下,欧盟(12%)和美国(6%)的电动汽车销

......长按二维码访问原文

CSS颜色传感器应用分享--机器视觉网 2024-05-15 16:37:11

2024-05-15 16:37:11 来源: 中国机器视觉网

西克CSS颜色传感器素来有“小视觉”之称,除了对颜色进行分辨,还能对纹理不同物体、不规则物体进行长距离的分类,下面请看我们的介绍:

CSS产品介绍

CSS典型应用:汽车行业

应用需求:在汽车装备的生产商中,客户需要在300mm检测距离出检测多达14种颜色的保险杠,并对保险杠进行分类。

应用难点:需要使用一个传感器对多种颜色进行检测分辨。

解决方案:使用CSS颜色传感器,能够不附加网关、控制器等外加设备。传感器本身的4个开关量引脚能够通过二进制模式对颜色进行表示,如0001代表颜色1,0010代表颜色2,以此类推记录15种颜色,长距离检测稳定,节约客户成本。而CSS颜色传感器通过IO-LINK或RS-485,更是能够读取24种颜色。

C

......长按二维码访问原文

精准Carry纺机测量,堡盟传感器助力纺织工业--机器视觉网 2024-05-15 16:28:56

2024-05-15 16:28:56 来源: 中国机器视觉网

为了能够生产出耐穿、美丽的衣服,梳棉机功不可没。而我们今天带来的产品——堡盟模拟量电感就是应用在加工棉纤维和化学纤维的核心设备梳棉机上。

应用一:进棉罗拉处监测进棉量

场景描述

进棉罗拉用于控制前段工序进来的棉数量,客户目前未对进棉数量进行监测,无法感知进棉量的多少,经常发生进棉不足与进棉过多问题,时常引发梳棉机故障罢工。

堡盟工程师通过现场分析发现下图中所示钢板会随着进棉量的变化而上下移动,用户通过安装堡盟IR12测距电感可以实时地反馈钢板的位移信息,准确判断进棉量,实现对进棉量进行自动化控制。

双重保障更准确

为保证测量的准确性,以及两侧进棉罗拉的稳定平衡,两侧的进棉罗拉处各装配了一只IR12模拟量电感。

性能卓越,天生优秀

......长按二维码访问原文

康耐视DataMan 280解码利器的应用集锦--机器视觉网 2024-05-15 16:18:19

2024-05-15 16:18:19 来源: 中国机器视觉网

DataMan 280是一款多用途、功能强大的读码器,有动态自动聚焦和先进高动态范围成像功能,能确保在各种环境下的读码稳定性和可靠性,同时,其先进的一维/二维算法,包括HotBars、PowerGrid和均匀照明,能显著提升各类应用的处理能力和生产效率。

目前,DataMan 280系列产品广泛应用在汽车、医疗器械、电子、动力电池、食品包装等行业,充分满足客户对提升读码速度、提升读码准确度、读码环节降本增效等方面的诉求。

电子行业

应用需求:读取连接器托盘上的代码,用于连接器追溯。

应用痛点:连接器托盘多为透明材质,且有背景干扰,常规读码器读取率低。

产品选型:DataMan 282

解决方案:大功率集成式火炬形光源(HPIT):配备

......长按二维码访问原文

紫外相机的应用,UV相机有着怎样的应用和优势?--机器视觉网 2024-05-15 16:06:52

2024-05-15 16:06:52 来源: 中国机器视觉网

大家常见的工业相机有面阵相机、线扫相机,彩色相机、黑白相机,CCD相机、CMOS相机等种类。而工业相机的分类,根据芯片形式、芯片材质、输出图像颜色等不同参考系,有多种标准不一的分类方式,如:按照光谱波段范围的不同,可以分为可见光(普通)相机、红外相机、紫外相机等,今天我们要介绍以及简析应用的,是UV紫外相机:JAI-GO-8105M-5GE-UV。

机器视觉应用将紫外线划分为三个波段,分别是:UVA、UVB、UVC。UVA位于紫外波谱中波长最长的区域,在320-400nm,能被一些灵敏度有限的可见光相机观测到。UVB的波长范围为280-320nm,需要使用灵敏度更高且观测更精细的专业紫外相机观测。最后是UVC,该波段的波长是三者中最短的,为10

......长按二维码访问原文

一文读懂软袋拆码垛,零破袋、新标杆--机器视觉网 2024-05-15 15:41:36

2024-05-15 15:41:36 来源: 中国机器视觉网

凭借稳定可靠的自研工业3D视觉、机器人控制、运动规划、垛型规划等核心软硬件技术,灵西机器人持续深耕物流行业拆码垛场景,并实现标准化落地交付。本期,一文带您读懂灵西“3D视觉+AI”软袋拆码垛工作站。

灵西软袋拆码垛案例实景

柔软、易变形软袋:想要抓我不容易

2024年了,抓个软袋还老破?软袋类物体由于形状各异、运输中易变形、表面图案复杂,曾是自动化拆码垛行业面临的“老大难”。

过去,软袋拆码垛大多依赖人工,效率低。尽管自动化技术逐步推广应用,但传统机械臂处理软袋类物体时,因其易变性和复杂性仍难以准确抓取和码放,影响效率且易破损、浪费。

核心难点:

形状与姿态识别难:软袋边缘不规则,在运输中易变形松散。分割与抓取顺序判断难:堆垛状态下,

......长按二维码访问原文

Allied Vision将与液态镜头先锋Optotune合作―新闻频道- 视觉系统设计 2024/5/14 23:29:47

Allied Vision,全球领先的相机技术和成像解决方案厂商,于5月6号至9日在芝加哥举办的Automate展会上与液态镜头领域的先锋Optotune AG合作展示了一款集成系统,配备了Optotune液态镜头的Alvium相机首次亮相。这次合作标志着两家公司在相机技术和镜头领域的深度合作,旨在为客户提供更多创新高效的视觉解决方案。

Allied Vision小巧灵活的Alvium相机将开始支持Optotune液态镜头,赋能工业检测、人脸识别、条形码读取、无人机、邮件/包裹分拣、机器人以及医疗和科学成像等市场和应用领域客户。

关于Optotune AG

Optotune AG,总部位于瑞士,是可调焦点光学领域的领军企业之一,专注于生产可调焦点的光学元件。该公司成立于2008年,以其液体透镜技术而闻名。

......长按二维码访问原文

共话智造智驱3C全场景精益变革―新闻频道- 视觉系统设计 2024/5/14 23:12:49

行业信息化、智能化的持续演进是3C电子行业发展的根本动力,近年物联网、AI、云计算、自动驾驶等新兴技术蓬勃发展,有效推动3C电子行业走向了黄金赛道,并带动产业链高速成长,同时,3C电子行业迫切要求从劳动密集生产向自动化、智能化转变升级。

面对高度定制化的市场需求,海康机器人引入信息化、自动化、物联网、AI等技术,为3C行业构建了全周期高效协同、敏捷精益的智能制造新模式。

3C行业解决方案总览

海康机器人基于全场景规划、柔性物流、精益管理、端到端服务四大关键能力,结合机器视觉与移动机器人两大核心技术,打造了围绕3C行业全场景的解决方案,实现生产组装到品质管控,再到生产追溯的全链路智造升级。

目前,海康机器人的解决方案已在包括龙旗、深科技、转转、老板电器等诸多3C项目中落地。

3C全场景

精益升级解决方

......长按二维码访问原文

大恒图像诚邀您参加Vision China―新闻频道- 视觉系统设计 2024/5/14 22:34:14

备受瞩目的机器视觉行业盛会中国机器视觉助力智能制造创新发展大会Vision China(Beijing)将于2024年5月21日至22日在北京国际会议中心盛大开幕。大恒图像受邀参加此次展会,展会号:4C08。作为华北区域最为专业的机器视觉展会之一,该展会将汇聚行业精英,展示最新技术和创新产品。大恒图像也在全力准备,期待为观众带来一场前所未有的视觉盛宴。

01.演示系统

火星短波红外晶圆检测系统

2.5G紫外相机成像系统

彩色偏振相机水下目标识别系统

DALSA CIS 彩色印刷品检测系统

分体式高速存储系统

XYT+EVK流数据演示系统

02.专注于科研行业

从以上演示系统中可以看到,大恒图像此次展会将侧重展出专为高校科研行业研发生产的短波红外、紫外、偏振相机等多款非可见光相机。通过晶圆检测、

......长按二维码访问原文

四川深瑞视小型化三角测试设备―产品聚焦频道- 视觉系统设计 2024/5/15 13:27:17

由四川深瑞视自研生产的全球首款车载相机模组内参标定验证产品“小型化三角测试设备”,设备集成化高、测试速度快、稳定性高,能够轻松快速地接入产线,目前该设备已用于五十多个车载相机型号的三角测试验证。

为确保车载相机的性能和精度达到既定要求,需对内参进行验证。此环节作为质量控制的重要组成部分,旨在保障每台出厂的车载相机均符合设计标准,从而有效减少因相机参数误差可能引发的安全隐患。因此,在完成内参标定及烧录流程后,通常需借助三角测距方案来核实标定结果的准确性,进而确保相机模组在实际应用场景中的可靠性及适用性。

三角测试通过对实际场景中的空间距离进行测算来评价标定参数的准确性;计算过程中,内参参与计算,与实际应用场景吻合度更高;结果以相对误差表示,方法准确客观。与传统实景三角测试设备相比,深瑞视全新一代车载相机模组内

......长按二维码访问原文

凌华科技AI-ADAS技术助力车队智能化―技术与应用频道- 视觉系统设计 2024/5/14 22:30:11

伴随AI、计算机视觉和机器学习等先进技术的不断发展,彻底改变了汽车的自动驾驶能力。然而,以最小的延迟管理大量的传感器数据,仍然是自动驾驶技术的一个关键挑战。因此,集成一个可靠的边缘计算系统对于优化感知和预测算法的性能来说至关重要。

凌华科技提供技术先进的自动驾驶计算平台,为自动驾驶和ADAS技术提供强大的计算能力,同时还针对汽车应用采用了坚固耐用的设计。我们全面的解决方案可以满足不断变化的市场需求,助力用户拥抱汽车创新的未来。

凌华科技多合一 Al-ADAS 解决方案

合一系统,支持 360 度车内 ADAS 解决方案,搭配汽车等级的摄像头和 ECU。

支持 0-2+级的 ADAS 功能,包括 AVM、BSIS/BSD、DMS、LDW、FCW 等。

符合 UN 法规,可用于大型商用车辆(UN R130

......长按二维码访问原文

Cognex 推出全新人工智能 3D 视觉系统 2024/3/28 14:00:00

资讯 > 新品速递

www.cechina.cn2024.05.15阅读 365

人工智能驱动的 3D 视觉系统为自动化制造提供快速部署和可靠的检测功能

www.cechina.cn,该系统结合了人工智能、2D 和 3D 视觉技术,可解决一系列检测和测量应用问题。该系统可创建独特的投影图像,将 3D 信息整合入易于标注的 2D 图像,以简化训练,并显示传统 2D 成像无法看到的特征。人工智能工具可检测可变或未定义的特征,而基于规则的算法可提供 3D 测量控制工程网版权所有,以提供可靠的检测结果。 美国马萨诸塞州内蒂克 2024 年 4 月 2 日 /PRNewswire/ --工业机器视觉领域的领导者 Cognex Corporation(纳斯达克股票代码:CGNX)今日发布了 In-Sight® L38

......长按二维码访问原文

C# 海康相机SDK的二次开发-工业视觉/halcon-少有人走的路 2024-05-14 21:21:05

两种方式:

第一种:使用海康提供的MyCamera.cs类,使用动态链接库的方式,这种方式必须安装MVS客户端(客户端安装的时候会将需要用到的依赖文件一并安装,如果不想安装MVS,就必须到海康官网下载“机器视觉工业相机SDK V3.5.0版本Runtime组件包”),并使用MyCamera.cs这个类

第二种:使用MvCamCtrl.Net.dll.

这里只记录第一种方式:

大致流程(官方实例MultipleDemo):

1、枚举相机

MyCamera.MV_CC_EnumDevices_NET

返回值MV_CC_DEVICE_INFO_LIST(里面包含设备数量、设备信息数组IntPtr类型),

通过Marshal.PtrToStructure将IntPtr转struct,得到MV_CC_DE

......长按二维码访问原文

120+ Women Spearheading Advances in Visual Tech and AI: 2024-05-14T11:11:00-0400

In the past decade, we've experienced many remarkable technical advancements. Starting with the emergence of Deep Convolutional Neural Networks, then came Generative Adversarial Networks, and now there is the advent of Generative AI. Throughout, visual technologies have enabled computers to see.

The majority of data our brains analyze is visual so the major

......长按二维码访问原文

[ICLR 2024] Pre-training with Random Orthogonal Projection Image Modeling: 2024-05-14 15:30

......长按二维码访问原文

TCSVT投稿日期记录 2024-05-15 00:42

当初选这期刊就是因为审稿周期短,有一说一速度确实快,体验很好!

2023.10.08

提交

2023.10.16

未引用文献

Immediate Reject

2023.11.06

提交

2024.2.11

Major Revision

2024.3.11

提交

2024.5.5

Minor Revision

2024.5.12

提交

2024.5.14

Accept

......长按二维码访问原文

国防科大最新 | SceneTracker:在4D时空中追踪万物 2024-05-15 11:02

读者个人理解

在时间与空间组成的4D时空中,精确、在线地捕捉和分析长时且细粒度的物体运动,对机器人、自动驾驶、元宇宙、具身智能等领域更高水平的场景理解起到至关重要的作用。

本研究提出的SceneTracker,是第一个公开的(2024.03)有效解决在线3D点跟踪问题或长时场景流估计问题(LSFE)的工作。其能够快速且精确地捕捉4D时空(RGB-D视频)中任意目标点的3D轨迹,从而使计算机深入了解物体在特定环境中的移动规律和交互方式。

SceneTracker是一种新颖的基于学习的LSFE网络,它采用迭代方法来逼近最优轨迹。同时其动态索引和构建表观和深度相关性特征,并利用Transformer挖掘和利用轨迹内部和轨迹之间的远程联系。通过详细的实验,SceneTracker在处理3D空间遮挡和深度噪声干扰方

......长按二维码访问原文

机器视觉应用 | 基于智能视觉系统的产品外观定位识检测 2024-05-15 17:25

在当今高度自动化的生产环境中,机器视觉技术作为智能制造的关键环节,传统机器视觉的升级改造成为必然。例如在金属制品行业中,精确、高效的外观定位与缺陷检测是保障产品质量、提升生产效率的重要基石。

想象一下,原本那些复杂精密的金属零件,在很久以前需要人工肉眼去检测,所以我们开发出了机器视觉去检测它们。但由于智能制造的需求,我们又开发智能机器视觉系统去适应时代的发展,这产品质检都变得轻松起来!机器视觉系统通过先进的图像处理和机器学习算法,可以精准地定位识别多种多样的产品外观,快速找出可能存在的缺陷。

DLIA工业缺陷检测系统就是这样一种应用于工业领域的深度学习机器视觉检测系统,它利用深度神经网络对工业生产中的各种数据进行分析和处理,从而实现对产品质量的实时监控和预测性维护,有效地识别

......长按二维码访问原文

Mamba杀入MICCAI 2024!SegMamba和Swin-UMamba均收录! 2024-05-14 20:30

Mamba到底Out?还是没Out?根本不重要了!

不出所料,Mamba+医学影像相关工作在MICCAI 2024上爆发性收录!早下手的同学赢麻了!

Mamba被拒!但Mamba2和视觉Mamba收录ICML 2024!ICML 2024上视觉Mamba也成功收录!详见:重磅!视觉Mamba正式收录顶会ICML 2024!

快点击进入:Mamba和医学影像学习技术交流群

据CVer了解,ICML 2024上至少收录5篇Mamba相关工作!其中由原作者打造的Mamba正式升级成Mamba2,也顺利收录ICML 2024!之后会给大家带来分享,敬请期待!

Mamba杀入MICCAI 2024!

Mamba 在医学影像领域中应用最多,尤其是医学图像分割,其中大部分工作都投递到MICCAI 2024上了。而

......长按二维码访问原文

我们可以比较 Ra 和 Sa 值吗? 2024-05-14 18:49

我们在测量区域的表面粗糙的时候是否曾经想过可以将面粗糙度值(Sa、Sq、Sz 等)与线粗糙度值(Ra、Rq、Rz 等)进行比较?

光学三维轮廓仪现在非常流行,经常用于验证样品的表面纹理参数。然而,这种表面测量仪器通常不适用于测试技术图纸上提供的线粗糙度参数。这可能会让用户感到困惑,并可能导致用户想知道如何比较线粗糙度和和面粗糙度。

简单来说是它们不能随意进行比较,但实际情况比这更复杂一些。问题在于面粗糙度值与线粗糙度值之间只有很小的差距。这可能意味着一些用户直接将 Sa 值与 Ra 规格进行比较,这是不正确的。本文讨论了 Ra/Sa 的情况,但同样适用于其他参数(Rk/Sk、Rq/Sq 等)。

即使 Sa 计算方式是 Ra 方程的拓展(见下文),这并不意味着两个值可以直接进行比较。

当图纸上包含使用 R

......长按二维码访问原文

机器视觉运动控制一体机在点胶胶路检测上的应用 2024-05-15 10:23

市场应用背景

点胶通过使用不同类型的粘合剂,实现产品的密封、绝缘、导热和耐腐蚀等作用,广泛应用于各种产品的制造。在点胶加工生产中,通过检测胶水的宽度、点胶位置和胶路连续性等,可确保产品性能的可靠性和稳定性。

在现实生产过程中,点胶的加工精度时常受到执行机构物理特性、环境因素、材料特性等多种因素的影响,点胶过程中可能会出现偶发性点胶失误,如溢胶、断胶等缺陷,影响产品的点胶质量。需通过进行测量胶水的最大宽度、最小宽度和平均宽度等参数来管控,从而降低次品率,防止不良品流通到下一步加工工序当中和减少不必要的成本支出,提高企业的生产效率、品质和经济效益。

传统胶路检测方法的局限性:

在传统的胶路检测中,通常采用人工方式,主要依赖于操作员的主观判断和目视检查,导致检测结果一致性不高、效率低,难以适应高速生产线,并因

......长按二维码访问原文

《Understanding Vision: Theory, Models, and Data》读书笔记(5):视觉注意力和V1SH(第5章)——持续更新 2024-05-15 00:08

本文将在读书笔记(1):方法和范围(第1章)、读书笔记(2):关于视觉实验已知知识的介绍(第2章)、读书笔记(3):高效编码原则(第3章上)、读书笔记(4):高效编码原则(第3章中)——持续更新的基础上继续介绍,主要包含对第5章中间小节的学习笔记。

鉴于第3章和第4章视觉编码部分涉及大量的数理知识,梳理需要花费很多时间,因此我们先跳过这一部分,进入第5章,也是“编码-选择-解码”框架中最重要的一部分——选择。

这部分的笔记素材主要来自于李老师课程的PPT,详细内容请大家参考课程网站和教材。

Visual attention and visual saliency

视觉通路中信息瓶颈

注意力选择是我们视觉系统的关键组成部分,作为三个关键视觉阶段(编码、选择和解码)中的第二阶段。其中,视觉编码是将视觉图像

......长按二维码访问原文

AIRS/Aqua L3 8 天自由对流层中的二氧化碳(AIRS+AMSU)2.5 度 x 2 度 V005数据集 2024-05-15 15:45

AIRS/Aqua L3 8-day CO2 in the free troposphere (AIRS+AMSU) 2.5 degrees x 2 degrees V005 (AIRX3C28) at GES DISC

AIRS/Aqua L3 8 天自由对流层中的二氧化碳(AIRS+AMSU)2.5 度 x 2 度 V005 (AIRX3C28) at GES DISC

简介

大气红外探测器(AIRS)是第二个地球观测系统(EOS)极轨道平台 EOS Aqua 上的一个光栅分光计(R = 1200)。与高级微波探测装置(AMSU)和巴西湿度探测仪(HSB)相结合,AIRS 构成了一个由可见光、红外和微波传感器组成的创新型大气探测组。本产品是 AIRS 中对流层二氧化碳 (CO2) 3 级 8 天网格检

......长按二维码访问原文

VALSE 2024合合信息 | 文档解析与向量化技术加速多模态大模型训练与应用 2024-05-15 16:27

第十四届视觉与学习青年学者研讨会(VALSE 2024)近期在重庆悦来国际会议中心圆满举行,由中国人工智能学会(CAAI)、中国图象图形学会(CSIG)、中国民族贸易促进会主办,重庆邮电大学承办。与会专家学者围绕计算机视觉、图像处理、模式识别与机器学习研究领域等国内外前沿热点进行深入研讨。

本次大会共计开展数十场AI领域学术精彩纷呈的研讨报告,同时也吸引数千名来自学术界及产业界的视觉和机器学习领域青年学者参与,为计算机视觉、图像处理、模式识别、多媒体与机器学习研究领域内的青年学者们提供了一个深层次、纯粹学术及技术交流的舞台。

在大会的 VALSE 2014 Workshop 环节,作为领先的人工智能厂商,合合信息就《文档解析与向量化技术加速多模态大模型训练与应用》主题进行了分享,针对当下智能文档处理所面临的

......长按二维码访问原文

(2024,MambaOut,Mamba 适合长序列,区分指标,不适合分类,适合检测和分割)视觉真的需要 Mamba 吗? 2024-05-14 19:43

MambaOut: Do We Really Need Mamba for Vision?

公众号:EDPJ(进 Q 交流群:922230617 或加 VX:CV_EDPJ 进 V 交流群)

目录

0. 摘要

1. 简介

3. 概念讨论

3.1 Mamba 适合哪些任务?

3.2 视觉识别任务是否需要处理非常长的序列?

3.3 视觉识别任务是否需要因果token混合模式?

3.4 关于 Mamba 在视觉任务中必要性的假设

4. 实验

4.1 门控 CNN 和 MambaOut

4.2 ImageNet 上的图像分类

4.3 COCO上的目标检测与实例分割

4.4 ADE20K上的语义分割

5. 结论

0. 摘要

Mamba,一种具有状态空间模型(SSM)的类似 RNN 的 t

......长按二维码访问原文

【浙江大学】CP-SLAM:基于协作神经点的SLAM 2024-05-15 11:09

作者:自动驾驶专栏 | 原文出处:公众号【自动驾驶专栏】

摘要

本文介绍了CP-SLAM:基于协作神经点的SLAM。本文提出了一种使用RGB-D图像序列的协作隐式神经同时定位和建图(SLAM)系统,该系统由完整的前端和后端模块组成,包括里程计、回环检测、子地图融合和全局优化。为了在一个统一的框架中实现所有这些模块,本文提出了一种新型的基于神经点的3D场景表示,其中每个点都维持一个用于场景编码的可学习神经特征,并且与某个关键帧相关联。此外,针对协作隐式SLAM提出了一种分布式到集中式的学习策略,以提高一致性和协作性。本文还提出了一种新型的全局优化框架,以像传统的光束平差法一样提高系统精度。本文在各种数据集上进行实验,结果证明了所提出方法在相机跟踪和建图方面的优越性。

主要贡献

本文的贡献总结如下:

1)

......长按二维码访问原文

GPT-4o: The Comprehensive Guide and Explanation: 2024-05-14T15:23:46.000Z

GPT-4o is OpenAI’s third major iteration of their popular large multimodal model , GPT-4, which expands on the capabilities of GPT-4 with Vision . The newly released model is able to talk, see, and interact with the user in an integrated and seamless way, more so than previous versions when using the ChatGPT interface.

In the GPT-4o announcement , OpenAI fo

......长按二维码访问原文

Automatic Speech Recognition (ASR) with Diarization : Speech-to-Text: 2024-05-14T13:00:00+00:00

Automatic Speech Recognition (ASR) is a complex domain within AI, serving as a primary medium that echoes the seamless Human-Machine Interactions depicted in films like Ironman (Jarvis) and HER (Samantha).

Courtesy: HER (Samantha) – Warner Bros Pictures

Have you ever felt like having a conversation with our gadgets was straight out of a sci-fi movie? This

......长按二维码访问原文

视觉魔法师

我还没有学会写个人说明!

相关推荐