文章目录[隐藏]
- 行业资讯
- halcon和opencv选哪一个?编程语言选c++、c#还是python? 2019-05-19 23:00
- 计算机视觉和图像处理:了解区别和互连:2023-12-13T12:26:15+00:00
- 海康机器人与大专药剂合作,共同推进马来医药仓储智能化--机器视觉网 2023-12-14 14:00:53
- 新大陆自动识别正式成为谷歌Android Enterprise银牌合作伙伴--机器视觉网 2023-12-14 13:20:16
- 聪明检验每一颗螺丝螺帽,三星科技用 AI 实现零缺陷管理--机器视觉网 2023-12-14 16:11:16
- 梅卡曼德3D视觉技术应用于汽车底盘零部件生产制造,提升汽车制造智能化、柔性化水平--机器视觉网 2023-12-14 15:54:24
- 机器视觉在烟丝质量在线视觉检测中的应用--机器视觉网 2023-12-14 15:46:37
- 三类常见间隙面差测量方案,哪个更适合你--机器视觉网 2023-12-14 15:38:06
- 为什么需要使用线阵相机 线阵相机与面阵相机的区别-电子发烧友网 2023-12-14 18:19
- 线阵相机与面阵相机的区别与选型-电子发烧友网 2023-12-14 18:10
- ccd相机-电子发烧友网 2023-12-14
- 双相机道路检测方案-电子发烧友网 2023-12-14 11:40
- 简单认识移轴镜头-电子发烧友网 2023-12-14 17:25
- 线阵相机与面阵相机的区别-电子发烧友网 2023-12-14 16:55
- 线阵相机-电子发烧友网 2023-12-14
- 海康机器人与大专药剂合作,共同推进马来医药仓储智能化―新闻频道- 视觉系统设计 2023/12/13 22:50:58
- Specim发布升级版中波红外高光谱相机FX50―新闻频道- 视觉系统设计 2023/12/13 22:48:32
- 凌华科技采用 NVIDIA Jetson Orin 模块的下一代边缘 AI 平台―产品聚焦频道- 视觉系统设计 2023/12/13 22:52:37
- 堡盟OM30传感器在汽车领域的应用―技术与应用频道- 视觉系统设计 2023/12/13 22:54:44
- 电池包蓝膜后外观缺陷检测―技术与应用频道- 视觉系统设计 2023/12/13 22:46:35
- 软件测试/人工智能丨计算机视觉场景中,如何处理视频/图片数据并进行测试 2023-12-13 17:23
- <第17期>MIT教授教你如何“预训练”的视觉语言模型 2023-12-14 00:04
- DiffMorpher:在两个图像之间平滑形变生成视频 2023-12-13 19:03
- 计算机视觉--探索 TorchVision:强大的计算机视觉工具包 2023-12-13 19:12
- ICCV2023 | 极坐标-点云梦幻联动,实现3D目标检测的最佳性能 2023-12-14 18:05
- CNN 中 Atrous 卷积综合指南:2023-12-14T11:32:58+00:00
- 与萨蒂亚·马利克(Satya Mallick)一起解决计算机视觉问题:2023-12-13T18:03:13+00:00
- 数据科学:14.0.0
- 如何部署 CogVLM:2023-12-14T10:22:29.000Z
- 谷歌双子座的第一印象:2023-12-13T17:04:06.000Z
- 缺陷检测 AI 如何重塑制造业的质量保证:2023-12-13T17:07:08+00:00
- 视频注释工具如何增强对象识别:2023-12-13T16:36:20+00:00
- 图神经网络:基础、实现和实际用途:2023-12-14T03:34:09.000Z
行业资讯
halcon和opencv选哪一个?编程语言选c++、c#还是python? 2019-05-19 23:00
需要看你的发展方向。halcon+c#侧重点是项目本身,你不需要关心算法的实现细节,那么更看重的就是你的项目经验,或者行业经验。如果选择opencv+c++,那更看重的是你的算法实现能力,需要知道算法原理,如何实现,可以看成自己去实现halcon的一个个算子。当然两条路也有交叉的部分。如果对算法一点不懂,很多算子根本无法调参。如果对项目一点不了解,也不知道选择什么方向解决问题更合适。从市场需求来看,前者肯定>后者,从薪资来看,前者主要看项目奖,后者主要是固定工资,总收入还是看个人水平。从发展前景看,前者注重的是业务能力,或者说横向整合能力,后者注重的是你的理论深度,关键是数学。想往哪个方向发展,还得看自己更适合哪个。
......长按二维码访问原文
计算机视觉和图像处理:了解区别和互连:2023-12-13T12:26:15+00:00
在当今的数字世界中,计算机正在学习像人类一样“看到”和“理解”图像。但是他们是怎么做到的呢?这个引人入胜的旅程涉及两个关键领域:计算机视觉和图像处理。虽然它们听起来很相似,但它们在技术世界中有着不同的作用。让我们深入了解这些激动人心的领域!
什么
...... 长按二维码访问原文
海康机器人与大专药剂合作,共同推进马来医药仓储智能化--机器视觉网 2023-12-14 14:00:53
2023-12-14 14:00:53 来源: 中国机器视觉网
海康机器人携手核心集成商智能溯源(Intelligence Traceability),在马来西亚医药行业开拓新篇章。马来西亚大型连锁处方药局大专药剂(Alpro Pharmacy)引入海康机器人智慧物流解决方案,实现医药物流转型升级,从而拥有强大竞争力,为市场提供更快更专业的医药服务。
解决方案
海康机器人为大专药剂提供高品质的智慧物流解决方案,应用于中央仓,支撑全马来超260家门店的药品、个人洗护用品分拣配送需求以及部分电商订单拣选需求。
该项目一期占地面积约800㎡,现场部署多层货架数百个、潜伏机器人及智能仓储管理系统iWMS,帮助企业提升效率和实现管理可视化,推动业务向智能化方向发展。
方案优势
提升工作效率2.5倍
智能潜伏
......长按二维码访问原文
新大陆自动识别正式成为谷歌Android Enterprise银牌合作伙伴--机器视觉网 2023-12-14 13:20:16
2023-12-14 13:20:16 来源: 中国机器视觉网
日前,新大陆自动识别正式成为Android Enterprise银牌合作伙伴。Android Enterprise是一项由 Google 牵头的合作伙伴计划,目的是使 Android 设备和应用程序能够更好地在工作场所使用。通过该项认证,意味着新大陆自动识别在合作伙伴专业知识、产品性能和质量的卓越性等方面,满足了Android Enterprise所制定的的严格标准。
未来,新大陆自动识别将凭借银牌合作伙伴地位与Google和Android Enterprise合作伙伴计划密切协作,致力于提供尖端的移动终端解决方案为各行业企业和一线员工赋能,在通过物联网设备的广泛部署简化人工操作的同时,确保数据传输中敏感数据的安全,为众多企业彻底升级其运营方式
......长按二维码访问原文
聪明检验每一颗螺丝螺帽,三星科技用 AI 实现零缺陷管理--机器视觉网 2023-12-14 16:11:16
2023-12-14 16:11:16 来源: 中国机器视觉网
试想一下,一辆在高速公路上行驶的汽车,车内某个零部件在行驶过程中忽然松落,将会造成怎样的后果?轻则影响车辆性能,重则就有可能危及人身安全,三星科技总经理陈信志指出,这就是汽车厂商为何会严格要求供货商确保产品质量的原因,尤其是肩负连结紧固车内零部件之责的螺丝、螺帽,汽车厂商更是要求做到零缺陷,这就对扣件供货商的品检控管带来严峻挑战。
对此三星科技与华硕智能物联网(ASUS IoT)合作导入AISVision,该AI机器视觉工具包在强化品检工作效能的同时,也让该公司研发团队拥有打造 AI 视觉检测系统的能力。
三星科技用不同营运思维走出红海市场
成立超过半世纪的三星科技是全球螺帽产业龙头企业,月产能高达7,500公吨,除了扣件外也自制自销螺丝、
......长按二维码访问原文
梅卡曼德3D视觉技术应用于汽车底盘零部件生产制造,提升汽车制造智能化、柔性化水平--机器视觉网 2023-12-14 15:54:24
2023-12-14 15:54:24 来源: 中国机器视觉网
汽车底盘是汽车的基础结构,起着承载、支撑、传输动力、消除振动多重作用,主要由传动系统、行驶系统、转向系统、制动系统等组成。底盘总成零部件种类繁多、涉及工艺复杂、质量标准要求高,生产过程产生了大量自动化升级需求。
梅卡曼德携手集成商伙伴赋能众多Tier1及大型汽车零部件制造厂商,以AI+3D视觉技术实现底盘零部件智能化、柔性化生产。智能机器人工作站与CNC、焊接系统、测量系统等自动化设备配合,帮助终端客户大幅提升产线生产效率及质量标准。
传动系统
3D视觉引导变速箱壳体抓取上料
应用背景:变速箱壳体表面反光、结构复杂;自重大、加工流程较长,人工上料强度大。需进行机加工,抓取、放置精度要求高。
应用优势:高精度结构光工业3D相机Me
......长按二维码访问原文
机器视觉在烟丝质量在线视觉检测中的应用--机器视觉网 2023-12-14 15:46:37
2023-12-14 15:46:37 来源: 中国机器视觉网
烟草物流和烟草生产作为烟草产业的两大重要环节,对于数字化、智能化的需求日益迫切,这不仅仅关乎效率的提升,更是关乎对市场快速变化的应对能力。
在烟草物流行业,睿图智能的“Rsort条烟智能视觉核对系统”已覆盖全国80%的省份,在烟草物流市场的占有率稳居前列;在烟草生产行业,睿图智能即将推出“烟丝质量在线视觉检测系统”,进一步拓展了机器视觉技术在烟草产业的应用范畴,提升了烟草生产的智能化、精益化程度。
烟丝宽度检测过程繁杂 检测结果误差大
随着国际、国内市场形势的变化和卷烟消费水平的提高,特别是“中式卷烟”的提出,更是对我国卷烟加工工艺提出了更高的要求。在卷烟加工过程中,烟丝宽度是影响卷烟质量的重要指标,宽度不合格的烟丝影响卷烟的填充效果和燃烧
......长按二维码访问原文
三类常见间隙面差测量方案,哪个更适合你--机器视觉网 2023-12-14 15:38:06
2023-12-14 15:38:06 来源: 中国机器视觉网
汽车外覆盖件之间的间隙、高低差和平整度,不仅影响到汽车外观的美观度,还关系到车辆在风阻、噪音和安全性等方面的性能。随着消费者对汽车质量和舒适性的要求不断提高,汽车制造企业对于车身间隙面差测量的精度、效率也提出了更高的标准。
在实际生产环境中,有多种不同的间隙面差测量方案可供选择。这些方案在测量精度、成本效益、生产效率和适用范围等方面存在差异。对于企业来说,如何在众多选择中确定适合自己的方案,是一个值得深思熟虑的问题。介绍三种落地成熟的解决方案:工人手持物理量具测量、工人手持测量仪测量、机器人自助式测量。
工人手持物理量具测量
首先,当然是工人使用塞尺、塞规等物理量具对间隙面差进行检测。不同的间隙对应不同规格的塞尺,如果检测数据不达标,工人会
......长按二维码访问原文
为什么需要使用线阵相机 线阵相机与面阵相机的区别-电子发烧友网 2023-12-14 18:19
为什么需要使用线阵相机
客户使用线阵相机的原因、场景很多,总结起来,基本是下面三个因素:
a.被拍摄物的特殊性
• 运动着的,无限长的被拍摄物,如布匹、钢带、薄膜材料、纸张
• 传送带上大小,颜色、分布各异的 产品 :果蔬、矿石、金属零件等
• 圆柱形物体:易拉罐、滚筒装置
b.对光的均匀性,要求很高
• 线阵光源比面阵光源,更容易实现打光的均匀性
c.成本考量
• 1台线阵相机 vs 多台面阵相机:成本更低,部署更方便。
• 线阵相机 vs 高分辨率面阵相机:成本更低。例如,高分辨率平板 检测 行业,使用高分辨率面阵相机,成本很高,而用线阵相机,成本可以低很多。同时,屏幕的外形特点,也对线阵相机很友好:长宽均匀。线阵相机从上往下扫描一遍,可达到高分辨率面阵相机的成像效果。
线阵相机与面阵
......长按二维码访问原文
线阵相机与面阵相机的区别与选型-电子发烧友网 2023-12-14 18:10
工业 相机是 机器视觉 系统必不可少的核心组件,根据不同的类别有不同的分类标准。按 传感器 的结构特性分类,可分为面阵相机与线阵相机两种。其中,面阵相机是以面为单位来进行图像采集,可以一次性获取完整的目标图像,并能及时进行图像采集的相机。在目标物体的形状、尺寸,位置等方面的应用上发挥着至关重要的成像作用。
随着技术的发展和需要,面阵相机按照其 图像传感器 的结构或排列方式的不同,分为帧转移、隔列转移、线转移以及全帧转移四种类型,每种类型都有着各自的特点。
类型区分
面阵相机:实现的是像素矩阵拍摄。相机拍摄图像中,表现图像的细节由分辨率决定,而分辨率是由镜头焦距决定的。同一种相机选用不同焦距的镜头,分辨率就不同。像素的多少不决定图像的分辨率,那么大像素相机有何好处?其实是可以减少拍摄次数,提高测试速度。
......长按二维码访问原文
ccd相机-电子发烧友网 2023-12-14
文章:10个 浏览:9784次 帖子:61个
ccd相机技术
线阵相机与面阵相机的区别与选型 工业相机是机器视觉系统必不可少的核心组件,根据不同的类别有不同的分类标准。按传感器的结构特性分类,可分为面阵相机与线阵相机两种。 2023-12-14 标签:机器视觉CCD相机工业相机 112 0
圆柱电池生产装配线的设计及未来趋势 圆柱18650电池是被研究得最多、技术讨论最充分的电池品种。单体主要由正极、负极、隔膜、正极负极集电极、安全阀、过流保护装置、绝缘件和壳体共同组成。壳体... 2023-11-21 标签:锂电池伺服系统测试机 72 0
常见机器视觉问题梳理 输出接口类型的选择主要由您需要获得数据类型决定。如果您的图像输出直接给视频监视器,那么您只需要模拟输出的相机(对单色图像需求就是CCIR或RS
......长按二维码访问原文
双相机道路检测方案-电子发烧友网 2023-12-14 11:40
双相机道路 检测 方案
解决传统道路检测难题
目前国内道路检测常用的单相机检测方案在一些特殊情况下,如遇到裂缝平行于路面方向,路面特殊材质或高吸光率,路面存在凹凸等情况,会产生漏拍裂缝或裂缝成像不清晰等问题,导致检出率无法达到理想值。为解决此类问题,志强视觉积极学习国外先进技术,引进了双相机道路检测方案。
双相机道路检测方案,是由两台相机各覆盖一半的视野,两个光源互相交叉照明,通过交叉的光路,可获得更明显的裂缝阴影,从而使各个方向的裂缝均可清晰成像,极大地提高了方案的整体检出率。
双相机道路检测方案中分辨率对比单相机道路检测成倍增加,检出率及检出精度得到极大提高。为匹配日渐严苛的检测速度需求,志强视觉还研发了更高亮度的激光照明方案,可在2米限高内,实现对4米全路面的照明,能够匹配最高100KM/H的照明
......长按二维码访问原文
简单认识移轴镜头-电子发烧友网 2023-12-14 17:25
移轴镜头是一种特殊的镜头,其中内部的 光学 器件可以相对于 图像传感器 倾斜和移位,并使图像透视发生改变,通常常见的移轴镜头可以实现三种物理运动,分别是倾斜和偏移以及旋转,可以实现特殊的拍摄效果。
第一个是镜头的倾斜运动,其中镜头围绕枢轴移动与其原始轴成一角度,是使镜头前面部分形成上下或左右倾斜的运动。通过该运动可以控制合焦面,从而实现在大光圈下对主被摄体整体合焦。
第二个是镜头的偏移运动,镜头平行于原始轴移动,可使镜头卡口的前面部分整体上下或左右平移。通过该功能可以改变拍摄范围,获得与升高或降低拍摄位置一样的效果。
第三个是镜头的旋转运动,镜头安装在机身的状态下,可以将整个镜头进行旋转。通过该方式可以配合被摄体的形状更改偏移与倾斜角度的操作方向。
随着 机器视觉 不断深入不同细分行业,需要用到移轴成像
......长按二维码访问原文
线阵相机与面阵相机的区别-电子发烧友网 2023-12-14 16:55
工业 相机是 机器视觉 系统必不可少的核心组件,根据不同的类别有不同的分类标准。按 传感器 的结构特性分类,可分为面阵相机与线阵相机两种。其中,面阵相机是以面为单位来进行图像采集,可以一次性获取完整的目标图像,并能及时进行图像采集的相机。在目标物体的形状、尺寸,位置等方面的应用上发挥着至关重要的成像作用。
随着技术的发展和需要,面阵相机按照其 图像传感器 的结构或排列方式的不同,分为帧转移、隔列转移、线转移以及全帧转移四种类型,每种类型都有着各自的特点。
类型区分
面阵相机:实现的是像素矩阵拍摄。相机拍摄图像中,表现图像的细节由分辨率决定,而分辨率是由镜头焦距决定的。同一种相机选用不同焦距的镜头,分辨率就不同。像素的多少不决定图像的分辨率,那么大像素相机有何好处?其实是可以减少拍摄次数,提高测试速度。
......长按二维码访问原文
线阵相机-电子发烧友网 2023-12-14
线阵相机与面阵相机的区别与选型 工业相机是机器视觉系统必不可少的核心组件,根据不同的类别有不同的分类标准。按传感器的结构特性分类,可分为面阵相机与线阵相 2023-12-14 标签: 机器视觉 CCD相机 工业相机 112 0
线阵相机与面阵相机的区别 工业相机是机器视觉系统必不可少的核心组件,根据不同的类别有不同的分类标准。按传感器的结构特性分类,可分为面阵相机与线阵相 2023-12-14 标签: 机器视觉 工业相机 线阵相机 52 0
机器视觉表面缺陷检测系统设计方案 线阵相机是机器视觉领域中一种特殊的图像采集设备。由于它的传感器只有一行感光元件,因此可以实现高扫描频率和高分辨率。面阵相 2023-08-21 标签: 机器视觉 缺陷检测 深度学习 448 0
线阵相机知识汇总 线阵相机顾名思义就是取
......长按二维码访问原文
海康机器人与大专药剂合作,共同推进马来医药仓储智能化―新闻频道- 视觉系统设计 2023/12/13 22:50:58
海康机器人携手核心集成商智能溯源(Intelligence Traceability),在马来西亚医药行业开拓新篇章。
马来西亚大型连锁处方药局大专药剂(Alpro Pharmacy)引入海康机器人智慧物流解决方案,实现医药物流转型升级,从而拥有强大竞争力,为市场提供更快更专业的医药服务。
解决方案
海康机器人为大专药剂提供高品质的智慧物流解决方案,应用于中央仓,支撑全马来超260家门店的药品、个人洗护用品分拣配送需求以及部分电商订单拣选需求。
该项目一期现场部署多层货架数百个、潜伏机器人及智能仓储管理系统iWMS,帮助企业提升效率和实现管理可视化,推动业务向智能化方向发展。
方案优势
提升工作效率2.5倍
智能潜伏机器人可以根据预设的路径和指令,自动将药品从库区搬运至指定的
......长按二维码访问原文
Specim发布升级版中波红外高光谱相机FX50―新闻频道- 视觉系统设计 2023/12/13 22:48:32
近期,Specim发布升级版Specim FX50中波红外(MWIR)高光谱相机。Specim FX50是市场上第一款也是唯一一款覆盖2.7 ~ 5.3 μm整个中波红外光谱范围的推扫式高光谱相机。
这款突破性高光谱相机产品具有增强的特性和功能,通过检测任何其它波长或成像方法无法检测的材料(例如碳氢化合物、矿物、石油和金属表面污染物),扩大了工业分选、质量控制、工艺优化和研究的可能性。此外,Specim FX50还为科学探索的新机会打开了大门。
“升级版中波红外高光谱Specim FX50的发布对于Specim及我们客户来说是一个重要的里程碑。该相机的第一个版本于2019年发布,其需求超出了我们的预期。我们对这款升级版相机提供的尚未开发的可能性感到兴奋!”Specim首席执行官(CEO)Tapio Kall
......长按二维码访问原文
凌华科技采用 NVIDIA Jetson Orin 模块的下一代边缘 AI 平台―产品聚焦频道- 视觉系统设计 2023/12/13 22:52:37
DLAP-211-Orin系列和DLAP-411-Orin工业级边缘AI平台,重新定义了智慧城市、零售、安全、工厂和制造等各个领域的AI应用基准,为AI应用提供卓越的性能和操作体验。
摘要:
DLAP 产品线是一系列紧凑的、经过SWaP 优化的、坚固的工业级AI推理平台。
DLAP 系列旨在满足以AI为中心的应用需求,包括智能工厂中的自动光学检测 (AOI)、智能城市中的智能停车解决方案、智能零售中的自主操作以及农业和水产养殖等领域的实时土壤或水监测。
最新的DLAP-411-Orin采用NVIDIA® Jetson AGX Orin™模块,相比前一代产品,可提供8倍的AI性能;全新的 DLAP-211-Orin 系列采用最新的 NVIDIA® Jetson Orin™ Nano 或 NX 模块。
全
......长按二维码访问原文
堡盟OM30传感器在汽车领域的应用―技术与应用频道- 视觉系统设计 2023/12/13 22:54:44
镇流器是车辆制造行业中常用到的零部件,但由于车规级产品在产品使用环境上极为苛刻,因此在安装环境上也面临着种种限制。
解决方案
为了能够保证产品外观能够达到要求,通过与磨具的高度差测量,能够在因此在产品的制造上也要执行相关的标准。
堡盟OM30在镇流器的制造中负责产品高度差的测量,由于其光斑小,精度极高。非接触式测量,响应频率高,无需接触式测量的机械动作。产品集放大器于一体,便于安装,可以方便地集成在各种设备中。
功能强大,测量精准
OM30是堡盟最新升级的一款产品,拥有强大的产品功能,一经推出便获得了客户的喜爱。
它拥有小巧的机身,即便在狭窄的空间内堡盟OM30也可以轻易实现测量,方便集成在设备内部,操作非常便捷。虽然外形小巧,但其性能依然强悍,OM家族系列功能并没有因外形的紧凑而被打折;
堡盟O
......长按二维码访问原文
电池包蓝膜后外观缺陷检测―技术与应用频道- 视觉系统设计 2023/12/13 22:46:35
项目背景
面向TWh时代,动力电池产能大规模扩充,电池企业对电池产品安全、性能、品控的要求越来越高。其中,动力电池生产效率提升和极限制造的要求,对机器视觉在检测精度、检测速度、图像传输、缺陷分析等方面提出了更高的要求和挑战。
在动力电池工艺流程中,蓝膜作为一种绝缘材料,可以将电芯与电芯之间分隔开来,阻隔单个电芯因各种故障对其他电芯造成的影响,防止“一损俱损”;其次,它可以防止电池在后续的运输及组装过程中出现表面划伤和漏电;此外,它还可以起到防水、防尘的作用,从而更好地保护电池。
项目难点
由于蓝膜是一种高反光材质材料,这种光学特性致使许多缺陷特征不明显,从而导致传统算法过杀率和漏检率极高。同时蓝膜的厚度较小,仅在0.015mm-0.20mm间,缺陷种类极多且部分缺陷种类样本难以收集。
以往以传统2D视
......长按二维码访问原文
软件测试/人工智能丨计算机视觉场景中,如何处理视频/图片数据并进行测试 2023-12-13 17:23
在计算机视觉中,处理视频和图片数据并进行测试是一个关键的任务。以下是一些常见的步骤和方法:
处理图片数据:
数据加载:
使用图像处理库(例如OpenCV、PIL)加载图像数据。
将图像转换为模型所需的格式(通常是矩阵)。
预处理:
标准化图像:将图像像素值缩放到固定范围,例如 [0, 1] 或 [-1, 1]。
裁剪或调整图像大小以匹配模型输入要求。
数据增强:通过旋转、翻转、缩放等方式增加训练样本。
特征提取:
使用预训练的卷积神经网络(CNN)提取图像特征。
可选地在图像中应用各种滤波器或特征变换。
处理视频数据:
数据加载:
使用视频处理库(例如OpenCV)加载视频数据。
将视频分解为帧,每帧都是一个图像。
预处理:
对每一帧应用图像预处理步骤。
......长按二维码访问原文
<第17期>MIT教授教你如何“预训练”的视觉语言模型 2023-12-14 00:04
曾经,视觉模型火的时候,语言模型想加入视觉模型。现在呢,反过来了,语言模型大火,而视觉模型,却想着要加入语言模型。真实十年河东,十年河西。
于是,就有了视觉语言模型(VLM),随着大型语言模型的最新成功而迅速发展。
一般的做法是直接将训练好的语言模型,加入一些视觉信息进行预训练,但是这个过程目前来讲,缺乏一些深入的研究。大家各做各的,缺乏一个明确的指导和结论。
VILA: On Pre-training for Visual Language Models( https://arxiv.org/pdf/2312.07533.pdf ),来自NVIDAI和MIT,专门回答了一个问题:各种不同的视觉语言模型的预训练如何影响他在下游任务的性能?
给定一个语言模型,要想加入视觉信息,一般有2中做法:1种是固定语
......长按二维码访问原文
DiffMorpher:在两个图像之间平滑形变生成视频 2023-12-13 19:03
它使用预训练的扩散模型实现自然和平滑的图像变形。
arXiv: https://arxiv.org/abs/2312.07409
项目页面: https://kevin-thu.github.io/DiffMorpher_page/…
https://www.zhihu.com/video/1718344756416028672
DiffMorpher:发挥扩散模型能力以实现图像形变
扩散模型在图像生成质量上已经取得了卓越的成果,超过了之前的生成模型。
然而,与GAN相比,扩散模型的一个显著局限是其难以在两个图像样本之间平滑插值,因为其潜在空间高度无结构化。
这样的平滑插值非常吸引人,因为它自然地为图像形变任务提供了解决方案,而图像形变任务有许多应用。
在论文中,我们提出了 DiffMorphe
......长按二维码访问原文
计算机视觉--探索 TorchVision:强大的计算机视觉工具包 2023-12-13 19:12
介绍
在计算机视觉领域,机器解释和理解视觉数据的能力近年来取得了显着的进步。TorchVision 是推动这一进步的关键组件之一,它是一个综合性计算机视觉库,构成 PyTorch 生态系统的一部分。TorchVision 是一个开源库,为开发人员和研究人员提供了广泛的工具和功能来处理各种计算机视觉任务,从图像分类到对象检测和分割。在本文中,我们将深入研究 TorchVision 的世界,探索它的特性、应用以及在计算机视觉领域的意义。
探索 TorchVision 就像打开了一扇通向视觉可能性世界的窗户。借助这个强大的计算机视觉工具包,您可以照亮通往机器真正理解和看到我们周围世界的未来之路。
TorchVision:概述
TorchVision 是 PyTorch 的重要组成部分,PyTorch 是 Fa
......长按二维码访问原文
ICCV2023 | 极坐标-点云梦幻联动,实现3D目标检测的最佳性能 2023-12-14 18:05
近年来,基于极坐标的表示方法在感知任务中表现出良好的应用前景。我们介绍了一种新型的极坐标三维物体探测器PARTNER。我们的方法在Waymo和ONCE验证集上分别以3.68%和9.15%的显著优势优于以前的基于极坐标的工作,并且获得了与最先进笛卡尔坐标系方法相当的结果。
1. 极坐标方法的优势
由于点云本身是不均匀分布的,靠近传感器的区域点云密度明显大于远处区域。采用笛卡尔坐标系表示 (例如体素化)时,为了控制内存消耗,需要选择合适的分辨率,这会导致近处区域丢失细节信息。
而极坐标表示天然地适应点云密度分布的属性,近处使用较高分辨率,远处使用较低分辨率,这样可以平衡不同距离区域的点云数量,提高特征表达的稳健性。所以,极坐标本身不会引入新的不均匀性,而是充分利用点云自身的特点来获得更好的特征表达。
图1
......长按二维码访问原文
CNN 中 Atrous 卷积综合指南:2023-12-14T11:32:58+00:00
介绍
在计算机视觉领域,卷积神经网络 (CNN) 重新定义了图像分析和理解的格局。这些强大的网络在图像分类、目标检测和语义分割等任务方面取得了突破。它们为在以下领域的广泛应用奠定了基础。
...... 长按二维码访问原文
与萨蒂亚·马利克(Satya Mallick)一起解决计算机视觉问题:2023-12-13T18:03:13+00:00
在本期“以数据为先导”节目中,我们邀请到了 OpenCV.org 首席执行官兼 Big Vision LLC 创始人 Satya Mallick。Satya 分享了他在计算机视觉领域的非凡历程,强调了图像处理和计算机视觉之间的关键区别。从人工智能咨询的透明度到战略增长战略和基因的变革性影响
...... 长按二维码访问原文
数据科学:14.0.0
我们在 Analytics Vidhya 网站上使用 cookie 来提供服务、分析网络流量并改善您在网站上的体验。使用 Analytics Vidhya,即表示您同意我们的隐私政策和使用条款
...... 长按二维码访问原文
如何部署 CogVLM:2023-12-14T10:22:29.000Z
CogVLM 是一个开源的大型多模态模型 (LMM)。您可以使用 CogVLM 询问有关文本和图像的问题。例如,您可以要求 CogVLM 计算图像中的对象数、描述场景或读取图像中的字符。
在定性测试中,CogVLM 取得了比 LLaVA 和 BakLLaVA 更强的性能,并取得了相似的性能
...... 长按二维码访问原文
谷歌双子座的第一印象:2023-12-13T17:04:06.000Z
2023 年 12 月 6 日,谷歌宣布推出 Gemini ,这是一种新的大型多模态模型 (LMM),适用于文本、图像和音频。Gemini 的文本功能在同一天被引入 Bard,并宣布 Bard 将很快推出多模态功能。
12 月 13 日,Google 发布了 Gemini 的 API,允许你集成 Gemini m
...... 长按二维码访问原文
缺陷检测 AI 如何重塑制造业的质量保证:2023-12-13T17:07:08+00:00
制造业的格局是动态和广泛的,保持高质量的产品至关重要。传统的质量保证方法通常依赖于人工检查,在大多数情况下会留下错误和不一致的余地。然而,由AI/ML驱动的尖端质量控制和保证技术可以彻底改变
...... 长按二维码访问原文
视频注释工具如何增强对象识别:2023-12-13T16:36:20+00:00
在过去几年中,对数据注释的需求急剧增加,我们可以看到未来十年的积极增长。根据一份报告,2022 年全球数据收集和标记市场价值 22.2 亿美元,从 2023 年到 2030 年将以 28.9% 的复合年增长率增长。
随着数据标注市场的蓬勃发展,越来越多的
...... 长按二维码访问原文
图神经网络:基础、实现和实际用途:2023-12-14T03:34:09.000Z
立即为您的机器学习工作流程增添速度和简单性 开始使用
图神经网络 (GNN) 是一种神经网络,旨在以图格式处理信息。它们已被用于解决许多不同领域的问题,并且由于它们处理复杂数据结构的能力,近年来它们的受欢迎程度越来越高
...... 长按二维码访问原文