文章目录[隐藏]
- 视觉招聘小黑板
- 行业资讯
- 30岁想自学PLC转变职业规划,行业空间如何? 2024-05-14 14:02
- OpenCV 5 Progress Update (May 9, 2024): 2024-05-09T17:44:04+00:00
- 安森美揭秘图像传感器开发必备工具DevWareX--机器视觉网 2024-05-14 15:31:16
- 星猿哲科技自研AL-M DLP 结构光 3D 相机MTBF 认证突破 8 万小时--机器视觉网 2024-05-14 15:22:08
- 热烈祝贺慕藤光荣获“专精特新”企业称号--机器视觉网 2024-05-14 15:15:10
- 泰雷兹荣获Frost & Sullivan“2024年机场网络安全奖”--机器视觉网 2024-05-14 15:09:37
- 长光辰芯推出大靶面、高帧频背照式sCMOS图像传感器--机器视觉网 2024-05-14 14:56:42
- 茉丽特微型轴承检测--机器视觉网 2024-05-14 16:37:46
- 海研科技360°AI视觉检测系统助力制造业智能化发展--机器视觉网 2024-05-14 16:26:16
- 可用于高压电网巡检的Photonis日盲紫外相机--机器视觉网 2024-05-14 16:07:55
- 大族视觉PACK装配综合集成视觉方案解析--机器视觉网 2024-05-14 15:45:11
- 腾讯发布业界首份行业大模型调研报告:向 AI 而行,共筑新质生产力--机器视觉网 2024-05-14 15:37:08
- 华睿科技助力锂电行业搭建全工序视觉检测解决方案--机器视觉网 2024-05-13 14:46:44
- 未来以来,你好具身智能工业机器人--机器视觉网 2024-05-13 14:32:36
- 视展光电推焦车炉门挂钩成像智能监测与预警系统--机器视觉网 2024-05-13 14:25:59
- 广州LET展即将开幕,重磅新品类首次亮相―新闻频道- 视觉系统设计 2024/5/13 22:32:25
- 星猿哲科LS系列3D相机通过MTBF认证突破 8 万小时―新闻频道- 视觉系统设计 2024/5/13 22:08:17
- 海克斯康2024“世界计量日”主题大会重磅来袭―新闻频道- 视觉系统设计 2024/5/13 21:59:10
- 东声智能斩获两项国际大奖―新闻频道- 视觉系统设计 2024/5/11 9:17:16
- 专为协作臂打造!迁移科技工业3D相机Pixel Mini ,让轻巧突破想象―新闻频道- 视觉系统设计 2024/5/10 10:05:26
- 第十三届制造业物流与仓储智能化工程大会暨第二届全球叉式移动机器人峰会―新闻频道- 视觉系统设计 2024/5/9 21:45:55
- 长光辰芯推出大靶面、高帧频背照式sCMOS图像传感器―产品聚焦频道- 视觉系统设计 2024/5/13 22:21:26
- 珩图科技 VRH9-020B 结构光3D相机―产品聚焦频道- 视觉系统设计 2024/5/11 8:53:07
- 中长波红外自动对焦镜头模组―产品聚焦频道- 视觉系统设计 2024/5/11 8:43:27
- 海康机器人通用型CU系列工业相机―产品聚焦频道- 视觉系统设计 2024/5/10 21:32:05
- 深视智能高速相机实时观测熔化极氩弧焊熔滴过渡―技术与应用频道- 视觉系统设计 2024/5/13 22:03:21
- 堡盟VCXG工业相机助力食品包装业自动化―技术与应用频道- 视觉系统设计 2024/5/11 9:25:53
- 机器视觉接口概述(2) :CXP标准的全面解析―技术与应用频道- 视觉系统设计 2024/5/10 21:26:35
- AI检测软件助力PCB产业流程完善及质量提升―技术与应用频道- 视觉系统设计 2024/5/9 21:19:07
- 高德智感IR-Perfclear实时超分技术增强画质增―技术与应用频道- 视觉系统设计 2024/5/9 16:18:45
- 高性价比之选——通用型CU系列工业相机,让高质量检测触手可及! 2024/3/28 14:00:00
- 一年出货3万台!海康机器人为何能发展如此惊人! 2024/3/28 14:00:00
- C# ConcurrentDictionary线程安全字典 的 TryUpdate怎么用-.net程序调试-少有人走的路 2024-05-14 14:51:42
- vs2022 的python支持,hello world程序-python-少有人走的路 2024-05-13 21:33:18
- IJCV 2024 | Splatting+Optical Flow=SOTA!国防科大最新提出多帧光流框架SplatFlow 2024-05-13 12:10
- 港科大最新!力压Transformer?首篇Mamba综述来了! 2024-05-13 08:08
- DLIA工业缺陷检测:推动人工智能技术在工业缺陷检测中的应用 2024-05-14 17:08
- Apple助力3DGS重大突破!3DGS竟能实现新姿态合成? 2024-05-13 10:04
- 王牌飞行员申请出战!- MambaOut: Do We Really Need Mamba for Vision? 2024-05-14 16:28
- MAAL 详细解读 2024-05-13 20:41
- ICML 2024 | 文生图新SOTA!Pika北大斯坦福联合推出RPG:多模态助力解决文生图两大难题 2024-05-14 11:09
- OCR识别产品 最全整理汇总 2024-05-13 19:32
- 解析VISION TRANSFORMERS NEED REGISTERS 2024-05-13 00:57
- 浅谈工业用LED面光源 2024-05-14 14:57
- ICLR 2024 杰出论文奖出炉!两篇国内论文获得提名! 2024-05-13 23:18
- Diffusion Inversion技术 2024-05-13 15:38
- 南京大学三维视觉实验室招生[2025年入学] 2024-05-14 15:45
- 俄国黑客的地理间谍项目:geospy,一张图片告诉你准确位置 2024-05-13 15:33
- LSTM卷土重来!xLSTM:一举超越Mamba、Transformer! 2024-05-14 18:07
- 什么是机器视觉系统,怎么工作的? 2024-05-14 11:07
- 学点AI知识:在目标识别方面,ConvNets超越人类了吗?我们离真正的视觉智能还非常遥远 2024-05-14 08:46
视觉招聘小黑板
欲了解详情,请在公众号后台回复:240514
行业资讯
30岁想自学PLC转变职业规划,行业空间如何? 2024-05-14 14:02
如题,最近看到了一些PLC或者自动化相关的知识,觉得蛮有兴趣的。也在考虑学习PLC然后转变职业规划,想请问各位大佬,这个行业目前如何,半路出家障碍几何… 显示全部
......长按二维码访问原文
OpenCV 5 Progress Update (May 9, 2024): 2024-05-09T17:44:04+00:00
Hello, Community! This post is a summary of development on OpenCV 5 in the last week. You can always find the most up-to-date information on the OpenCV 5 Work Board. Many thanks to Jia Wu for her excellent notes!
Latest Developments from the OpenCV Core Team:
Unified Samples for Edge Detection : Improved and unified samples for edge detection in PR #25515,
......长按二维码访问原文
安森美揭秘图像传感器开发必备工具DevWareX--机器视觉网 2024-05-14 15:31:16
2024-05-14 15:31:16 来源: 中国机器视觉网
在配置、控制和验证图像传感器的过程中,开发者可能会面临一系列挑战。为此,安森美(onsemi)提供了一款强大的多功能工具DevWareX,旨在帮助开发者更快速、更准确、更高效地完成图像传感器的开发工作。
这款工具支持对图像传感器进行编程,可以显示和评估图像,并能运行Python脚本来捕获和保存图像。其中内置了许多调试工具。另外还提供了ApBase库,这是配套的软件开发包(SDK),可支持开发用于图像传感器控制和图像显示的定制应用程序。
图像传感器通过一组“寄存器”进行配置和控制,配置好输出后,就会以设定的大小和速度(每秒帧数或“fps”)输出图像流。借助DevWareX和ApBase,图像传感器就能够执行这些操作。
安森美提供三种不同类型的
......长按二维码访问原文
星猿哲科技自研AL-M DLP 结构光 3D 相机MTBF 认证突破 8 万小时--机器视觉网 2024-05-14 15:22:08
2024-05-14 15:22:08 来源: 中国机器视觉网
近日,星猿哲科技自主研发的 AL-M DLP 结构光 3D 相机通过国际权威机构 SGS-CSTC* 的认证标准,正式取得 MTBF(Mean Time Between Failures,平均无故障时间)≥ 80,000 小时认证,相当于 10 年 7*24 小时连续稳定运行。同时,LS-XL 激光结构光 3D 相机以优秀的产品性能通过 MTBF ≥ 50,000 小时认证。
*SGS-CSTC: SGS 通标标准技术服务有限公司,是 SGS 集团和隶属于中国国家市场监督管理总局系统的中国标准科技集团共同成立的合资企业。SGS 集团是国际公认的从事检验、测试、质量保证与认证的知名国际机构。
MTBF 认证是产品质量与性能的重要保证和关
......长按二维码访问原文
热烈祝贺慕藤光荣获“专精特新”企业称号--机器视觉网 2024-05-14 15:15:10
2024-05-14 15:15:10 来源: 中国机器视觉网
近日,江苏省正式公布了2024年度专精特新中小企业(第一批)名单。江苏慕藤光精密光学仪器有限公司凭借在成像光学系统领域扎实的技术创新能力和优秀的行业应用成果,荣获“专精特新”企业称号。
江苏省专精特新企业评选是江苏省工信厅为响应中央和国务院《关于促进中小企业健康发展的指导意见》,推动中小企业向专业化、精细化、特色化、新颖化(简称“专精特新”)方向发展的关键措施。这一荣誉是中小企业评定中的最高等级,代表着企业在创新能力、核心技术开发、细分市场领导力和质量效益方面的卓越表现。
在本年度的评选中,慕藤光凭借其在光学镜头、工业光源、传感器等光学产品领域的卓越表现,成功获评为江苏省专精特新企业,这不仅是对慕藤光在光学成像技术领域的创新能力、核心技术掌握
......长按二维码访问原文
泰雷兹荣获Frost & Sullivan“2024年机场网络安全奖”--机器视觉网 2024-05-14 15:09:37
2024-05-14 15:09:37 来源: 中国机器视觉网
泰雷兹非常高兴地宣布,集团荣获Frost & Sullivan(弗若斯特沙利文,简称“沙利文”)2024年“机场安全之网络安全”类别的欧洲年度最佳公司奖。这一奖项体现了泰雷兹坚定不移地致力于提供创新、强大的网络安全解决方案,以保护机场基础设施、网络和系统抵御不断演变的威胁,同时确保顺畅无阻的乘客体验。
Frost & Sullivan将这一备受尊崇的奖项,授予那些通过创新和致力于满足不断变化的客户需求来展示市场领导力的公司。
泰雷兹走在创新与增长的前沿
作为全球多个最繁忙机场值得信赖的合作伙伴,泰雷兹深刻了解航空业所面临的独特需求与严苛条件。基于这些洞察,泰雷兹围绕智能安全、乘客旅程和运营效率三大支柱构建其机场解决方案,以应对如下需求:
......长按二维码访问原文
长光辰芯推出大靶面、高帧频背照式sCMOS图像传感器--机器视觉网 2024-05-14 14:56:42
2024-05-14 14:56:42 来源: 中国机器视觉网
2024年5月13日,长光辰芯推出1000万像素分辨率背照式、科学级CMOS图像传感器——GSENSE6510BSI。该产品除继承了GSENSE产品的高灵敏度、高量子效率、低噪声等优异特性之外,同时具备了大视场、高帧频等独特的性能,拓宽了sCMOS在高通量显微成像领域的应用。
高分辨率、超大视场角
GSENSE6510BSI具有3200 (H) x 3200 (V)的有效分辨率,采用了sCMOS经典的6.5μm x 6.5μm像素尺寸,其对角线达29.4mm,可满足大视场显微镜的应用需求。在背照式工艺的加持下,GSENSE6510BSI保持了高达95%的峰值量子效率,同时在800nm谱段,量子效率达到67%,使其满足从紫外到近红外宽谱段的
......长按二维码访问原文
茉丽特微型轴承检测--机器视觉网 2024-05-14 16:37:46
2024-05-14 16:37:46 来源: 中国机器视觉网
应用案例
微型轴承作为重要的基础工业产品,广泛应用于汽车、精密仪器、计算机等领域。随着工业机器人、工业机床、医疗器械的精密化发展,高速吹风机、高速吸尘器、折叠屏手机等消费类电子产品的兴起,使其需求和数量呈增长态势。而轴承表面的缺陷,例如划痕、黑点和凹坑,这些表面缺陷对轴承的质量和使用寿命有严重影响。
检测难点
在检测此类圆柱形侧面的产品时,使用面阵相机必须将产品绕轴多次启停旋转拍图,无疑会影响生产节拍,而且由于弯曲的金属表面特性,会出现亮度不均、反光、亮线等现象,提高了打光与算法处理的难度,此时使用线阵方案将更为合适。
方案推荐
镜头:MC-UR微距镜头(极致小体积),相机:2K 7μm C-Mount 线扫相机。
MC-UR系列
......长按二维码访问原文
海研科技360°AI视觉检测系统助力制造业智能化发展--机器视觉网 2024-05-14 16:26:16
2024-05-14 16:26:16 来源: 中国机器视觉网
随着科技浪潮的席卷,人工智能、机器人控制和机器视觉技术正逐渐成为推动制造业智能化的核心力量。在这一背景下,海研科技凭借其深厚的技术积累和创新能力,成功推出了360°AI视觉检测系统,这一高端产品不仅彰显了海研科技的技术实力,更为推进制造业智能化发展作出了积极贡献。
海研科技360°AI视觉检测系统是一款集AI智能、机器人控制和机器视觉技术于一体的高端产品。该系统采用了先进的深度学习算法框架,结合自主研发的外观检测模型,实现了产品360°的字符识别、目标定位、缺陷检测及精准分类的快速化生产应用。无论是外观精细化检测,还是印刷品及logo防错检测,甚至是装配缺陷检测,该系统都能提供高效、准确的解决方案。
在外观精细化检测方面,海研科技360°AI
......长按二维码访问原文
可用于高压电网巡检的Photonis日盲紫外相机--机器视觉网 2024-05-14 16:07:55
2024-05-14 16:07:55 来源: 中国机器视觉网
Photonis 品牌介绍
Photonis是全球像增强器的领导厂商,主要从事光电子器件、检测器和成像系统的研究、开发和制造,具有80 多年的历史,在日盲紫外相机、MCP、像增强器、红外机芯、融合成像机芯等方面具有顶尖的技术实力,其产品广泛应用在微光增强、工业监测、质谱仪器、离子探测等领域。
Photonis在2021年推出的INocturn系列日盲紫外相机,不仅可以提供光子级别的紫外日盲响应,而且可以为客户提供可媲美于工业相机的成本优势,使得紫外日盲成像技术在电晕监测上的应用有了工业化、规模化的可能。
成像技术
受限于技术及成本因素,早期的日盲紫外探测器一般采用工业相机加日盲滤光片的方案,这种方案无法对太阳光产生很好的截止,相机本身对于
......长按二维码访问原文
大族视觉PACK装配综合集成视觉方案解析--机器视觉网 2024-05-14 15:45:11
2024-05-14 15:45:11 来源: 中国机器视觉网
案例背景
PACK装配综合集成视觉方案
PACK电池包的组成主要包括电池模块、机构系统、电气系统、热管理系统和BMS几个部分;其中机构系统主要由电池PACK上盖、托盘、各种金属支架、端板和螺栓组成,可以看作是电池PACK的“骨骼”,起到支撑、抗机械冲击、机械振动和环境保护(防水防尘)的作用。
PACK装配过程中存在很多柔性线路及压装拧紧,自动化难度高,投入产出比低,大族视觉以精准、可靠的综合集成视觉方案,为产线提供智慧、高效的服务,助推智能智造数字化升级。
项目方案解析
· PCM板安装及自动拉铆
将相机1安装在机械手上跟随移动,拍摄产品对角定位PACK板,引导机械手抓取;在PCM板上料区安装相机2和相机3,从下向上拍摄定位PCM板。
......长按二维码访问原文
腾讯发布业界首份行业大模型调研报告:向 AI 而行,共筑新质生产力--机器视觉网 2024-05-14 15:37:08
2024-05-14 15:37:08 来源: 中国机器视觉网
2024年政府工作报告明确提出,要“深化大数据、人工智能等研发应用,开展‘人工智能+’行动,打造具有国际竞争力的数字产业集群”。近年来,大模型成为人工智能领域的最大热点。如何有效将大模型技术融入各行各业的实际应用,助力生产力革新和产业升级,成为业界越来越关注的核心问题,也促进了行业大模型的发展。
今日,腾讯研究院正式发布《向 AI 而行,共筑新质生产力——行业大模型调研报告》,前后历时近1年研究,基于对超过百名各界专家访谈(百人百问),深入剖析了行业大模型的发展背景、应用进展、实现方式、安全与治理,以及未来的发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。
大模型的核心突破是什么?
与传统AI仅能处理单一任务相比,大模
......长按二维码访问原文
华睿科技助力锂电行业搭建全工序视觉检测解决方案--机器视觉网 2024-05-13 14:46:44
2024-05-13 14:46:44 来源: 中国机器视觉网
随着新能源汽车行业的蓬勃发展,锂电池的生产质量愈发受到关注。在锂电池制程的制芯环节中,需要用到一种将模切和叠片工艺合二为一的高效设备——切叠一体机。针对其多角度、高精度的质量检测需求,华睿科技特推出了切叠一体机全工序视觉解决方案,满足不同工位的视觉检测需求。
工艺流程及检测工位
方案设计
· 冲切定位
方案需求:5MP面阵相机+面光源。定位方式:该方案可通过检测相邻 2 个极耳进行定位,提供冲切坐标进行识别。
现场检测效果:
· 模切后尺寸检测
方案需求:12MP面阵相机+面光源+同轴光源。尺寸测量:该方案可检测极片长宽、极耳长宽、极耳边距、V角形状高度、宽度、角度或面积,极片对角线等尺寸。
现场检测效果:
· 极片正反面缺陷检
......长按二维码访问原文
未来以来,你好具身智能工业机器人--机器视觉网 2024-05-13 14:32:36
2024-05-13 14:32:36 来源: 中国机器视觉网
具身智能理论根源于“具身认知”(Embodied Recognition),包括人类在内的一切智能体的认知能力是由智能体自身结构决定的,并在此基础上构建自己的世界模型。而这种认知又直接影响智能体的高级心理活动,诸如:推理,决策等。
你好,具身智能
· 具身智能 “探索-利用”的学习范式
从认知产生的机制到智能体决策依赖的世界模型,均受制于智能体具体的物质形态。具身智能理论挑战了包括笛卡尔二元论在内的诸多认知理论,建立起了将“身”与“智”统一的理论框架,将智能体和周围环境看作一个系统,通过“躯体”与外界环境进行互动,再从外界对智能体的动作产生的反馈获取信息,建立对环境的认知。整个认知过程遵循“探索-利用”(exploration-expl
......长按二维码访问原文
视展光电推焦车炉门挂钩成像智能监测与预警系统--机器视觉网 2024-05-13 14:25:59
2024-05-13 14:25:59 来源: 中国机器视觉网
应用背景
推焦行车是将充分燃烧的焦炭推入焦罐的重要设备,目前主要依赖驾驶员人工观测或通过摄像设备间接观察取门挂钩是否完全挂上,驾驶员的操作经验与操作杆力度反馈很容易出现视觉误差与判断失误,引发炉门脱落事故。
产品介绍
推焦车炉门挂钩成像智能监测与预警系统通过在取门挂钩上安装小型高温智能监控相机,在不影响设备作业的情况下,给予驾驶员良好的视觉判断依据,系统在作业过程中对挂钩进行实时视觉识别与判断,在出现未挂上或未完全挂上情况时,及时进行声光警示,降低事故发生概率。
系统功能
焦炉炉门挂钩实时视频监控:可实时采集显示焦炉炉门挂钩状态视频图像,推焦车驾驶员可通过视频画面更真实地掌握焦炉炉门现场情况。
智能识别监测炉门挂钩状态:系统设置炉
......长按二维码访问原文
广州LET展即将开幕,重磅新品类首次亮相―新闻频道- 视觉系统设计 2024/5/13 22:32:25
展会时间:2024年5月29日-31日
展会地点:广州 • 中国进出口商品交易会展馆
展位信息:D区18.1馆 D20
海康机器人深入研究产业结构,为客户提供量身定制和高效的全场景解决方案。在华南地区不断深耕,为大湾区注入动力,并在全国范围内积极布局。本次展会将携以下诚意之作亮相——
重磅新品,首次亮相
海康机器人凭借其在机器视觉和移动机器人领域的强大技术和研发实力,再次突破技术壁垒,推出全新产品——复合机器人!
高精度、高柔性、高拓展性、易操作、人机协作等特点为产品赋予新的魅力,实现了更高的灵活性和多功能性,产品集成度高,整体性强,满足市场柔性化需求。海康机器人柔性赋能半径再增加,眼、脚、手真正有机融合,给行业带来全新的效率升级体验!
智能拓展柔性半径,数智赋能3C大流通
智能化的时代浪潮,不
......长按二维码访问原文
星猿哲科LS系列3D相机通过MTBF认证突破 8 万小时―新闻频道- 视觉系统设计 2024/5/13 22:08:17
近日,星猿哲科技自主研发的 AL-M DLP 结构光 3D 相机通过国际权威机构 SGS-CSTC* 的认证标准,正式取得 MTBF(Mean Time Between Failures,平均无故障时间)≥ 80,000 小时认证,相当于 10 年 7*24 小时连续稳定运行。同时,LS-XL 激光结构光 3D 相机以优秀的产品性能通过 MTBF ≥ 50,000 小时认证。
(*SGS-CSTC: SGS 通标标准技术服务有限公司,是 SGS 集团和隶属于中国国家市场监督管理总局系统的中国标准科技集团共同成立的合资企业。SGS 集团是国际公认的从事检验、测试、质量保证与认证的知名国际机构。)
MTBF 认证是产品质量与性能的重要保证和关键衡量指标,对于 3D 相机这类高精度视觉设备而言,MTBF 的高低直
......长按二维码访问原文
海克斯康2024“世界计量日”主题大会重磅来袭―新闻频道- 视觉系统设计 2024/5/13 21:59:10
计量夯基
仪器仪表助力新质生产力
海克斯康2024“世界计量日”主题大会
中国 · 青岛 · 2024.05.20
一年一度的520即将来临,在这个浪漫特殊的日子,海克斯康再次邀请全国计量人共度一场智造盛宴,加速涌动创新风潮。
今年是海克斯康第三次举办“世界计量日”主题大会,海克斯康将以时代潮流为导向,以“计量夯基 · 仪器仪表助力新质生产力”为主题,围绕智能检测发展趋势及最新前沿技术、质量管理、数字化转型、新质生产力等,与行业同仁共同探讨制造业如何夯实计量基础,为企业提质向新,迈向产业链中高端添砖加瓦。
专家齐聚
共探新质生产力发展之路
海克斯康携手计量业、制造业和智能制造生态圈的重磅专家&学者,带来精彩纷呈主题演讲,分享前沿技术实践,共探行业新质生产力发展方向。
技术引领
数智化技术成果
......长按二维码访问原文
东声智能斩获两项国际大奖―新闻频道- 视觉系统设计 2024/5/11 9:17:16
5月6日-9日,北美地区最大规模的工业自动化展览会——Automate 2024在芝加哥隆重举办。此次盛会由全球视觉协会、美国机器人行业协会和机动控制协会共同主办,吸引了全球目光。在这场国际性的科技盛宴中,东声智能的明星产品组合在展会上吸睛无数。全球领先的Handdle系列视觉软件平台、2D/2.5D/3D自研光学成像系统、AI智能相机以及一系列工业AI视觉行业解决方案等震撼亮相,向全球客户展示了来自中国工业AI视觉的顶尖力量。
全球技术巅峰汇聚
东声智能斩获两项国际大奖
作为全球最大的工业自动化展览会之一,本届AUTOMATE 2024更是技术的巅峰汇聚,东声智能Handdle AI算法平台和AI智能相机拿下全球机器视觉权威媒体Vision Systems Design 2024 Innovators
......长按二维码访问原文
专为协作臂打造!迁移科技工业3D相机Pixel Mini ,让轻巧突破想象―新闻频道- 视觉系统设计 2024/5/10 10:05:26
迁移科技今日重磅发布自主研发的Epic Eye Pixel Mini超小体积工业3D相机,该相机采用蓝色条纹结构光,在小体积、轻重量、高精度、快成像、高性价比等方面,为同基线产品树立全新标杆。
该系列产品的设计充分考虑了现代工业对柔性化精确作业的需求,为协作机器人和复合机器人「眼在手上」的应用场景提供了优秀的点云成像精度,显著提高作业准确度和成功率。
“黄金组合”引领制造新纪元
协作机器人和复合机器人凭借着灵活性和智能性,迅速成为工业4.0时代的宠儿。高工机器人产业研究所(GGII)预计到2026年,中国协作机器人销量将突破10万台大关。届时将会释放更多小型化高精度工业3D相机市场需求。
“3D视觉+协作机器人/复合机器人”的黄金搭配,不仅赋予机器人更全面的感知与决策能力,而且显著提升了生产线的柔性
......长按二维码访问原文
第十三届制造业物流与仓储智能化工程大会暨第二届全球叉式移动机器人峰会―新闻频道- 视觉系统设计 2024/5/9 21:45:55
5月9日,第十三届制造业物流与仓储智能化工程大会暨第二届全球叉式移动机器人峰会在广东佛山顺利举办。
会上,《叉式移动机器人(AGV/AMR)产业发展蓝皮书(2024版)》正式发布。
华睿科技作为参编单位受邀参与会议,与众多移动机器人厂商、集成商及应用终端用户齐聚一堂,就当前行业发展现状及未来趋势进行了深入探讨。
随着科技发展,制造业和仓储物流业对于产线智能流转及仓储分拣的无人化要求越来越明显。移动机器人(AGV/AMR)不仅能够串联产线及仓储的柔性化搬运,并且对于链接各种自动化设备也独具优势。其中,无人叉车作为备受关注的细分品类,面向制造业物流与仓储智能化提供多种解决方案。
华睿科技自主研发的叉式移动机器人能提供更高的运行效率与运行精度,更强的场景适应性,深受客户喜爱。
窄体叉车FD150
FD15
......长按二维码访问原文
长光辰芯推出大靶面、高帧频背照式sCMOS图像传感器―产品聚焦频道- 视觉系统设计 2024/5/13 22:21:26
2024年5月13日,长光辰芯推出1000万像素分辨率背照式、科学级CMOS图像传感器——GSENSE6510BSI。该产品除继承了GSENSE产品的高灵敏度、高量子效率、低噪声等优异特性之外,同时具备了大视场、高帧频等独特的性能,拓宽了sCMOS在高通量显微成像领域的应用。
高分辨率、超大视场角
GSENSE6510BSI具有3200 (H) x 3200 (V)的有效分辨率,采用了sCMOS经典的6.5μm x 6.5μm像素尺寸,其对角线达29.4mm,可满足大视场显微镜的应用需求。在背照式工艺的加持下,GSENSE6510BSI保持了高达95%的峰值量子效率,同时在800nm谱段,量子效率达到67%,使其满足从紫外到近红外宽谱段的观测需求。
GSENSE6510BSI QE 曲线
高帧频、高数据
......长按二维码访问原文
珩图科技 VRH9-020B 结构光3D相机―产品聚焦频道- 视觉系统设计 2024/5/11 8:53:07
高精度迅猛龙VRH系列 新型号上线
珩图科技 | VRH9-020B 震撼亮相
高精度迅猛龙(High-accuracy Velociraptor)正式推出全新型号的面扫结构光3D相机——VRH9-020B。这款产品不仅延续了VRH系列一贯的高性能高性价比定位,更在配置性能上实现了全新的升级。VRH9-020B以其更小、更精密的视野范围和显著提升的精度要求,再次彰显了我们对行业需求的敏锐把握与不断创新。
VRH9-020B扫描速率高达1.4帧/秒,视野范围最小可达24mm;采用DLP技术,具有强抗干扰能力;Z 轴方向重复精度可达 0.6μm,可应用于半导体、3C电子等行业3D 高精度检测。
高精度迅猛龙系列以其卓越的性能、可靠的质量和广泛的应用领域再次彰显了珩图科技在自主研发领域的实力!
性能升级
......长按二维码访问原文
中长波红外自动对焦镜头模组―产品聚焦频道- 视觉系统设计 2024/5/11 8:43:27
产品介绍
红外自动对焦镜头模组是一种特殊的摄像头模组,它结合了红外技术和自动对焦功能。红外自动对焦镜头模组通常用于需要在低光或无光环境下进行清晰拍摄的应用,例如夜间监控、红外成像等。
中波红外自动对焦镜头模组
自动对焦原理
波长光电自动对焦模组聚焦检测方法主要是对比度法,该方法是通过检测图像的轮廓边缘实现自动对焦的。图像的轮廓边缘越清晰,则它的亮度梯度就越大,或者说边缘处景物和背景之间的对比度就越大。反之,失焦的图像,轮廓边缘模糊不清,亮度梯度或对比度下降;失焦越远,对比度越低。利用这个原理,FPA传感器对镜头实时传输的中心视场对比度进行分析,计算前后对比度差值,对比度差值会形成一个梯度曲线,当下一个对比度由爬升值呈下降值时,传感器会驱动电机返回由编码器记录上一次的镜头对焦位置,对焦完成。
波长光电自
......长按二维码访问原文
海康机器人通用型CU系列工业相机―产品聚焦频道- 视觉系统设计 2024/5/10 21:32:05
海康机器人推出了新一代600万、2000万分辨率卷帘快门工业相机,该相机依托于先进的低能耗技术平台,融合了全新升级的硬件设计方案。
通过精简相机资源、选配POE模块,保留“恰到好处”的功能,在满足广泛视觉检测与分析应用需求的同时,还提供了超高性价比。
近红外波段响应提升
该相机近红外波段的响应效率显著提升,能够在近红外光环境下保证成像效果,在常见的近红外应用中,如光伏、激光检测、眼科医疗等应用中,能够确保细节的获取与图像亮度效果的呈现。
灵活适配 超高性价比
该相机在确保成像质量的同时,还具有极为出色的性价比,支持POE功能的选配,可根据具体需求灵活调整,进一步优化硬件投入的成本。
产品型号
典型应用场景
转自:海康机器人Hikrobot
注:文章版权归原作者所有,本文仅供交流学习之用,如
......长按二维码访问原文
深视智能高速相机实时观测熔化极氩弧焊熔滴过渡―技术与应用频道- 视觉系统设计 2024/5/13 22:03:21
熔化极氩弧焊
焊接作为工业“裁缝”是工业生产中重要的加工手段。氩弧焊,是使用氩气作为保护气体的一种焊接技术,又称氩气体保护焊。
其中,熔化极氩弧焊(MIG焊)是使用熔化电极的氩弧焊。焊丝在送丝滚轮的输送下,通往焊接区,与母材产生电弧,熔化焊丝与母材形成熔池。氩气从喷嘴流出进行保护,焊枪移动后即形成焊缝。
焊缝成形图
由于熔化极氩弧焊对熔池的保护要求较高,如果保护不良,使焊材发生氧化和吸收有害气体,焊缝表面便容易起皱皮,影响焊缝成形效果和接头力学性能。因此,需要引入高速相机实时关注熔化极氩弧焊的焊接的动态过程及焊渣飞溅状态。
MIG焊熔滴过渡
为了观察工艺的好坏,通过便捷支架将深视智能高速相机SH6-109-M-40安装在焊接设备前,采用专业滤光手段,将强光过滤,实现实时画面观察熔池产生。
通过高速
......长按二维码访问原文
堡盟VCXG工业相机助力食品包装业自动化―技术与应用频道- 视觉系统设计 2024/5/11 9:25:53
包装是食品工业重要的生产环节,良好的包装工艺能够提升产品附加值,为品牌带来信誉与销量方面的提升。堡盟VCXG系列工业相机在食品包装工业一直有着良好的发挥,今天我们介绍它在食品包装中的优秀应用。
食品包装检测的视觉智能解决方案
包装的完好程度直接影响着品牌的口碑与声誉,试想一下如果消费者买到了包装有破损或者产品数量不符合的产品,那么肯定会影响其下一次购买的选择。因此在最后质检的过程中都需要用VCXG相机对零食的包装情况进行检测,确保零食的包装完好无损,以及内包装产品数量的准确。
堡盟VCXG工业相机可以完美解决食品包装检测的问题。通过安装多个相机在产线的多个角度进行拍摄采集,组成矩阵,合成后进行图像分析,能够检测包装中出现的叠片,多片、少片、破片,以及外包装完整度的问题,视觉矩阵方案甚至还能检测日期、切包等
......长按二维码访问原文
机器视觉接口概述(2) :CXP标准的全面解析―技术与应用频道- 视觉系统设计 2024/5/10 21:26:35
第二期重点介绍CoaXPress(2010年发布)机器视觉接口,旨在实现长电缆上的高速数据传输。CXP标准最早于2008年公布,第一个版本CXP 1.0于2011年初发布,随后的CXP 1.1标准于2011年末发表,并于2013年更新,增加了一些改进和附加功能。最新的标准CXP 2.0于2019年发布,包括更高速率和新功能。
关于针对工业机器视觉的不同CXP标准的概述
除上面的表格之外,随着时间的推移,在机械、电气和协议级别上进行了许多改进,使得该标 准的实施过程更容易、更可靠。
4通道DIN CXP电缆
2通道DIN CXP电缆
单通道DIN CXP电缆
单通道CXP电缆–HD BNC
CXP接口的特长:
● 高吞吐量:最新标准下,CXP提供最大的原始数据吞吐量,4xCXP-12连接可提供高达
......长按二维码访问原文
AI检测软件助力PCB产业流程完善及质量提升―技术与应用频道- 视觉系统设计 2024/5/9 21:19:07
摘要
Sherlock AI是一个在PCB行业流程完善及质量提升中发挥作用的关键工具。PCB市场规模巨大,而随着技术的进步,对于更小、更高性能零件的需求也不断增加。然而,传统算法在AOI检测中存在限制,特别是对于复杂的瑕疵检测。Sherlock8 AI软件通过结合AI深度学习技术,提高了检测准确性和速度,使PCB制造商能够更好地应对质量控制挑战。这一技术的应用有望在未来推动PCB行业的进一步发展,并提升整个电子信息产业的生产效率和质量水平。
PCB行业发展至今,其应用领域已几乎涉及所有的电子产品,主要涵盖通信、消费电子、汽车电子、服务器、工控、医疗、航空航天等行业。PCB行业的成长与下游电子信息产业的发展势头密切相关,两者相互促进。未来,随着电子信息产业的持续发展,PCB的应用领域将越发广泛。PCB的主要功
......长按二维码访问原文
高德智感IR-Perfclear实时超分技术增强画质增―技术与应用频道- 视觉系统设计 2024/5/9 16:18:45
红外热像仪的分辨率是什么?
红外热像仪的分辨率即是红外探测器的分辨率,有120x90、256x192、384x288、640x480、1024x768、1280x1024等等规格,分辨率越高,图像画质就越好,探测器分辨率的高低是选择热像仪的一个重要参数,它会直接影响最终的成像效果。
通常来说,更高的分辨率意味着每个图像包含更多的信息,就能看到更丰富、更清晰的图像细节,从而获得更精确的测量结果,对热图像的分析必然也越准确。尤其是当用户需要识别更小的测量对象或分辨更细小的温度差异的时候,高分辨率的图像质量是必不可少的。
IR-Perfclear实时超分技术
因此,高德智感开发了一种用于实时提升红外热像图分辨率的特殊技术——IR-Perfclear实时超分技术。实现4倍像素放大,让用户可以轻松地改善图像质量,
......长按二维码访问原文
高性价比之选——通用型CU系列工业相机,让高质量检测触手可及! 2024/3/28 14:00:00
资讯 > 新品速递
作者:海康机器人Hikrobot2024.05.10阅读 1107
通过精简相机资源、选配POE模块,保留“恰到好处”的功能,在满足广泛视觉检测与分析应用需求的同时 CONTROL ENGINEERING China版权所有 ,还提供了超高性价比。
01 近红外波段响应提升
该相机近红外波段的响应效率显著提升www.cechina.cn,能够在近红外光环境下保证成像效果,在常见的近红外应用中,如光伏、激光检测、眼科医疗等应用中www.cechina.cn,能够确保细节的获取与图像亮度效果的呈现。
02 灵活适配 超高性价比
该相机在确保成像质量的同时,还具有极为出色的性价比 CONTROL ENGINEERING China版权所有 ,支持POE功能的选配
......长按二维码访问原文
一年出货3万台!海康机器人为何能发展如此惊人! 2024/3/28 14:00:00
资讯 > 业界新闻
作者:石林才2024.05.09阅读 1566
在两个总面积超过3000平米的宽敞展厅内,移动机器人如流水般穿梭其间。它们或背负着货物箱,或推动着工件,无论是直线行驶、转弯还是避让障碍,都流畅自如,无需人工指导,也无需任何外部干预www.cechina.cn,它们自主地在各个工位之间高效移动。同时,工位上的机械臂如同拥有“眼睛”一般,迅速而精确地进行抓取、旋转和放置,完成码垛、拆垛、拆包等一系列复杂操作。一切都在无人化的情况下自主运行,仿佛让人置身于一个未来工厂之中。
01 柔性制造点燃“智造”引擎
全球范围内不确定因素的加剧和技术进步的日新月异,也让传统工厂面临着全新的机遇和挑战:传统工厂以规模化、标准化的生产,长期以来支撑着工业社会的发展,随着全球商业环境的不断变
......长按二维码访问原文
C# ConcurrentDictionary线程安全字典 的 TryUpdate怎么用-.net程序调试-少有人走的路 2024-05-14 14:51:42
勇哥注:
ConcurrentDictionary 是线程安全字典,它能保证在多线程读写的情况下,数据不会乱套。
其中TryUpdate的第三个参数怎么用呢?
网上大部分都是抄的AI的这个例子,那个out从何而来呢? 这答案基本上是狗屁打胡说。
这第三个参数指的是: 在当前值等于参数3的情况下,才更新新值newvalue,否则更新失败返回false。
比较奇怪的作用,勇哥也想不出为啥这样设计。
见下面的例子:
static void Main(string[] args) { ConcurrentDictionary
......长按二维码访问原文
vs2022 的python支持,hello world程序-python-少有人走的路 2024-05-13 21:33:18
创建后,如果运行不起来,是因为没有安装Python的解释器和运行时。
可以按vs的提示下载安装Python的安装包,或者安装 Anaconda。
可以参考勇哥之前写的一个贴子:http://www.skcircle.com/?id=1764
可以安装 Python 2、Python 3、Miniconda、Anaconda 2 和 Anaconda 3 的 32 位和 64 位变体。 每个选项都包含发行版的解释器、运行时和库。 具体来说,Anaconda 是开放数据科学平台,包含各种预安装的包。 Visual Studio 会自动检测现有的 Python 安装。
Anaconda安装后的样子如下图:
以上环境搭好后,按ALT+i 唤出python的测试窗口。 输入2
......长按二维码访问原文
IJCV 2024 | Splatting+Optical Flow=SOTA!国防科大最新提出多帧光流框架SplatFlow 2024-05-13 12:10
1. 导读
多帧设定有望潜在地缓解光流估计(OEF)中挑战性的遮挡问题。遗憾的是,多帧OFE(MOFE)尚未得到充分的研究。本工作提出全新的MOFE方法SplatFlow,其引入了可导Splatting变换对前一帧的运动特征进行对齐,并设计了一种 Final-to-All 的嵌入方法,将对齐后的运动特征输入到当前帧的估计中,从而对现有的两帧骨干网络进行重构。大量的实验表明,SplatFlow在KITTI2015和Sintel基准测试中均实现SOTA,大大优于所有已发布的方法。本工作现已发表在计算机视觉顶级期刊《International Journal of Computer Vision》上。
原文:IJCV 2024 | Splatting+Optical Flow=SOTA!国防科大最新提出多帧光流框
......长按二维码访问原文
港科大最新!力压Transformer?首篇Mamba综述来了! 2024-05-13 08:08
写在前面&笔者的个人理解
Mamba是一种新的选择性结构状态空间模型,在长序列建模任务中表现出色。Mamba通过全局感受野和动态加权,缓解了卷积神经网络的建模约束,并提供了类似于Transformers的高级建模能力。至关重要的是,它实现了这一点,而不会产生通常与Transformer相关的二次计算复杂性。由于其相对于前两种主流基础模型的优势,曼巴展示了其作为视觉基础模型的巨大潜力。研究人员正在积极地将曼巴应用于各种计算机视觉任务,导致了许多新兴的工作。为了跟上计算机视觉的快速发展,本文旨在对视觉曼巴方法进行全面综述。
本文首先描述了原始曼巴模型的公式。随后,我们对视觉曼巴的综述深入研究了几个具有代表性的骨干网络,以阐明视觉曼巴中的核心见解。然后,我们使用不同的模式对相关作品进行分类,包括图像、视频、点云、
......长按二维码访问原文
DLIA工业缺陷检测:推动人工智能技术在工业缺陷检测中的应用 2024-05-14 17:08
随着工业4.0时代的到来,智能化、自动化成为了制造业转型升级的关键驱动力。在这一浪潮中,DLIA工业缺陷检测系统以其独特的优势,在工业领域脱颖而出,成为推动人工智能技术深入应用的重要力量。DLIA工业缺陷检测系统基于深度学习算法,这是一种模仿人类大脑神经网络工作方式的机器学习技术,特别擅长于从大量数据中自动提取特征并进行分类或预测。
在工业缺陷检测的场景下,DLIA工业缺陷检测系统被用来识别产品表面或内部的微小瑕疵,如裂纹、划伤、污渍、尺寸偏差等。系统通常包括高分辨率工业相机、图像处理软件、以及一个经过大量标注样本训练的深度学习模型。
DLIA工业缺陷检测的应用几乎覆盖了所有需要精密质量控制的制造行业,尤其是在电子组装领域的检查电路板焊点、元件贴装是否完整、正确,提高电子产品
......长按二维码访问原文
Apple助力3DGS重大突破!3DGS竟能实现新姿态合成? 2024-05-13 10:04
论文标题:
HUGS: Human Gaussian Splats
论文作者:
Muhammed Kocabas, Jen-Hao Rick Chang, James Gabriel, Oncel Tuzel, Anurag Ranjan
项目链接:
https://github.com/apple/ml-hugs
导读:
在AR和VR领域,重建逼真的虚拟人体化身始终是一项挑战,特别是因为人体化身以及其衣物、皮肤和头发等都会经历复杂的非刚性形变。
Avatar,电影阿凡达的英文名即为Avatar,重建虚拟的人体化身是否和通过神经连接化身阿凡达有相似之处呢~
一种常见的重建技术是利用时间编码的方法,通过一个多层感知机(MLP)学习基于时间变化的3DGS表达。然而,这种方法通常只能重现已有视角下的
......长按二维码访问原文
王牌飞行员申请出战!- MambaOut: Do We Really Need Mamba for Vision? 2024-05-14 16:28
逆天的Github Issue
文章主页:https://arxiv.org/pdf/2405.07992
代码主页:https://github.com/yuweihao/MambaOut
摘要 - Mamba,一种采用状态空间模型(SSM)的类RNN令牌混合体系结构,最近被引入以解决注意力机制的二次复杂性问题,并随后被应用于视觉任务。然而,Mamba在视觉任务中的表现通常不如卷积模型和基于注意力的模型。本文中,我们深入探讨了Mamba的本质,并从概念上得出结论,Mamba非常适合于具有长序列和自回归特征的任务。对于视觉任务,由于图像分类不符合这两种特征,我们假设Mamba对于这项任务是不必要的;检测和分割任务虽然也不是自回归的,但它们符合长序列的特征,因此我们认为仍然值得探索Mamba在这些任务中
......长按二维码访问原文
MAAL 详细解读 2024-05-13 20:41
Affordance 即可供性,指环境属性使得个体的某种行为得以实施的可能性。在 3D 场景下,如果我们想要让机器人和环境中的物体做交互,让机器理解物体可供性是十分基础和必要的一个步骤。机器需要去理解物体在哪里可以施加作用力,并可以施加什么样的动作。例如,如果机器人需要操作桌面上的水瓶,它需要理解何处可以抓取和如何抓取,而后通过执行动作来移动水瓶。
进一步的,类似水瓶这样的简单物体并不要求机器有深刻的理解能力。它可以抓取瓶身、瓶颈等任意地方,都可以挪动瓶子。现实生活中,人类操作物体的需求要远比这复杂。我们会面临大量的,带有铰链的,有特殊结构的物体,比如柜子、水龙头、冰箱、洗衣机等等。这些物体存在相对复杂的内部构造,不仅仅是挪动整个物体,我们常常需要根据物体的内在结果来操作物体,比如打开柜门,按下按钮等等。这一
......长按二维码访问原文
ICML 2024 | 文生图新SOTA!Pika北大斯坦福联合推出RPG:多模态助力解决文生图两大难题 2024-05-14 11:09
前言 近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3。
本文转载自新智元
仅用于学术分享,若侵权请联系删除
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
CV方向的准研究生们,未来三年如何度过?
招聘高光谱图像、语义分割、diffusion等方向论文指导老师
近日,北大、斯坦福、以及爆火的Pika Labs联合发表了一项研究,将大模型文生图的能力提升到了新的高度。
论文地址:https://arxiv.org/pdf/2401.11708.pdf
代码地址:https://github.com/YangLing0818/RPG-Diffusi
......长按二维码访问原文
OCR识别产品 最全整理汇总 2024-05-13 19:32
本文主要围绕OCR(Optical Character Recognition,光学字符识别【文字OCR识别】、视觉AI识别算法)技术展开,提供了一系列高效、精准的识别解决方案。其中在OCR这部分,可以介绍的产品线繁多。可“详细可点击了解OCR产品”
OCR系列产品主要涵盖以下几个方面:
卡证照类识别:
实名认证业务会大量用到各类证件OCR识别
技术能力:支持身份证、银行卡、行驶证、驾驶证、护照、营业执照等数十种卡证、执照等OCR文字识别。采用先进的图像处理和深度学习技术,能够快速、准确地识别卡证上的文字信息。
应用场景:在金融服务、政府事务、企业办公等领域,卡证照类OCR文字识别产品可以帮助用户快速录入和验证身份信息,提高业务处理效率。
2. 车辆相关类识别:
车辆类OCR识别会用到大量车相关证
......长按二维码访问原文
解析VISION TRANSFORMERS NEED REGISTERS 2024-05-13 00:57
发现问题
图1
在object discovery任务上,一般自监督模型(如DINO)要比监督模型的效果更好,但是在测试DINOv2的时候,却发现性能不如DINO。可视化feature后,发现DINOv2的特征存在artifacts,具体表现为在简单背景上出现norm异常的token(图1中的小亮点,图2中的红箭头)。
分析问题
图2
这些high-norm tokens在模型训练的中后期才会显现,且主要出现在大型模型(ViT-L及以上)的中后层的layer。通过实验验证,他们通常对应于图像中信息量较低的区域,如单调的背景;并且模型在推理过程中这些区域的token用于编码全局(global)信息,牺牲了局部(local)信息。
解决问题
图3
如图3的黄色部分,作者在ViT的输入序列中引入额外的
......长按二维码访问原文
浅谈工业用LED面光源 2024-05-14 14:57
在机器视觉系统中,光源作为不可或缺的一部分,能够提高目标成像效果,增强检测效果。光源的选择至关重要,选到不合适的会影响成像及检测效果。针对不同的检测对象,不同的形状光源应运而生。我们来看看最常用的LED光源之一——面光源。
下面以CCS的光源为例,TH2平面光源。
它是高输出型标准平面光源。可以对应高速化的生产线,为提高生产效率做出贡献。主要有以下特点:
1、实现了更高一级的高亮度
实现大幅度超越传统产品的亮度输出。
2、丰富的产品种类
提供丰富的产品种类,满足各种需求,备有各种类型,产品阵容共有73种机型。
3、可根据环境自由安装
采用框架结构的安装方式,除了侧面以外,主体底面部分也加工有安装用螺丝孔。
一、类型
TH2系列面光源可分为高指向性型、大型、宽型、开孔型。
TH2系列面光源
......长按二维码访问原文
ICLR 2024 杰出论文奖出炉!两篇国内论文获得提名! 2024-05-13 23:18
前言 今年共评选出 5 篇杰出论文奖以及 11 篇荣誉提名。
本文转载自机器之心
仅用于学术分享,若侵权请联系删除
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
CV方向的准研究生们,未来三年如何度过?
招聘高光谱图像、语义分割、diffusion等方向论文指导老师
ICLR 全称为国际学习表征会议(International Conference on Learning Representations),今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。
在机器学习社区中,ICLR 是较为「年轻」的顶级学术会议,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,2
......长按二维码访问原文
Diffusion Inversion技术 2024-05-13 15:38
在图像生成/编辑领域中,Inversion 技术是指将一张(真实)图片转换为生成模型对应的 latent,要求将这个 latent 输入到生成模型中之后,能够重构出原始图片。这项技术是进行图像编辑的重要基础。本文将介绍扩散模型相关的 Inversion 技术。
背景:Diffusion加噪与去噪
首先我们简单介绍一下扩散模型的加噪与去噪,这里不会具体推导,而是直接给出采样过程的公式。本文考虑的都是 LDM,即需要用 vae 来进行真实图片空间与 latent 空间之间的相互变换,并在 latent 空间中进行加噪与去噪的过程。
加噪
加噪过程,是指给定一张真实图片的 latent x_0 ,不断地采样高斯噪声 \epsilon\sim\mathcal{N}(0,\mathbf{I}) ,按照预先定义的
......长按二维码访问原文
南京大学三维视觉实验室招生[2025年入学] 2024-05-14 15:45
南京大学智能科学与技术学院三维视觉实验室(NJU-3DV)招募博士后研究员、研究助理、博士生及硕士生(2025年入学)。实验室聚焦三维计算机视觉方向研究,包括三维重建、数字人建模、可微渲染、三维生成等课题。 欢迎自驱力强、有志于在三维视觉领域做出有影响力工作的优秀学者及同学联系 !
导师简介
姚遥,南京大学智能科学与技术学院副教授,国家级人才计划青年项目入选者。前苹果公司高级研究员,Altizure创始团队核心成员(被苹果收购)。主要研究方向为三维计算机视觉,包括三维重建、可微渲染及三维内容生成。代表工作包括 MVSNet 系列工作、BlendedMVS数据集及NeILF系列工作,文章总引用数超3000,曾获2020年国际模式识别大会最佳学生论文奖。个人主页:https://yoyo000.github.i
......长按二维码访问原文
俄国黑客的地理间谍项目:geospy,一张图片告诉你准确位置 2024-05-13 15:33
GeoSpy是一款利用人工智能技术进行地理定位的工具。它通过分析用户提供的照片,能够识别出照片中的各种细节,如光线、植物、建筑风格、天气等,并与大量的街景和地理照片进行对比,从而推断出照片的拍摄地点。GeoSpy的技术基础包括计算机视觉和地理空间视觉大语言模型,它能够提供相当精确的经纬度坐标,甚至能够识别照片中的文字信息,如商店招牌或公司名称,来进一步精确定位。
我们来实验一下,我们上传了一个随机抓取的新闻中的图片
它通过文字判断,应该是在网上搜索了以下,给了我这个坐标
位置大差不差
咱们再来一张,我从Facebook上找到一张图片,上传上去,看看这个人是在哪里拍的(多么邪恶的想法)
它返回的信息是:
Country: China
Explanation: The photo was
......长按二维码访问原文
LSTM卷土重来!xLSTM:一举超越Mamba、Transformer! 2024-05-14 18:07
前言 LSTM:这次重生,我要夺回 Transformer 拿走的一切。
本文转载自新智元
仅用于学术分享,若侵权请联系删除
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
CV方向的准研究生们,未来三年如何度过?
招聘高光谱图像、语义分割、diffusion等方向论文指导老师
20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所存在的局限性使其风光不再。
当人们都以为 Transformer 在语言模型领域稳坐江山的时候,LSTM 又杀回来了 —
......长按二维码访问原文
什么是机器视觉系统,怎么工作的? 2024-05-14 11:07
欢迎关注GZH《光场视觉》
一、机器视觉系统
机器视觉系统是指利用机器替代人眼做出各种测量和判断。机器视觉是工程领域和科学领域中的一个非常重要的研究领域,它是一门涉及光学、机械、计算机、模式识别、图像处理、人工智能、信号处理以及光电一体化等多个领域的综合性学科。
其应用范围随着工业自动化的发展逐渐完善和推广,其中母子图像传感器、CMOS和CCD摄像机、DSP、ARM嵌入式技术、图像处理和模式识别等技术的快速发展,有力地推动了机器视觉的发展。
机器视觉是一种比较复杂的系统。因为大多数系统监控对象都是运动物体,系统与运动物体的匹配和协调动作尤为重要,所以给系统各部分的动作时间和处理速度带来了严格的要求。
在某些应用领域,例如机器人、飞行物体导致等,对整个系统或者系统的一部分的重量、体积和功耗都会有严格的要
......长按二维码访问原文
学点AI知识:在目标识别方面,ConvNets超越人类了吗?我们离真正的视觉智能还非常遥远 2024-05-14 08:46
2015年,微软在一篇研究博客中宣称:“这项用于识别图像或视频中对象的重大技术进步,表明这一系统的识别准确率已经达到甚至超过人类水平。”
这一论断是基于人类的错误率约为5%,而机器的错误率接近2%的一个声明。
这一声明是如此得出的:
第一,机器错误率是1-Top-5准确率得出的。当你读到“一台机器正确地识别了目标”时,你会认为,给定一张篮球的图像,机器会输出“篮球”这一结果;但在ImageNet竞赛中,正确地识别仅意味着正确类别出现在机器给出的前5个输出类别当中。如果给机器输入一张篮球的图像,机器按顺序输出的是门球、比基尼、疣猪、篮球和搬家货车,即可被判定是正确识别。
2017年,ImageNet竞赛中98%的top-5准确率,最高的top-1准确率只有82%。top-1准确率指的是测试图像中所含内容的
......长按二维码访问原文