机器视觉资讯20240524

文章目录[隐藏]

行业资讯

什么是自然语言处理 NLP?– 入门指南:2024-05-22T12:30:27+00:00

什么是自然语言处理 NLP?

你有没有想过数字设备是如何理解人类语言的?无论您是要求像 Siri 这样的语音助手设置闹钟,还是根据您的评论获得产品推荐,这些交互都是由一个迷人的计算机科学领域(称为自然语言处理或 NLP)提供支持的。

NLP是一种技术

...... 长按二维码访问原文

拓疆者与住友商事签订远程智控系统日本销售独家代理协议--机器视觉网 2024-05-24 14:11:18

2024-05-24 14:11:18 来源: 中国机器视觉网

2024年5月21日,住友商事株式会社(总公司:日本东京;代表董事、社长、执行董事、CEO:上野真吾)与北京拓疆者智能科技有限公司(总公司:中国北京;董事长、CEO:隋少龙)签订了日本地区工程机械远程智能操控系统销售独家代理协议。

本次提供的工程机械远程智控方案以挖掘机为核心设备,旨在解决日本地区采石矿业、港口装卸业、工业废弃物处理业、制造业等行业中与现场操作相关的问题。

合作背景

日本国内作业现场面临着严重的操作员老龄化、人手不足、青年人才培养等困境。因此能够改善振动、噪音、粉尘等恶劣的工作环境,创造多样化人才就业的工作条件,减轻操作员的身体负担,实现工作方式改革的工程机械远程智控系统的需求不断上升。

拓疆者作为一家专门从事工程机械远程

......长按二维码访问原文

广达与Obsidian Sensors合作为汽车应用提供热成像解决方案―新闻频道- 视觉系统设计 2024/5/24 16:32:22

计算机、消费电子和智能汽车解决方案先进技术开拓者广达电脑(Quanta Computer,台湾证券交易所股票代码:2382.TW)近日宣布与美国加州Obsidian Sensors公司合作制造面向汽车应用的高分辨率热成像相机。

Obsidian Sensors通过在其大面积微机电系统平台(LAMP,Large Area MEMS Platform)及成熟的平板代工厂,以低成本大批量生产高分辨率热成像传感器。Obsidian Sensors利用大面积玻璃基板能够实现年产超过1亿颗VGA或更高分辨率的传感器,有助于推动这项拯救生命的技术在汽车领域以及安防、监控和无人机等领域的大规模市场应用。

2024年4月29日,美国国家公路交通安全管理局(NHTSA)发布了最终规定,要求从2029年起,每辆新车都必须安装所谓

......长按二维码访问原文

凌云光工业视觉大模型推动智能检测产业加速发展―新闻频道- 视觉系统设计 2024/5/24 16:22:05

5月21日,VisionChina(北京)2024机器视觉助力智能制造创新发展大会在北京国际会议中心开幕,凌云光高级副总裁杨艺、CTO赵严博士应邀出席大会论坛活动。

赵严在《工业视觉大模型推动智能检测产业加速发展》主题演讲中表示:随着国家战略的推动和AI技术的发展,智能检测行业正迎来快速增长,其技术在3C、新能源、汽车、印刷等制造领域被广泛应用。然而,如何更好地服务智能制造,提升检测技术的智能化水平,行业需要解决一系列难题。

全球领军企业如苹果、宁德时代,他们对产品质量要求极高,追求零缺陷标准。他们提出的超级工厂战略,强调了精益运营、数据挖掘以及通用主动检测的重要性,为整个行业树立了典范。为实现这一目标,这些企业正在引入人工智能技术来实现质量检测上的突破。

在这样的背景下,中国机器视觉领域的参与者亟待实现

......长按二维码访问原文

海克斯康2024“世界计量日”主题大会盛大举行―新闻频道- 视觉系统设计 2024/5/22 21:13:37

詹亚南

海克斯康制造智能商务运营事业群总经理

“数字技术蓬勃发展,为传统行业注入新动能,进一步助力新质生产力的蓬勃发展。海克斯康深耕中国市场40年,凭借涵盖产品全生命周期的工业软件系统以及广泛分布的传感器技术,涉足26大行业,服务客户40000多家。海克斯康将继续发挥产业链链主的引领作用,践行企业责任,助力制造业数字化转型和智能化升级。”

邾继贵

天津大学精密仪器与光电子工程学院院长

精密测试技术及仪器全国重点实验室主任

教育部长江学者特聘教授

“天津大学精仪学院与海克斯康自1998年建立校企合作,根据精密测量产业发展趋势和人才培养需求,双方持续推进在新技术研发、成果转化、人才培养和社会服务等方面的深度合作,实现高层次人才培养和科技创新成果的双丰收。”

天津大学精仪学院—海克斯康精密仪器联合研究

......长按二维码访问原文

包装外观检测的智能化方案,堡盟XF系列视觉传感器―新闻频道- 视觉系统设计 2024/5/22 17:05:18

涂料产品的外包装印刷是展示产品特性以及参数信息的重要媒介,当产品对应不同渠道、分属不同品类时,其包装也会拥有不同的印刷形式。检测包装的印刷情况是产品出厂时的必要流程。VeriSens家族的XF系列视觉传感器就是这样一款在包装检测应用中发挥重要作用的产品。

满足外观检测需求

在一般情况下,涂料产品为了迎合不同厂家制造产品需求,常常利用不同的印花外包装来分别对应不同的产品、市场和渠道,因此在最后终端包装工序中需要加以检测,方便鉴别不同的分类,以免发生混淆。

点击链接,查看产品详情:https://www.baumer.cn/cn/zh/product-overview/smart-vision/verisens-vision-sensors/c/332

堡盟XF视觉传感器拥有一体式视觉检测模块,结构紧凑、节

......长按二维码访问原文

AI引爆边缘计算变革――研华2024嵌入式产业合作伙伴会议即将启航!―新闻频道- 视觉系统设计 2024/5/22 10:29:35

近年来,物联网设备连接数呈现出线性增长趋势,同时设备本身也越来越智能化。人工智能与物联网在实际应用中的落地与融合,将推动人类社会进入“万物智能互联”时代,随之产生的数据也将呈井喷式爆发。而随着机器学习、神经网络训练等网络架构和工具不断适配、兼容到嵌入式系统上,越来越多的AI应用可以直接在边缘设备运行。作为深耕工业物联网40余年的企业,研华一直积极以自身Edge Computing的优势,不断创新发展先进技术、积极协同生态伙伴、深耕各垂直市场,在硬件和软件服务上发力,为AI落地提供更高算力的边缘AI平台。

2024年5月30日,2024研华嵌入式产业合作伙伴会议将在北京·中关村皇冠假日酒店举行。本次会议以“AI 引爆边缘计算变革,塑造嵌入式产业新未来”为主题,聚焦机器人、医疗、3D机器视觉三大行业,20多个细分

......长按二维码访问原文

艾迈斯欧司朗助力速腾聚创发布MX激光雷达―新闻频道- 视觉系统设计 2024/5/22 10:09:11

中国 上海,2024年5月21日——全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)今日宣布,随着汽车智能化浪潮的滚滚推进,激光雷达已成为自动驾驶系统不可缺少的核心传感器,引领高级辅助驾驶技术的未来。4月25日,北京车展,全球领先的激光雷达及感知解决方案供应商,速腾聚创首次展示其最新的MX激光雷达。这一产品融合艾迈斯欧司朗成熟的EEL SPL系列边发射激光器技术,为激光雷达提供高精度的激光输出,赋予汽车和机器人超越视觉的感知能力。

自2014年成立以来,速腾聚创作为车载激光雷达行业的先锋,为全球众多的汽车制造商和一级供应商提供服务。截止到2024年3月底,速腾聚创已获得来自22家汽车整车厂和一级供应商共计65款定点车型订单。根据S&P Global Mobility标普全球汽车《20

......长按二维码访问原文

picoScan150 detection新功能模块和新型号组合―产品聚焦频道- 视觉系统设计 2024/5/23 16:30:37

小编今天向大家分享picoScan150产品的新功能和新型号组合。

LiDAR(Light Detection and Ranging),是由基本原理和应用方式结合得出了形象生动的名字;

对工业激光雷达,也由此更具体地定义出了基础的两种功能模式——检测Detection和测量Ranging。picoScan150的研发初衷包含这两种基本的功能模式。

检测 (Detection)

激光雷达传感器集成了算法,测量范围内可进行区域设定和检测区域内的点云情况,进而判定是否有物体进入区域。IO物理输出,安全高效准确。

测量 (Ranging)

激光雷达传感器输出原始的点云数据,需配备具体的算法才能实现应用功能。

测量(Ranging)

功能及型号产品组合

综合已有产品组合、产品研发的进度和市场需求,我们

......长按二维码访问原文

埃尔森智能科技发布防爆3D相机―产品聚焦频道- 视觉系统设计 2024/5/23 16:11:47

埃尔森智能科技发布最新防爆3D相机AT-S1000-04A-D,专为高风险工业环境量身打造,采用创新的整体防爆设计,通过线激光主动扫描成像,实现对目标工件的精准定位,助力机器人在高粉尘、重油气等易燃易爆环境下执行喷涂、打磨、上下料及装配等自动化作业。

埃尔森防爆3D相机AT-S1000-04A-D是目前已上市的唯一一款具备自主防爆能力的工业3D相机,它无需额外增加外部防爆壳体,可直接实现防爆功能。它突破传统防爆技术的局限性,集成了先进的成像和防护技术,为高风险环境中的自动化作业提供了全新的视觉解决方案。

卓越的防护性能

AT-S1000-04A-D通过CNC一体成型的外壳加工技术、嵌入式结构设计及直出出线设计,防护等级达到IP67。单一装配面有效阻止外部可燃气体及粉尘进入设备内部,接口部分密封性优异,显著

......长按二维码访问原文

ISRA VISION 生产管理智能工具EPROMI,发掘隐藏的潜力―产品聚焦频道- 视觉系统设计 2024/5/22 16:40:19

ISRA VISION 最新推出印刷行业强大的在线检测解决方案支持平台——生产管理智能工具EPROMI。不仅可以显示和分析用于端对端工艺监控的实时数据,该工具最大的优势主要在于收集检测和生产数据并进行全面的评估。它发掘隐藏潜力,为优化产品组合,持续提高工艺效率和质量,提升盈利能力提供明智的决策基础。

先进生产系统、质量保证系统、报告工具会产生大量的数据,将这些数据有效关联起来才可以对整个价值链上的经济决策提供有价值的信息。 ISRA VISION的EPROMI生产分析平台可根据各种关键绩效指标对数据进行综合评估。该平台已经在薄膜和未经印刷的包装材料生产等其他领域证明了其价值,现在正式应用于印刷检测解决方案中。

EPROMI 包含实时看板用于实时监控检测系统、产线和当前产品质量,确保生产和质量经理随时了解印刷

......长按二维码访问原文

机器视觉在汽车转向节检测中的应用―技术与应用频道- 视觉系统设计 2024/5/24 16:28:57

方案背景

转向节是汽车转向桥中的重要零件之一,能够使汽车稳定行驶并灵敏传递行驶方向。在汽车行驶状态下,它承受着多变的冲击载荷,因此要求其具有很高的强度。

转向节三维空间尺寸复杂繁多,大族视觉专门定制检测方案,强大的3D视觉检测汽车转向节位姿和位置,真实还原产品细节轮廓;快速的2D视觉对零件单个进行扫描,检测ABS孔位直径。

汽车转向节位姿和位置检测

3D配准精度高,3D成像质量好,转向节轮廓基本完整,细节纹理清晰,便于后续点云算法及软件处理。

1. 点云分割:获取产品点云,去除背景和干扰点,提高后续配准的准确度和速度。

效果:从全部点云(黄色)中分割出来产品的点云(青色)。

2. 点云粗配准:PPF算法匹配产品大概位置,为后续精确配准提供参考。

配准效果:由模板(黄色)配准目标(青色)获得的结果

......长按二维码访问原文

深度解析FPD-Link III 和 GMSL2接口―技术与应用频道- 视觉系统设计 2024/5/23 21:27:02

在工业相机领域,FPD-Link III和GMSL2接口是两种重要的高速数据传输标准。它们旨在解决传统CSI-2接口所面临的电缆长度限制和环境干扰问题,为工业相机和视觉应用提供了更灵活和可靠的数据传输解决方案。这篇文章将会深度解析FPD-Link和GMSL2接口,解释FPD-Link和GMSL的相似性和差异以及其技术的优缺点,以及一些帮助系统获得最佳性能的电缆选择的要点。

关于FPD-Link III和GMSL2

FPD-Link III(平面显示连接)是一种由德州仪器(Texas Instruments)开发的高速数据传输协议,是Flat Panel Display Link协议的更新版本,适用于长距离传输和高分辨率图像数据。它采用LVDS(低电压差分信号传输)技术,可以支持高达3.2 Gbit/s的数据

......长按二维码访问原文

深度学习工厂自动化项目实施入门指南―技术与应用频道- 视觉系统设计 2024/5/22 10:12:43

传统的或“基于规则”的机器视觉技术,能够可靠地检测一致且制造良好的元件,并擅长于解决高精度应用,这些应用包括引导、识别、测量和检测,所有这些应用都能以超快的速度和高精度执行。这类机器视觉对于已知的变量非常有用:元件是存在还是缺失?这个物体与那个物体之间究竟相距多远?这个机器人需要在哪里拾取这个元件?这些任务易于部署在受控环境中的装配线上。

但是,当情况不那么明确时,传统机器视觉就没那么胜任了。这时候,将深度学习技术与传统机器视觉技术结合使用,能带来更好的效果。深度学习技术使用基于示例的训练和神经网络来分析缺陷、定位和分类物体以及读取印刷标识。该技术基于一组带标记的示例教会神经网络什么是合格的图像,考虑到一些预期的变化,它将能够区分合格元件与缺陷元件。

然而,工厂管理者有理由犹豫,不愿意冒险用他们现有的合格流

......长按二维码访问原文

堡盟XF系列视觉传感器助力包装外观智能化检测―技术与应用频道- 视觉系统设计 2024/5/22 9:37:36

涂料产品的外包装印刷是展示产品特性以及参数信息的重要媒介,当产品对应不同渠道、分属不同品类时,其包装也会拥有不同的印刷形式。检测包装的印刷情况是产品出厂时的必要流程。VeriSens家族的XF系列视觉传感器就是这样一款在包装检测应用中发挥重要作用的产品。

满足外观检测需求

在一般情况下,涂料产品为了迎合不同厂家制造产品需求,常常利用不同的印花外包装来分别对应不同的产品、市场和渠道,因此在最后终端包装工序中需要加以检测,方便鉴别不同的分类,以免发生混淆。

产品推荐

堡盟XF视觉传感器拥有一体式视觉检测模块,结构紧凑、节省空间,可以很轻松的被安装在涂料灌装产线上,在最后的封装包装时负责产品最终检测。由于XF检测速度快,长期使用性能稳定,因此倍受客户青睐。

XF系列产品创新独具

堡盟XF系列视觉传感器继承

......长按二维码访问原文

JQuery.ajax的datatype和contentType的可选项解释、常见的一种错误“无法将多个参数绑定到请求的内容”-asp.net-少有人走的路 2024-05-24 15:01:14

(一) dataType 可以有以下几种值:

"xml": 返回XML文档,可用jQuery进行处理。 "html": 返回纯HTML信息;包含的script标签会在插入DOM时执行。 "script": 返回纯文本JavaScript代码。不会自动缓存结果。除非设置了 "cache": true 。

注意:在远程请求时(不在同一个域下),所有POST请求都将转为GET请求。(因为将使用DOM的script标签来加载) "json": 返回JSON数据。 "jsonp": JSONP(JSON with Padding)是跨域通信的一种协议,允许在网页上直接访问其他域的资源。

JSON数据被包含在函数调用中,作为该函数的一个参数被传递(通常是一个回调函数)。 "text": 返回纯文本字符

......长按二维码访问原文

AAAI24|FontDiffuser:通过多尺度内容聚合和样式对比度扩散模型来生成字体 2024-05-23 18:02

其他工作

DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion( ICCV 2023)

Word-As-Image for Semantic Typography(SIGGRAPH 2023)

Scene-Text-Editor-using-Font-Adaptive-Neural-Network(CVPR2020)

PSGText: Stroke-Guided Scene Text Editing with PSP Module

Information

Title:FontDiffuser: One-Shot Font Generation via Denoising Diffusion with Multi

......长按二维码访问原文

离散视觉tokenizer 2024-05-24 12:28

前言

离散视觉tokenizer(Discrete Visual Tokenizers)对于原生多模态大模型的重要性体现在以下几个关键方面:

统一表示:视觉tokenizer能够将图像数据转换成离散的视觉token,这些token与文本token在形式上保持一致,从而允许图像和文本共享同一个表示空间。这种统一使得模型能够跨越模态理解信息,提高了多模态数据处理的效率和效果。 高效的信息编码与解码:通过将高维图像数据降维成少量关键视觉token,视觉tokenizer有效减少了计算复杂度,使得模型能够更高效地处理和理解图像内容。这些token携带图像的核心特征,使得模型在生成和理解图像时能够更加精准和高效。 增强模型的泛化能力:原生多模态大模型利用视觉tokenizer在大量多模态数据上进行预训练,学习到了跨模

......长按二维码访问原文

虚数科技基于DLIA工业缺陷检测的智能视觉检测质检解决方案 2024-05-24 17:16

在传统制造环境中,产品的质量控制通常依赖于人工目视检查或其他简单的机械测试手段,这些方法存在着诸多局限性。比如质检时间成本高、缺乏统一标准、准确性受操作者疲劳程度以及技能水平等因素影响大等等问题,这些问题导致可能会对产品的质量检测产生较大的判断差异。面对这些问题,工业界亟需一种能自动进行高质量检测的技术来提升生产和品质管理的整体效能。

虚数科技提出的基于DLIA(深度学习与图像分析)的工业缺陷检测智能视觉检测质检解决方案,是一种利用先进的人工智能技术来提升工业生产中质量控制与缺陷检测效率和精度的方法。这种质检解决方案融合了深度学习算法、机器视觉技术和大数据分析,能够在高速生产线上自动识别、分类乃至预测各种复杂的工业缺陷,从而替代或辅助传统的人工检测方式,实现更高效、准确的质量管理。

......长按二维码访问原文

【传知代码】骨架行为识别-论文复现 2024-05-24 09:03

本文涉及的源码可从骨架行为识别-论文复现该文章下方附件获取

骨架行为识别-论文复现

骨架行为识别的定义

骨架行为识别是指通过分析人体骨架的运动轨迹和姿态,来识别和理解人体的行为动作。

以下是一些关于骨架行为识别的相关内容:

基本概念:骨架行为识别是计算机视觉和模式识别领域的一个重要研究方向。它通常涉及到从图像或视频中提取人体的关键点信息,然后通过分析这些关键点的运动轨迹和相对位置来识别特定的行为或动作。 应用领域:骨架行为识别技术在多个领域都有广泛的应用,包括但不限于人机交互、智能监控、运动分析、虚拟现实、机器人技术等。例如,在智能监控系统中,可以通过骨架行为识别来分析行人的活动,以增强安全性;在人机交互领域,可以通过识别用户的手势来控制游戏或应用程序。 技术方法:为了实现骨架行为识别,研究人员采用了

......长按二维码访问原文

2024计算机视觉与智能通信国际会议 2024-05-24 09:58

2024 International Conference on Computer Vision and Intelligent Communication

一、大会信息

会议名称:2024计算机视觉与智能通信国际会议

会议简称:ICCVIC 2024

投稿邮箱:iccvic@sub-paper.com

大会地点:中国·杭州

收录检索:提交Ei Compendex,CPCI,CNKI,Google Scholar等

审稿通知:投稿后2-3日内通知

其他说明:需要延期投稿,参会证书,会议邀请函,会议通知或了解更多会议,请联系上方组委会老师

二、会议简介

2024年计算机视觉与智能通信国际大会定在中国杭州举行。会议旨在为从事计算机视觉和智能通信研究的专家、学者和技术研究人员提供一个平台,分享科研

......长按二维码访问原文

[论文笔记]CVPR 2024 年 |利用LLM驱动的生成内容进行长尾识别 2024-05-24 15:06

background

现实世界中的数据往往是呈现长尾分布的,由此带来了两个挑战:(1)类别不平衡,导致训练期间尾部类别被忽略。(2)尾部类别的数据是稀缺的,缺乏多样性,不足以有效地训练模型。

在长尾学习领域,已经出现了很多方法,比如样本重采样、loss重加权,解耦学习,集成学习等。但是它们都没有解决尾部数据的稀缺性的问题。目前尝试解决尾部数据稀缺性的问题主要有:(1)数据增强。(2)迁移相关的类别的特征或CLIP等大型预训练模型中的知识来增强尾部特征的多样性。

Motivation

作者注意到,最近LLM 和 LMM(Large multimodal models)已经被广泛应用于多个下游任务中,但是由于训练数据集不平衡带来的偏差,在长尾识别任务中,LMM的表现是不够好的。作者做了一个实验:对于Trog

......长按二维码访问原文

评估曼巴机制在视觉识别任务中的必要性-曼巴Out:2024-05-24T01:34:16.000Z

变形金刚是 BERT、GPT 系列和 ViT 等动力模型的支柱。然而,它的注意力机制具有二次复杂度,使其对长序列具有挑战性。为了解决这个问题,已经开发了各种具有线性复杂性的代币混合器。

最近,基于RNN的模型因其高效的训练和推理而受到关注

...... 长按二维码访问原文

视觉魔法师

我还没有学会写个人说明!

相关推荐