机器视觉资讯20240311

文章目录[隐藏]

视觉招聘小黑板
行业资讯

视觉招聘小黑板

欲了解详情，请在公众号后台回复：240311

行业资讯

自动化是不是很坑的专业？ 2019-08-18 12:41

世界上有一种人：明明不懂行，也不通过实践，他就得出你所从事的行业有多么垃圾。实际上这种人自己也好不到哪里去。不但没有见识，还引得众人的横眉冷对。——至评论区的某位柠檬精。

我不喜欢挂人，但是评论里有某个回复让我觉得真的很睿智。心情好就贴出来让大家看看。

真正的智者要学会不跟弱智浪费时间

不吐不快，知乎上除了计算机，金融什么专业不坑？当然了，只是吐槽，实际上术业有专攻，三十年河东三十年河西罢了，要是喜欢这个专业学下去就是了，不喜欢就离开，双向选择，没啥好说的。

我写这个答案的目的还是为了给那些真正喜欢这个专业的小伙伴一些动力和正能量。

说完了，下面说正题。

不是，而且绝对不是一个坑专业，不但不坑，学了自动化只要好好学习不作死不放纵自己大概率无论水平还是就业都很不错，虽然我们学校

......长按二维码访问原文

Anthropic AI Claude 3: The New ChatGPT-4 Competitor： 2024-03-06T13:46:55+00:00

Introduction

The race to develop advanced AI tech, especially in Chatbots, is attracting a lot of players. One such instance is OpenAI’s ChatGPT. It was the talk of the town when it hit the chatbot scene in 2023. Driven by Generative AI tech, it is one of the most used tools for various tasks, ranging from composing emails to writing code.

Another highly p

......长按二维码访问原文

如本科技荣获深圳市“专精特新中小企业”资质--机器视觉网 2024-03-11 13:34:31

2024-03-11 13:34:31 来源: 中国机器视觉网

经深圳市中小企业服务局评审，深圳市如本科技有限公司成功获得 2023 年度深圳市“专精特新中小企业”资质认定。

“专精特新中小企业”是深圳市政府颁发的一项重要荣誉，旨在表彰在特定领域具有专业化、专精化能力与卓越成就的中小企业。如本科技自 2018 年成立至今，在计算机视觉标定、3D 结构光算法、机器人运动规划等领域积累了深厚的技术基础与实践经验，并获得多项发明专利。公司自主研发的 RVC 3D 相机、VDA 视觉位移分析仪等产品，已广泛应用于汽车、消费电子、鞋服、工业检测、物流等领域。

作为一家“专精特新”企业，如本科技将继续坚持技术创新，不断提升产品与服务的竞争力，为客户提供更优质的产品与解决方案，助力工业智能制造全面升级。

......长按二维码访问原文

海研科技与延锋合作，助力汽车内饰件制造领域视觉防错检测--机器视觉网 2024-03-11 13:25:56

2024-03-11 13:25:56 来源: 中国机器视觉网

随着汽车行业的竞争日益激烈，消费者对汽车内饰的美观性和品质要求日益提高。汽车内饰件作为汽车的重要组成部分，其品质直接影响到消费者的驾驶体验和乘坐舒适度。然而，在实际生产制造过程中，汽车内饰件质量检测存在许多痛难点，导致检测效率低下、误判漏判准确性不高等问题，难以满足现代汽车制造的高标准和严要求。

为了解决行业痛点，海研科技与延锋海纳川汽车饰件系统有限公司携手，共同探索高效的汽车内饰件色差与零件防错检测解决方案。

海研科技作为国内领先的AI视觉检测设备提供商，拥有多年的研发经验和丰富的行业应用案例。针对延锋的需求，海研科技量身定制了一套基于AI机器视觉技术的汽车内饰件色差检测与零件有无漏装检测解决方案。该方案采用了先进的机器视觉技术和图像处

......长按二维码访问原文

东莞市宇瞳汽车视觉有限公司获评”2023年第三批广东省创新型中小企业”--机器视觉网 2024-03-11 11:05:59

2024-03-11 11:05:59 来源: 中国机器视觉网

近日，广东省工业和信息化厅公布了2023年第三批广东省创新型中小企业名单，东莞市共44家企业获评2023年第三批广东省创新型中小企业，东莞市宇瞳汽车视觉有限公司成功入选。

创新型中小企业评价由工信部研究制定，是指具有较高专业化水平、较强创新能力和发展潜力的企业，是优质中小企业的基础力量。

“创新型中小企业”从创新能力、成长性、专业化三类六个指标综合打分评定，是优质中小企业的基础力量，是企业创新能力的“认证”标志。创新型中小企业是国家工业与信息化部评定的优质中小企业之一，作为优质中小企业培育工作的“第一步”，是推动经济高质量发展的引擎，也是构建企业新发展格局的重要支撑。

东莞市宇瞳汽车视觉有限公司简介东莞市宇瞳汽车视觉有限公司是宇瞳光学全资子

......长按二维码访问原文

银牛微电子董事长韩晓春与肥西县书记陈伟举行工作会谈--机器视觉网 2024-03-08 13:33:34

2024-03-08 13:33:34 来源: 中国机器视觉网

近日，县委书记陈伟与合肥银牛微电子有限责任公司董事长韩晓春一行举行工作会谈，深入讨论企业入驻后产品研发、产业链合作等相关事宜。县委常委、副县长程潭参加。

陈伟对韩晓春一行的到来表示欢迎。他表示，近年来，肥西县始终坚持以科技创新驱动高质量发展，聚焦高端智能制造等战新产业，加快培育新质生产力。银牛微电子作为全球领先的视觉与人工智能芯片设计和解决方案提供商，研发实力雄厚，技术水平领先。希望银牛立足肥西、放眼全球，持续加大研发投入，努力创造更多现象级产品，让肥西“智”造更牛。肥西将一以贯之做好服务保障，完善融资支持政策，全力推动企业做强做优做大，不断塑造高质量发展新动能新优势。

韩晓春表示，银牛全球总部落户肥西以来，感受到肥西产业发展势头强劲，团队作

......长按二维码访问原文

深慧视携手广东药科大学，共建智能诊疗大模型--机器视觉网 2024-03-07 15:39:09

2024-03-07 15:39:09 来源: 中国机器视觉网

机器视觉+大模型的结合，为智慧医疗带来了巨大的发展潜力。机器视觉技术可以通过对医学图像的分析和识别，辅助医生快速准确地进行疾病诊断和治疗方案制定。而大模型的运用，则可以提供更强大的计算能力和更丰富的数据资源，进一步提升机器视觉技术的精度和准确性。

最近，深慧视与广东药科大学、北京美丽麦琪携手合作，旨在促进医学影像技术的创新和商业应用。通过合作，可将研究成果成功转化为实际产品和解决方案。涉及到的方面包括图像识别、智能分析、辅助诊断以及精准配药等。通过借助机器视觉和大模型技术，提升医学影像技术的准确性和效率，从而改变医疗模式，实现由传统药物治疗向个体化治疗的转变。

深慧视是机器视觉领域领先的企业，拥有丰富的技术和经验，公司的3D机器视觉算法的核心

......长按二维码访问原文

宜科FX20功能模块重磅发布，基于高速背板总线并搭配多种耦合器--机器视觉网 2024-03-07 15:03:40

2024-03-07 15:03:40 来源: 中国机器视觉网

FX20系列分布式I/O重磅发布两款功能模块，2通道高速计数模块和2通道串口通讯模块，基于高速背板总线并搭配多种耦合器，为控制系统提供更丰富的功能选择，进一步提高FX20的可用性。

一、双通道高速计数模块

FX20系列高速计数模块采用双通道设计，每通道均支持A、B、Z相多种计数模式，具备正向、反向计数功能，最大计数频率500KHz，支持源型、漏型和推挽型多种类型高速脉冲信号，同时，每通道各设置一对DI/DO信号点，可以方便地设置超速报警、计数清零等控制逻辑。

产品特点：测量精度高；响应速度快；支持计数倍频；掉电计数值保持。

二、双通道串口通讯模块

FX20系列串口通讯模块支持2路RS485/RS422/RS232（三选一）通讯接

......长按二维码访问原文

光弹法可视系统，AVT光学检测--机器视觉网 2024-03-11 16:01:10

2024-03-11 16:01:10 来源: 中国机器视觉网

声波在介质中传播实际上就是介质密度变化或应力的传播，会导致介质密度的变化。光弹法的原理是对样品材料施加应力(如声压)置于偏振光场中则光在材料中会发生双折射现象，应力使双折射光发生干涉，产生干涉条纹，通过观察干涉条纹就可以了解主应力方向与应力场分布情况，从而显示声场在固体中的传播过程，为超声波检测提供实验依据。

该系统适用于做培训、研究和技术推广，保存国片机普软件可以捕获频文件，并用手查看分析电脑所采集的图像。

系统组成

光弹法可视系统由以下是个部件组成：1.光源；2.起偏振镜；3.校准透镜；4.试件安装架；5.玻璃试件；6.探头固定管；7.四分之一波长透镜；8.检偏镜；9.变焦镜；10.照相机。

系统特点

系统特点如下：声束性能分析（折

......长按二维码访问原文

锂电池外壳外观缺陷检测的应用实践--机器视觉网 2024-03-11 15:48:58

2024-03-11 15:48:58 来源: 中国机器视觉网

随着电动汽车、便携式电子设备等的普及，锂电池作为一种高效的能源储存解决方案变得愈发重要。然而，锂电池的安全性直接关系到使用产品的可靠性和用户安全。外壳外观缺陷可能导致电池性能下降，甚至引发安全问题。传统的人工检测方法在高速生产线上效率低下，且存在漏检的风险，因此引入AI机器视觉系统成为解决这一问题的关键。

外观缺陷种类包括

凹陷或突起：表面可能存在凹陷或凸起，可能影响外壳完整性。裂缝或裂纹：可能出现裂缝或裂纹，可能导致电池泄漏。异物或污染：外壳表面可能存在异物或污染，可能影响电池性能。颜色异常：外壳颜色不符合规定，可能提示制造问题。

目前的漏检率

漏检率可能因制造设备、检测方法和质检人员的不同而有所差异，但引入AI视觉系统通常可以显著减少

......长按二维码访问原文

针对无人机成像应用的镜头设计--机器视觉网 2024-03-11 15:35:58

2024-03-11 15:35:58 来源: 中国机器视觉网

随着技术的进步，人们正致力于让机器视觉技术服务于更多的新应用。其中有一些应用相比于传统的机器视觉应用，有着截然不同的要求。在面对一些非传统的机器视觉应用时，由于成像系统必须适应压力、温度、冲击和振动等众多不同的环境条件，这通常会使成像系统面临严峻挑战。

无人机成像应用正在兴起。随着无人机技术的进步，成像技术也必须不断进步，以提供与人们在更传统的机器视觉应用中所期望的一致的成像性能。

随着无人机技术的进步催生了越来越多的机器视觉应用，在这些不断变化且往往恶劣的高海拔环境中成像，也将面临着诸多问题需要解决。

成像对无人机的重要性

无人机技术与成像一直紧密相连。即使是早期的商用无人机也配备了成像系统（见图1）。

图1 配备视觉功能的无人机用于

......长按二维码访问原文

借助 HALCON Deep Counting 对大量不同的物体进行定位和计数--机器视觉网 2024-03-11 15:22:51

2024-03-11 15:22:51 来源: 中国机器视觉网

对物体快速、可靠地进行计数

物体自动计数是工业价值链中一项非常重要的应用。例如，作为质量保障流程的一部分，必须可靠检查待交付的包装内是否包含所需数量的正确产品。而在库存管理工作中，精准确定仓库或车间内特定物品的实际数量也同样至关重要。上述计数过程需要达到较高的速度，且必须与指定的过程周期相匹配。

然而，在工业实践当中，对物体进行计数非常具有挑战性。且当需要计数的物体较多时尤为如此。这些物体的尺寸通常很小，而且很难相互分离。它们往往彼此粘连或重叠，从而给计数过程额外增添了很大难度。在许多工业企业内，依旧在手动执行这项任务。然而事实证明，这样做不仅耗时耗力，而且当物体排列非常混乱时，也很容易出错。此外，手工计数是一项没有任何挑战性且十分单调的工作

......长按二维码访问原文

汽车超声波雷达传感器视觉检测应用案例分享--机器视觉网 2024-03-11 14:47:08

2024-03-11 14:47:08 来源: 中国机器视觉网

汽车超声波雷达传感器的主要作用是探测物体的距离、速度和方向，是一种重要的安全辅助设备，可以有效地提高汽车的安全性和可靠性，为汽车的安全驾驶提供保障。

由于汽车传感器的小型化和密集化，视觉检测的难度增加，需要更高精度的测量和识别技术。此款汽车超声波雷达传感器由前盖、陶瓷片、铝壳、硅胶帽、本体等配件辅料装配组成，其组装和质量检测环节则直接影响着汽车的安全性能。

传感器组装检测工站分布

铝壳上料正位工位

检测要求：1、找出内腔里两条直线，计算角度；2、找内腔底部圆心位置。

检测流程：1、通过抓边工具，抓到①②③④线段；2、通过线段①②和线段③④ 的中心点分别拟合线段⑤⑥；3、计算出线段⑤⑥的角度，确定铝壳角度方向，从而进行调整；4、通过找圆工

......长按二维码访问原文

以AI机器视觉打造工业级应用，全面赋能医药行业各场景智慧生产--机器视觉网 2024-03-11 14:13:23

2024-03-11 14:13:23 来源: 中国机器视觉网

导言：随着医药行业的快速发展和产业结构的优化升级，整个社会对药品生产制造过程高度重视。

机器视觉技术作为医药行业整体升级转型的重要组成部分，在医药质量控制、跟踪等环节起着重要作用，其推动了整个医药行业的自动化、智能化、现代化发展，并实现了医药产品生产的无损化、精确化。

据统计数据显示，截至2022年底全国医药制造企业单位数为8815家，而至2023年1-2月，企业数量超过9300家。我国医药制造企业数量持续上升，相关生产线数量庞大，部分企业选择机器视觉技术带动制造生产，企业生产效率显著提升，并做到了对产品的品质保障。

机器视觉应用平台，直面医药领域新挑战

伴随着医药企业对机器视觉技术的需求越来越大，众多机器视觉企业紧抓机遇加大对医药领域机

......长按二维码访问原文

天津大学研究团队借助中智科仪TRC411像增强相机实现放射治疗剂量的切伦科夫成像--机器视觉网 2024-03-11 14:01:13

2024-03-11 14:01:13 来源: 中国机器视觉网

天津大学精密仪器与光电子工程学院贾梦宇副研究员团队借助中智科仪自主研发的逐光TRC411像增强相机实现放射治疗剂量的切伦科夫成像，成果以“Photon-limited Cherenkov imaging of radiation therapy dose”为题于期刊“Optics Letters”上发表。

1、研究背景

当带电粒子（如电子）穿过电介质而且其速度大于光在该介质中的相速度时，介质会被激发产生电磁辐射，形成发光现象，即为切伦科夫光。切伦科夫光具有两个特点：一是光子沿着带电粒子入射方向，以一定的角度发散；二是其辐射光谱在紫外-可见光区呈现连续光谱，光谱成分比例与波长平方成反比。可采用高灵敏度的探测器在一定视场范围内收集切伦科夫光子成像

......长按二维码访问原文

机器视觉系统在光伏生产中的应用场景--机器视觉网 2024-03-11 13:45:26

2024-03-11 13:45:26 来源: 中国机器视觉网

光电转化率的提升、生产的降本增效，来自于光伏硅片、电池片、组件、辅料等多个环节生产技术的提升和创新。

光伏产品的核心追求即为光电转化率，降本增效是光伏企业发展的永久动力。而光电转化率的提升、生产的降本增效，则来自于光伏硅片、电池片、组件、辅料等多个环节生产技术的提升和创新。光伏产品作为高产能、高精度的制造业产品，各段产业链上，各生产环节中的每一道工序都需要更高效的生产技术和先进管理流程。当下在各大光伏工厂中，自动化生产设备的应用比例已越来越高，尤其在后段的光伏组件生产端，自动化覆盖率已近90%，标准化设备包括切片机、串焊机、排版机、叠焊机、层压机、装框机、接线盒焊机、EL测试等。光伏生产企业未来的目标是接近无人化生产，自动化的标配设备占比至少9

......长按二维码访问原文

全国物流仓储设备标委会换届大会在杭召开―新闻频道- 视觉系统设计 2024/3/8 22:34:32

近日，全国物流仓储设备标委会换届大会在杭州成功召开，标志着标委会将进入一个新的发展阶段，继续引领行业标准化工作向前推进。

海康机器人作为承办单位，全力支持标委会换届工作。在此之前，海康机器人就致力于行业标准的制定与推广，凭借深厚的技术实力和市场实践经验，深度参与了多项国家标准的制定。

见证标委会换届

众多行业专家、企业代表及相关部门领导与会，共同见证了标委会换届这一重要时刻。

海康机器人副总裁吴永海加入标委会，成为新一届委员。中国机械工业联合会副总工程师谭湘宁，全国物流仓储设备标委会主任委员、中国机械工程学会副理事长兼执行副秘书长陆大明，全国物流仓储设备标委会副主任委员、北京起重运输机械设计研究院有限公司董事长唐超等领导为新一届委员颁发证书。

全力推进标准化工作

吴永海在会议致辞中表示，承办这次标委

......长按二维码访问原文

大恒图像广州SPS展完美落幕―新闻频道- 视觉系统设计 2024/3/7 16:57:53

为期三天的2024广州国际智能制造技术与装备展览会（SPS – Smart Production Solutions Guangzhou, 前称SIAF）于今天在中国进出口商品交易会琶洲展馆B区完美谢幕。此次展会我们收获颇丰。

大恒图像感谢每一位亲临展会现场支持我们的客户！感谢一直以来您的信任，您的热情和支持，是我们坚持持续创新的动力和源泉，正是因为您的到场让我们此次展会取得了圆满成功。未来我们会继续努力，将优质的机器视觉技术、产品及方案带给更多用户。

直击展会现场

新系统热度高涨

大恒图像今年新推出的火星CXP2.0相机大像元高速采集系统前聚集了很多客户，客户就使用场景和工作原理等方面，与我们的技术工程师火热交谈，这款产品也在展会上接到了很多借测需求。

热情专业的技术和销售同事

客户与华南区技术经

......长按二维码访问原文

伟特将于SEMICON CHINA 2024揭晓新颖的智能视觉检测方案―新闻频道- 视觉系统设计 2024/3/7 16:40:41

（马来西亚槟城，2024年3月讯）伟特科技，致力于成为全球最值得信赖的科技公司，将于2024年3月20日至22日参加中国最大规模半导体年度盛会 – Semicon China 2024, 展位位于上海新国际博览中心（SNIEC）N3展馆，展位号：#3775。

届时，伟特将展示其最新的中后端半导体视觉检测方案，包括晶片检测与分类机 - PX730i, 编带后视觉检测机 - VR20i G2, 以及半导体IC视觉检测机 - TH3000i，以满足不断发展各行业的需求。此外，伟特技术专家将在展会期间进行现场产品演示，并提供详细的技术解说。

伟特晶片检测与分类机PX730i是专为晶片分拣、六面检测与卷带封装而设计。PX730i创新的设计取代了传统的人工目视检测，并将于Semicon China 2024首次亮相。

......长按二维码访问原文

紫外线镜头如何改变食品行业―新闻频道- 视觉系统设计 2024/3/7 16:35:05

食品安全，这一消费者、生产商和经销业者共同心系的重大话题，始终牵动着各方的神经。在近几年，公众对紫外线技术在确保食品安全方面所扮演角色的关注日益增加。科学研究与实践已充分证实，紫外线具有高效消灭食品表面细菌和其他有害微生物的能力，为保障食品卫生安全提供了一条新的防线。

表面消毒

在意识到受污染的表面可能是食源性疾病的罪魁祸首，占比高达近80%时，紫外线技术对食品安全的积极影响便不言而喻。通过运用紫外线消毒，人们能够有效杀灭接触食品的表面——如厨房台面、砧板以及餐具上的有害微生物。

这类预防手段对于餐饮业乃至其他涉及食品服务的场所至关重要，尤其适用于自助餐厅、云厨房和流动食品车等，因为这些场所的表面更容易发生交叉污染。

进一步地，紫外线还可用于消毒那些不直接接触食物的表面，例如地板和墙面。这种多面性消毒能

......长按二维码访问原文

艾睿天眼热成像闪耀德国IWA 2024户外展―新闻频道- 视觉系统设计 2024/3/6 21:55:24

中国热成像Amazing

在刚刚结束的德国IWA户外展上，天眼手机热成像刷屏了，来自世界各地的专业人士惊奇赞叹，中国热成像Amazing！

IWA户外展，全称为德国纽伦堡户外用品及狩猎用品展览会，被认为是狩猎、户外装备和安全设备的首要国际贸易展览会，也是世界户外用品行业规模最大的专业展览会。

艾睿为全球户外爱好者带来了多款优秀的户外热成像产品，还带来最前沿的手机热成像：天眼家族。

双图像处理器

天眼X3手机热成像

天眼X3手机热成像，以“战神”之名风靡户外圈，它是业内首款采用双图像处理器的热成像，不仅采用行业标准FPGA处理器，还迭加了艾睿自研的AISC第二代猎鹰图形处理器，双核联动，将强大热成像内核性能发挥到极致。

在核心“心脏”部位，X3搭载的是艾睿独家研发的战神专项芯片，热敏度高达25mK，

......长按二维码访问原文

TECHSPEC® C 系列定焦短波红外（SWIR)镜头―产品聚焦频道- 视觉系统设计 2024/3/8 23:30:08

产品特征

高达⅔"、C接口镜头

高达750万像素、 2.8µm 像素大小的传感器

紧凑型（C）短波红外镜头用于900-1700nm波长范围

焦距为6mm至50mm

产品介绍

TECHSPEC® C 系列定焦短波红外（SWIR)镜头是紧凑轻便的镜头，作为TECHSPEC® SWIR系列定焦镜头的低成本替代品而设计。这款镜头配有大型光圈，并镀有针对900至1700nm波长范围优化的宽带AR膜，符合工厂自动化和检验的工作距离与分辨率要求。为了在应用的目标光谱范围内获得最佳分辨率和性能，推荐使用SWIR机器视觉滤光片和短波红外（SWIR） LED 照明器。 TECHSPEC® C系列定焦短波红外（SWIR）镜头制造精度高，具有更高水平的成像性能和更低的镜头间差异，确保可以简单地安装到多个系统中。C系列镜头

......长按二维码访问原文

TECHSPEC® UAV系列定焦镜头―产品聚焦频道- 视觉系统设计 2024/3/8 23:26:12

产品特征

紧凑的无穷共轭镜头，主要适用于摄影测量

焦距16mm、25mm和35mm

1.2英寸，C接口镜头

高达 2440 万像素、2.7微米像素尺寸传感器

产品介绍

TECHSPEC® UAV系列定焦镜头是专为第四代Sony Pregius 1.2英寸 IMX530 和 IMX540 传感器设计的紧凑、轻量级无穷共轭镜头，搭载在无人车辆和无人机上。这些镜头采用低地面分离距离（Ground Separation Distance，GSD）设计，以实现准确的测量结果，并提供16mm、25mm和35mm的焦距选项。f/2.8的光圈提供增强的光透过量和高分辨率性能。TECHSPEC® UAV+ 系列固定焦距镜头采用 C 接口安装，配备锁定对焦和光圈环，以防止不必要的调整，同时具有前置滤光片螺纹，方便集成标

......长按二维码访问原文

TECHSPEC® SilverTL™ 系列远心镜头―产品聚焦频道- 视觉系统设计 2024/3/8 23:21:13

产品特征

TECHSPEC® SilverTL™ 系列远心镜头

高分辨率 f/6 双远心镜头，带有内置照明选项

高达750万像素、2.8μm像素大小的传感器

消除测量应用中的视差误差

适用于900-1700纳米波长范围

产品介绍

TECHSPEC® SilverTL™ 系列远心镜头采用宽带AR镀膜，经过优化适用于900-1700nm波长范围。这些镜头将高质量光学件与简化的非调焦机械设计相结合，配有可调节的光圈和固定螺钉。为了在应用的目标光谱范围内实现最佳分辨率和性能，建议使用短波红外（SWIR）机器视觉滤光片和 SWIR LED 照明。TECHSPEC® SilverTL™ 系列远心镜头具有标准前置滤光片螺纹，以用于彩色滤光片、偏振片、保护窗口以及LED或光纤环形光适配器的安装。这些镜头非常适用

......长按二维码访问原文

Dragonfly® S：多行业适用的高性能图像采集系统―产品聚焦频道- 视觉系统设计 2024/3/8 22:40:51

龙年伊始，Teledyne FLIR IIS 推出的新款模块化紧凑型 USB3 机器视觉相机系列Dragonfly S 系列是一款广泛应用于生命科学仪器、工厂自动化以及各种嵌入式和手持设备的高性能图像采集系统。其模块化、紧凑、轻量级的设计理念，使得它在各种大规模制造、大用量和多相机系统的成像应用中脱颖而出。

产品简介

Dragonfly® S采用模块化设计，使得用户可以根据实际需求进行灵活配置。无论是带部分封闭还是全封闭的外壳，或是背面或侧面带USB3连接器的板级相机，都可以轻松实现。这种易锁设置大大简化了安装和配置过程，同时也提高了系统的稳定性和可靠性。

Dragonfly® S的紧凑型设计使其能够顺利放入狭小的空间中，而不会影响其性能。这使得它在各种嵌入式和手持设备应用中成为理想的选择，如生物识别、眼

......长按二维码访问原文

意法半导体推出新一代ToF传感器―产品聚焦频道- 视觉系统设计 2024/3/6 21:46:36

近期，服务多重电子应用领域、全球排名前列的半导体公司意法半导体（STMicroelectronics）宣布推出一款全能型、直接式飞行时间（dToF）3D激光雷达模组，具有优秀的2.3k分辨率，同时还宣布超小型的50万像素间接飞行时间（iToF）传感器获得首张订单。

意法半导体影像子产品部总经理Alexandre Balmefrezol表示：“ToF传感器可以准确地测量场景中传感器到物体的距离，激励开发者在智能设备、家用电器和工业自动化设备上开发出令人期待的创新功能。我们的传感器出货量已经超过20亿颗，从最简单的单区测距传感器，到最新的高分辨率3D iToF和dToF传感器，我们将继续扩大ST独有产品的布局。我们的垂直集成供应链涵盖从像素和超构表面透镜技术、设计到产品制造，在世界各地拥有量产模组组装厂，这些优势

......长按二维码访问原文

堡盟OXP200智能轮廓传感器―产品聚焦频道- 视觉系统设计 2024/3/6 21:39:13

近年来，新能源汽车产业正在逐渐成为我国新的经济增长引擎，新能源汽车已成为我国的“新名片”、“出口新三大件”。电池包作为新能源汽车的动力模块，是衡量新能源汽车好坏的关键部分。

因此，密封良好的电池包对于对于保障汽车安全、提升续航尤其重要，胶路则是实现密封要求的技术保障。

新能源汽车电池包胶路密封帮手

国内某新能源汽车电池包设备生产企业通过在电池胶路封装设备中部署使用堡盟的轮廓传感器OXP200，用于检测胶路宽度和高度控制，来保障胶路质量以及满足安全密封要求。

通信多样、传输速度快

OXP200轮廓传感器支持100M/s的高速以太网等多种通信方式。在高速移动的涂胶场景依然可以快速测量，快速读取数据，速度高达600Hz，帮助用户更高效的完成涂胶。

功能强大、精度高

不仅可感知胶路的高度、宽度，还可以测量

......长按二维码访问原文

AI视觉检测在汽车零部件制造中的应用―技术与应用频道- 视觉系统设计 2024/3/8 22:38:15

车零部件作为汽车制造的基础单元，其质量直接关系到整车的性能与安全。人工质检方式不仅效率低，而且容易受到个人能力的影响，导致漏检或误检，无法满足现代制造业对高效、精准、可靠的需求。

基于深度学习技术，阿丘科技AI检测方案，速度快、精度高、指标优，有效解决汽车零部件表面缺陷检测、装配位置验证、字符识别等问题，促进产品质量稳定可靠。

缺陷检测

准确识别零部件的各种表面细小缺陷，如划痕、凹坑、裂纹等，实现秒级检测，准确性和一致性优于质检员水平。

装配验证

快速捕捉不同组件，支持位置检测、有无检测型号检测等，有效代替80%以上的质检员，实现组装验证自动化。

字符识别

自动识别零部件上的字符信息，无惧字符对比度低、反光、扭曲、歪斜等影响，识别准确率达99%以上。

转自：阿丘科技

注：文章版权归原作者所有

......长按二维码访问原文

液晶面板的表面缺陷及检测方法―技术与应用频道- 视觉系统设计 2024/3/8 22:31:08

随着新一代信息通信技术的迅猛发展，作为终端设备的智能手机、平板电脑、智能家居等产品的市场需求持续增长，液晶面板生产规模急剧增大，成为信息产业中的支柱之一。

液晶面板行业的崛起，带动面板质检需求的暴增。

传统的缺陷检测主要由人眼辨别，这给企业把控生产质量和提高生产效率，带来巨大困难。有鉴于此，采用一种新型的面板质量检测方式来代替人工检测是亟待解决的技术问题。

01 液晶面板缺陷由来

薄膜显晶体管液晶显示器（TFT-LCD）具有高分辨率和功耗低等优点，因此被广泛应用于显示器行业。

但是显示屏的生产过程流程多、环境等因素，难以避免会出现缺陷显示屏，导致产品不良率较高。TFT-LCD显示屏的制作包括镀膜、刻蚀、显影、面板组合、灌晶封口和安装驱动芯片等工艺，复杂的工序导致缺陷的出现，常见的缺陷包括点缺陷，线缺陷

......长按二维码访问原文

SICK半导体行业应用方案―技术与应用频道- 视觉系统设计 2024/3/7 16:49:18

在全球科技飞速发展的浪潮中，半导体行业正迎来前所未有的机遇与挑战。作为现代电子技术的核心，半导体在通信、计算机、消费电子、汽车电子等领域都有广泛应用，是推动科技进步的关键力量。然而，随着半导体市场的竞争日益激烈，如何提高生产效率、稳定产品质量以及降低成本成为了摆在企业面前的重要课题。

SICK，作为智能传感技术的龙头企业，长期致力于工业自动化解决方案的创新与突破。我们深知半导体制造过程的复杂性和精细度，因此不断研发适应行业需求的前沿传感技术，为半导体制造企业提供了完善的解决方案。

无论您在半导体制造的哪一个环节面临着挑战，相信通过参考《西克半导体行业应用宝典》能为您的生产力提升带来新灵感！

有效检测

半导体行业对检测和测量任务提出了非常高的要求。尤其在检测小型部件时（例如焊线或半导体晶圆的高要求表面）。

......长按二维码访问原文

机器视觉结合AI检测可重复利用的塑料材料―技术与应用频道- 视觉系统设计 2024/3/6 21:43:37

图1：饮料瓶中的塑料颗粒，在被重新用于新的塑料制品之前，要经过多个步骤的回收和检测流程。

自动化在工业流程的每一步都发挥着重要作用，加拿大Eagle Vizion公司致力于生产工业自动化设备来满足生产需求，该公司生产的Flake Analyzer自动检测系统，使用了AI结合机器视觉技术对切碎的塑料进行分析，以检测是否存在金属或其他异物。Flake Analyzer能够识别30多种类别的材料，包括各种塑料聚合物、金属和纸张。

Eagle Vizion公司总裁Nathanaël Lortie介绍说，在食品级应用中，要求塑料材料中的污染物含量不得超过百万分之十（ppm），所以提供高质量的原材料对于塑料的重复利用尤为重要。

“生产人员不能把他们想要的任何塑料回炉到新生产的水瓶中，人们希望水瓶材料是纯净的。”Lor

......长按二维码访问原文

Roelof Botha of Sequoia Says 'To Be Successful in This Business, You Have to Be Contrarian and Right'： 2024-03-06T09:50:00-0500

Roelof has spent over 20 years building companies in Silicon Valley. He began within the walls of nascent PayPal, which he joined in March 2000 while completing his MBA at Stanford. He became CFO in 2001 and led the company through both its IPO in early 2002 and the subsequent acquisition by eBay. Roelof joined Sequoia in 2003 to help founders build enduring

......长按二维码访问原文

免训练！免微调！ProMISe：使用SAM进行可提示医学图像分割 2024-03-10 00:03

免训练！免微调！ProMISe：一种用于可提示医学图像分割的端到端非微调框架，单独使用或组合使用该方法，都可以在低成本实现令人满意的性能，并且所有 SAM 参数都被冻结！

点击关注 @CVer官方知乎账号，可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

ProMISe: Promptable Medical Image Segmentation using SAM

单位：西交利物浦大学, 利物浦大学, 麻省总医院, 哈佛医学院, 中科大等

论文：https://arxiv.org/abs/2403.04164

CVPR 2024 论文和开源项目合集请戳—>https://github.com/amusi/CVPR2024-Papers-with-Code

随着Segment Anythi

......长按二维码访问原文

CVPR 2024 | Alpha-CLIP：让CLIP关注你想要的任何地方！ 2024-03-10 17:02

简介

本文介绍了一个名为Alpha-CLIP的框架，它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后，Alpha-CLIP可以在保证CLIP原始感知能力的前提下，关注到任意指定区域。通过替换原始CLIP的应用场景，Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。

点击关注 @CVer官方知乎账号，可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

图1 Alpha-CLIP使用场景总览

CLIP作为目前最流行的视觉基座模型被广泛使用。它的应用场景包括但不限于1.与LLM大语言模型结合成为视觉多模态大模型。2.作为图像生成(Stable Diffusion)、点云生成(P

......长按二维码访问原文

多模态大模型：视觉模型与LLM的结合之路(三) 2024-03-11 15:43

一、上期回顾

多模态大模型：视觉模型与LLM的结合之路(一)

多模态大模型：视觉模型与LLM的结合之路(二)

上期我们介绍了多模态大模型的一般架构和首个将视觉模型与大模型结合的尝试Blip2和LLaVA。其中Blip2的贡献主要在模型结构上，明确了将视觉特征通过一系列变换对齐并加入到大模型的Input Embedding中可以让LLM看到图片。LLaVA的贡献主要在数据上，该文给出了利用chat-gpt等纯文本LLM + 图文对(图片，对该图片的一段描述文本)造多轮对话、指令微调数据集的方法，并使用两阶段的训练方法(大量单一的数据对齐图像特征 + 少量多样的数据去给出多轮对话能力)让模型拥有了基于图片的多轮对话能力。

图1：图像与大模型的主流结合方式。(1)将图片经过一个Pretrained VIT，获

......长按二维码访问原文

新进展||计算机视觉在化学与材料内的应用(Ⅰ) 2024-03-11 14:42

计算机视觉又称为机器视觉，是一门“教”会计算机如何去“看”世界的学科。形象地说，就是给计算机安装上眼睛（照相机）和大脑（算法），让计算机能够感知环境。

具体来说，计算机视觉是使用计算机及相关设备对生物视觉的一种模拟，用各种成像设备代替视觉器官作为输入手段，用计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界，并且具有自主适应环境的能力。需要注意的是，在计算机视觉系统中计算机起代替人脑的作用，但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以根据计算机系统的特点来进行视觉信息的处理。但是，人类视觉系统是迄今为止，人们所知道的功能最强大和最完善的视觉系统，对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。计算机视觉本身包括了诸多

......长按二维码访问原文

ICLR 2024 | Meta AI提出ViT寄存器结构，巧妙消除大型ViT中的伪影以提高性能 2024-03-11 00:33

公众号：将门创投(thejiangmen）

作者：seven_

论文题目：Vision Transformers Need Registers

论文链接： https:// arxiv.org/abs/2309.1658 8

视觉Transformer（ViT）目前已替代CNN成为研究者们首选的视觉表示backbone，尤其是一些基于监督学习或自监督学习预训练的ViT，可以在诸多下游视觉任务上表现出卓越的性能。但目前针对ViT中间特征图的可解释研究相对较少，本文介绍一篇Meta与INRIA（法国国家信息与自动化研究院）合作完成的论文，目前该文已被国际表征学习顶级会议ICLR 2024录用。本文的研究人员们对ViT网络特征图中出现的伪影进行了研究，并且认为这些伪影对应于模型表征图像背景区域中的高范数tok

......长按二维码访问原文

艾科瑞特科技：计算机视觉-实时香烟检测-通用版 2024-03-11 15:56

艾科瑞特科技：计算机视觉-实时香烟检测-通用版

关键词：目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创

内容摘要：

实时香烟检测模型具有广泛的应用前景，尤其在需要监控和管理吸烟行为的场合。实时香烟检测模型的应用场景：

公共场所吸烟监控：在商场、医院、学校等公共场所，实时监测并制止吸烟行为，维护公共环境。

办公室吸烟管理：在办公环境中，监控员工是否遵守禁烟规定，提升办公环境质量。

工厂禁烟区监控：在工厂禁烟区域，实时监测并警告吸烟行为，确保生产安全。

公共交通吸烟检测：在公交、地铁等公共交通工具内，监控并制止吸烟行为，保障乘客健康。

餐厅吸烟管理

......长按二维码访问原文

艾科瑞特科技：计算机视觉-实时目标检测-通用领域-移动端版 2024-03-11 15:43

艾科瑞特科技：计算机视觉-实时目标检测-通用领域-移动端版

内容摘要：

通用超轻量级检测模型，以其快速且精确的目标检测能力，在多个领域具有广泛的应用前景：

智能家居监控：用于家庭安全监控，实时检测并识别入侵者或其他异常情况。

零售商店监控：在商店内检测顾客行为，识别异常事件或盗窃行为。

自动驾驶辅助系统：辅助自动驾驶车辆进行道路物体检测，提高行车安全性。

无人机航拍分析：对无人机拍摄的图像进行目标检测，用于环境监测、灾害评估等。

智能安防系统：在公共场所如车站、机场进行人员流动监控和异常事

......长按二维码访问原文

从0到1搭建一套属于你自己的高精度实时结构光3D相机（1）：硬件搭建 2024-03-11 15:54

1. 写在前面

在这篇博客中，博主将主要介绍结构光3D相机的硬件如何搭建，主要涉及到相机与投影仪的选型与配置。在开头，博主先给大家摘出一段语录：

能从硬件层面解决的问题，就别死磕算法了。

是的，能从硬件层面解决的问题，死磕算法是没有意义的。例如，当你评估自己的3D相机精度却发现始终达不到理想水平时，不要在那两三句代码上死磕，回头想想，是不是自己的硬件搭建的不好，选型选的不对。就博主经验而言，大部分做结构光3D相机没几年的小萌新们，都对相机与投影仪的硬件特性毫无理解。在接下来的部分，本篇博客将对相机与投影仪的重要特性作必要介绍。

工欲善其事必先利其器。

2. 相机

相机作为结构光3D相机的主要成像设备，了解其成像原理及必要特性是极其重要的。由于网上有许多精彩的博客与文章，因此博主将列出必要的知识点与相

......长按二维码访问原文

光学畸变对自动驾驶计算机视觉的影响：模拟方法综述 2024-03-11 10:51

光学畸变对自动驾驶计算机视觉的影响：模拟方法综述

image.png

这篇论文主要研究了汽车环视鱼眼镜头在自动驾驶和高级驾驶辅助系统（ADAS）中的应用。环视系统通过多个鱼眼镜头提供车辆周围的360°全景视图，这对于低速行驶、自动泊车等场景至关重要。然而，鱼眼镜头的强烈光学畸变，如色差、像散和光晕等，对计算机视觉任务构成了挑战。论文探讨了如何通过模拟技术来创建包含这些光学畸变的合成数据集，以训练和测试计算机视觉模型。作者们分析了不同的模拟方法，并讨论了它们在模拟真实世界光学性能方面的能力和局限性。

关键术语解释：

环视鱼眼镜头：一种超广角摄像头，能够捕捉车辆周围的全景图像。

光学畸变：由于镜头设计或制造缺陷导致的图像失真，如色差（颜色边缘出现模糊）、像散（图像的清晰度在不同方向上不一致）和光晕（图像边

......长按二维码访问原文

基于扩散模型的图像编辑（SmartBrush、DiffEdit、Pix2Pix-Zero、DragDiffusion） 2024-03-11 13:57

0. 使用扩散模型编辑图像

图像编辑被认为是计算机视觉一个基础任务和实际应用领域，与从最小输入创建新图像的图像生成不同，图像编辑涉及更改图像的外观、结构或内容，包括从细微调整到主要转换的一系列更改。这一技术领域演变的关键进步是生成对抗网络(GANs)的引入，它显著增强了创造性图像处理的可能性。最近，扩散模型在AIGC中出现，导致视觉生成任务的显著突破。扩散模型受到非平衡热力学原理的启发，其工作原理是逐渐向数据中添加噪声，然后学习从随机噪声反转这一过程，直到生成与源数据分布匹配的所需数据。它们大致可以分为基于去噪扩散的和基于分数匹配的。它们的适应性和有效性使其在图像和视频生成、图像恢复、图像编辑等各个领域得到广泛应用。

0.1 编辑任务分类：

语义编辑

这一类别包括对图像内容和叙事的修改，影响所描绘场景

......长按二维码访问原文

图像恢复最近的工作 2024-03-10 16:59

最近应用大模型图像恢复的CLIP和Diffusion越来越多，有将不同退化类型的图像恢复任务统一的趋势。下面是最近几个相关的工作：

Multiscale Structure Guided Diffusion for Image Deblurring（ICCV2023）- 基于Diffusion的图像去模糊

引入了一种简单而有效的多尺度结构引导，作为一种隐式偏差，告知icDPM关于中间层锐利图像的粗结构。这种引导配方导致去模糊结果的显著改善，特别是在看不见的领域。该引导是从一个回归网络的潜在空间中提取的，该网络被训练用来预测多个较低分辨率下的清晰目标，从而保持最显著的尖锐结构。在模糊输入和多尺度引导下，icDPM模型可以更好地理解模糊并恢复干净的图像。我们评估了不同数据集上的单数据集训练模型，并展示了

......长按二维码访问原文

CVPR 2024 | 上海交大提出MESA：通过分割一切来匹配一切 2024-03-10 23:59

特征匹配新工作！MESA：一种精确、稳健和实用的区域匹配方法，旨在有效地减少特征匹配的冗余，其利用SAM的高级图像理解能力，并提出一种区域图来对图像区域的空间结构和尺度层次进行建模，匹配性能表现SOTA！优于LoFTR等网络！

点击关注 @CVer官方知乎账号，可以第一时间看到最优质、最前沿的CV、AI、AIGC工作~

MESA

MESA: Matching Everything by Segmenting Anything

单位：上海交通大学

论文：https://arxiv.org/abs/2401.16741

CVPR 2024 论文和开源项目合集请戳—>https://github.com/amusi/CVPR2024-Papers-with-Code

特征匹配是计算机视觉领域的一项关键任

......长按二维码访问原文

从对抗训练到扩散网络：Diffusion时代图像修复该何去何从？ 2024-03-10 16:41

前言

图像修复（Image Inpainting）作为笔者研究生涯的第一个课题，个人有着颇多感情。我从一个研究小白开始，到做出自己的第一篇inpainting工作，再到2022年latent diffusion models横空出世，自己投出第二个工作，见证了inpainting这个任务从GAN到diffusion models时代的变迁。

那么，Diffusion时代的image inpainting应该何去何从？今天借此文对image inpainting的发展历程进行梳理，同时分享一下自己关于这个命题的心得。

图像修复是什么？

早在深度学习还没有盛行的时代，image inpainting就已经是图像处理领域的焦点问题。而最早定义image inpainting的论文来自Bertalmio等人的《

......长按二维码访问原文

达摩院-视觉技术实验室24年春招暨实习生招聘开始啦 2024-03-11 18:15

如题，我们实验室的春招实习生开始招聘啦，欢迎同学们联系我做内推！

基本要求：

面向预期于24.11-25.10毕业的同学，春招后可以进行暑期实习至少三个月的同学优先。算法、产品、工程技术方向都招。算法方向重点看代表作/质量。

我们的招聘方向：

招聘图像/视频/3D的任意一个AIGC方向、EfficientAIGC方向（系统/算法都可以）、多模态方向，以及相关的AI产品、AI工程技术方向。

其中EfficientAIGC方向由我负责，致力于研究模型的训练/微调/推理加速的新方法，重点关注成本与效率两个方面，包括但不限于模型训练效率提升、高效低成本微调、模型部署加速等。近期也有一些相关工作在挂出。

关于我们：

我们是达摩院-视觉技术实验室，致力于计算机视觉和深度学习技术的研究及落地，有完善的产学研结构

......长按二维码访问原文

多模态大模型：视觉模型与LLM的结合之路(二) 2024-03-11 13:44

一、上期回顾

多模态大模型：视觉模型与LLM的结合之路(一)

上期我们介绍了多模态大模型的一般架构和首个将视觉模型与大模型结合的尝试(Blip2)。本期我们介绍更激进的尝试：LLaVA

图1：图像与大模型的主流结合方式。(1)将图片经过一个Pretrained VIT，获取视觉特征。（2）将该视觉特征通过某种变换层(Adapter)对齐到大模型 Input Embedding的维度。(3)将对齐后的视觉特征concat到Input Embedding，输入到大模型(Large Language Model, LLM)

二、LLaVA

Blip2的出现表示，这种将视觉模态经过一个Adapter对齐到大模型输入的架构是可行的。于是研究者开始考虑，除了繁琐的Q-Former对齐方式外，是否存在更简单的方式

......长按二维码访问原文

从0到1搭建一套属于你自己的高精度实时结构光3D相机（0）：前言 2024-03-11 09:12

1. 写在前面

博主为某3D视觉大厂准三维重建算法工程师。靠着自己在结构光三维重建领域慢慢摸索，逐渐实现了一套个人认为较为完备的结构光3D相机。

然而Up主发现，在诸如CSDN、知网和Github上，乐于分享结构光研究成果的少之又少，更不用说是完整的结构光3D相机教程。原因或是代码简陋而羞于示人，亦或是闲暇时间较少。临近毕业之际，闲暇时间较多，希望未来的这系列文章和代码，能够帮助新入该方向的师弟师妹们少走弯路，快速进入课题状态。鉴于本人写作能力一般，若有晦涩难懂之处，还望海涵。

2. 摘要

随着人工智能的高速发展，三维重建技术已逐渐成为智能感知中不可或缺的一环。例如，智能机器人焊接作业需要高精度的三维点云数据作为输入，并对点云进行分割以获取期望的轨迹信息；智能驾驶需要通过激光雷达获取到高精度的三维地图，

......长按二维码访问原文

ICLR2024|视觉-语言模型CLIP控制的多任务图像恢复 2024-03-10 16:50

Information

Title：Controlling Vision-Language Models for Multi-Task Image Restoration

From：ICLR2024

Code： https:// github.com/Algolzw/dacl ip-uir

About：视觉-语言模型控制的多任务图像恢复

Creation

CLIP 在零样本的情况下对下游任务有着很大的影响，然而当在 low-level 视觉任务中由于图像损坏性能则急剧下降。

本文提出了一个退化感知的视觉语言模型（DA-CLIP），更好地将预训练的 CLIP 用于低级视觉任务中，这是一个多任务的图像恢复框架。

DETAILS：

1. 使用一个可训练的控制器来控制ViT图像编码器的输出，以实现图像

......长按二维码访问原文

艾科瑞特科技：计算机视觉-视频单目标跟踪-通用版 2024-03-11 16:03

艾科瑞特科技：计算机视觉-视频单目标跟踪-通用版

内容摘要：

单目标跟踪算法模型的应用场景非常广泛，它可以在许多实际问题中发挥重要作用。单目标跟踪算法模型的应用场景：

视频监控：在公共场所的监控视频中，自动跟踪并识别异常行为的目标，如人员、车辆等。

无人驾驶：在自动驾驶汽车中，跟踪前方车辆、行人或其他障碍物，确保行车安全。

体育分析：在体育赛事中，自动跟踪运动员的动作和位置，用于比赛分析和数据统计。

机器人导航：机器人通过跟踪目标物体，实现自主导航和物体抓取。

人机交互：在增强现实或虚拟现

......长按二维码访问原文

艾科瑞特科技：计算机视觉-实时安全帽检测-通用版 2024-03-11 15:14

艾科瑞特科技：计算机视觉-实时安全帽检测-通用版

内容摘要：

实时安全帽检测模型具有广泛的应用价值，特别是在需要确保安全帽佩戴的场合。实时安全帽检测模型的应用场景：

建筑工地安全监控：实时监测工人是否佩戴安全帽，提高工地安全管理水平。

矿山作业监控：在矿山作业中，确保工人正确佩戴安全帽，防止意外事故发生。

工厂生产线安全：在生产线上，实时监测工人是否佩戴安全帽，保障工人人身安全。

高空作业安全监控：对于高空作业的工人，实时检测其是否佩戴安全帽，确保作业安全。

电力作业安全监测：在电力作业现

......长按二维码访问原文

视觉面经之小目标检测篇 2024-03-11 16:03

本篇主要对目标检测中的小物体检测的常用方法作了梳理。

无论是在实际的工作中，还是在面试中，都会遇到小目标物体检测，因为这一个场景，是非常贴合实际应用场景，例如动物检测、自动驾驶、遥感等等，都离不开小目标检测。

下面是一个快捷目录：

1.小目标检测的定义。

2.解决小目标检测的常用方法。

3.小目标检测发展的趋势。

一、小目标检测定义

目标尺寸限制：小目标指的是在图像中具有相对较小尺寸的目标。这个尺寸可以通过目标的边界框面积、像素数目或其他度量来定义。检测的难度：由于小目标在图像中的尺寸较小，因此其检测相对更加困难。小目标可能具有低对比度、模糊、遮挡等问题，这增加检测算法的挑战性。

二、常用方法

主要可以分为两个方向，从模型结构以及数据增强两大方向。

1. 模型结构

1）特征金字塔网络（F

......长按二维码访问原文

视频 Tokenizer 方法整理 2024-03-11 00:40

背景

最近在看 Video Understanding 视频理解的相关文章，其中的一个重要处理模块是视频 Tokenizer 的训练，即将 pixel 空间转换为隐空间（感知压缩 Perceptual compression）。完成后，然后在隐空间变换到目标隐空间（语意变换 Semantic Compression），再恢复到图像/做出语意回答。

所以想了解一下，目前视频 Tokenizer 的训练（感知压缩 Perceptual compression）的方法主要有什么？

结论

目前看到的视频 Tokenizer 主要有

附录总结文章+相关讨论：

感受与想法：VQGAN 与 CLIP 是主流，VQGAN连续特征用于生成，离散可用于问答

感受：VQVAE/VQGAN 和 CLIP 类的特征提取

......长按二维码访问原文

艾科瑞特科技：计算机视觉-实时目标检测-自动驾驶领域 2024-03-11 15:26

艾科瑞特科技：计算机视觉-实时目标检测-自动驾驶领域

内容摘要：

通用实时检测模型，特别是针对自动驾驶领域的目标检测模型，具有广泛的应用场景：

车辆识别与跟踪：在自动驾驶车辆行驶过程中，实时检测并跟踪周围的车辆，确保行车安全。

行人检测与避让：检测道路上的行人，确保自动驾驶车辆能够安全避让，避免发生碰撞事故。

交通信号识别：识别交通信号灯的状态（红、黄、绿），辅助自动驾驶车辆做出正确的行驶决策。

道路标志识别：检测并识别道路上的标志（如限速、禁止通行等），帮助自动驾驶车辆遵守交通规则。

障

......长按二维码访问原文

Assess Car Damage with Computer Vision： 2024-03-11T08:15:49.000Z

This article was contributed to the Roboflow blog by Abirami Vina .

Introduction

Using computer vision, you can identify visual defects with vehicles. This could be used as part of an inspection system at a car manufacturer, for use in helping to calculate the value of second-hand cars based on any visual damage, and more.

Using cameras and AI, computer v

......长按二维码访问原文

视觉招聘小黑板

行业资讯

机器视觉需求20240311

记录mmdetectionv1与mmdetectionv2的不同

相关推荐

搜索