文章目录[隐藏]
- 视觉招聘小黑板
- 行业资讯
- Teledyne e2v扩展适用于三维激光三角测量应用的Flash系列CMOS图像传感器--机器视觉网 2024-03-25 14:11:40
- 视比特与国内打磨设备供应商携手创新,成功研发漆面自动磨抛修复系统--机器视觉网 2024-03-25 14:02:27
- 光子精密重磅推出3D线激光轮廓测量仪GL-8000系列--机器视觉网 2024-03-25 13:54:16
- “科亿科技x国轩高科”深度协同,构建创新AI锂电质检--机器视觉网 2024-03-25 13:22:04
- 双U相机惊艳登场,实现高效率和优质传输的双重突破--机器视觉网 2024-03-25 11:55:00
- 汇萃智能助力磁材视觉检测:精密,准确,高效--机器视觉网 2024-03-25 15:16:18
- 沃德普助力工业相机感光元件组保护玻璃定位检测--机器视觉网 2024-03-25 15:07:34
- 良品学习在高良率制造业中缺陷检测的应用--机器视觉网 2024-03-25 14:59:28
- 深度解析棱镜相机镜头 —为何它能超越传统镜头?--机器视觉网 2024-03-25 14:48:07
- 什么是光圈?它是如何影响成像的?--机器视觉网 2024-03-25 14:20:45
- 基于AI和光学测量的卷对卷在线缺陷检测系统―新闻频道- 视觉系统设计 2024/3/25 19:59:02
- 高芯科技携红外全产业链产品和解决方案参展上海慕尼黑光博会―新闻频道- 视觉系统设计 2024/3/25 19:55:29
- 海康机器人新一代CH系列高端型工业相机发布―产品聚焦频道- 视觉系统设计 2024/3/25 19:48:33
- 异色检测创新方案:混合数据相机高精度彩色成像―技术与应用频道- 视觉系统设计 2024/3/25 19:39:44
- 深视智能线激光助力手机中框点胶引导和胶路检测―技术与应用频道- 视觉系统设计 2024/3/25 19:27:01
- 图像检测入门(十九)图像的分类:全连接层 2024-03-24 12:26
- 2024年2月三维重建(NeRF & 3D Gaussian)领域最新论文(下) 2024-03-24 16:50
- 2024年2月三维重建(NeRF & 3D Gaussian)领域最新论文(中) 2024-03-24 16:49
- 计算机视觉专家(伪装目标检测方向) 2024-03-25 14:35
- [CVPR2024] 阴影生成数据集DESOBAv2开源 2024-03-24 12:46
- 华为发布diffusion图像新模型PIXART-Σ,图片成品清晰度4K,对比Dall3、MJ V6效果突出! 2024-03-24 22:37
- 艾科瑞特科技:计算机视觉-人脸生成 2024-03-25 14:06
- 艾科瑞特科技:计算机视觉-人群密度估计模型 2024-03-25 14:26
- 艾科瑞特科技:计算机视觉-人脸检测关键点检测模型 2024-03-25 12:56
- [分享][每日更新][2024.03.22][CV_arxiv_papers] 2024-03-25 12:10
- 文章索引:视觉、文本表征和大模型 2024-03-24 18:43
- 艾科瑞特科技:计算机视觉-人脸检测模型-轻量级版 2024-03-25 13:54
- 艾科瑞特科技:计算机视觉-人脸检测模型-高级版 2024-03-25 13:38
- 图像检测入门(十七)卷积网络的工作原理概述 2024-03-24 12:21
- Live Object Detection and Image Segmentation with YOLOv8: 2024-03-23T06:16:25+00:00
视觉招聘小黑板
欲了解详情,请在公众号后台回复:240325
行业资讯
Teledyne e2v扩展适用于三维激光三角测量应用的Flash系列CMOS图像传感器--机器视觉网 2024-03-25 14:11:40
2024-03-25 14:11:40 来源: 中国机器视觉网
2024年3月12日,Teledyne e2v宣布扩展其Flash™ CMOS图像传感器系列,推出Flash 2K LSA,该产品专门适用于需要使用大沙伊姆弗勒角度(LSA)的激光轮廓应用。
Teledyne e2v的Flash系列CMOS图像传感器专为三维激光轮廓/位移应用和高速/高分辨率检测量身定制。Flash 2K LSA是Flash 2K传感器的衍生产品,适用于需要大沙伊姆弗勒角度的应用,其角度响应在30°角度下为四倍以上,在40°角度下为七 倍以上。当使用大沙伊姆弗勒角度时,除了提高图像质量外,该传感器还可以在系统层面优化激光线的功率。
Flash 2K LSA与Flash系列的其他成员共享相同的6 µm CMOS全局快门像素,将高
......长按二维码访问原文
视比特与国内打磨设备供应商携手创新,成功研发漆面自动磨抛修复系统--机器视觉网 2024-03-25 14:02:27
2024-03-25 14:02:27 来源: 中国机器视觉网
涂装工艺质量管控是汽车制造的关键环节之一,直接关乎汽车外观品质与竞争力。传统的漆面缺陷检测及修复方式多依赖人工,不仅效率低下、质量难以保证,且人为因素时常易致漏检、误检,增加后续维护成本。随着自动化和智能化技术快速发展,机器人与先进视觉技术的结合已能够实现对漆面缺陷的自动精准识别和高效修复,大幅提升了检测与修复的效率和质量,减少人为干扰,增强检测稳定性,为汽车制造品质管控提供了强有力的技术支持。
视比特自主研发的“PaintPro漆面缺陷检测系统”(点击回顾产品内容)已于2023年顺利投产于国内知名汽车主机厂的涂装车间,仅需60秒即可精准完成整车漆面的在线缺陷检测。而在2024年,视比特与国内打磨设备供应商携手创新,成功研发漆面自动磨抛修复系统
......长按二维码访问原文
光子精密重磅推出3D线激光轮廓测量仪GL-8000系列--机器视觉网 2024-03-25 13:54:16
2024-03-25 13:54:16 来源: 中国机器视觉网
光子精密重磅推出3D线激光轮廓测量仪GL-8000系列,以不凡的技术实力重塑3D领域竞争新态势,标志着国产3D技术在行业内的崛起,逐步打破进口产品的垄断地位,引领行业发展新潮流。
光子精密3D线激光轮廓测量仪GL-8000系列,覆盖7款型号,轻松应对不同线宽检测挑战。最高X轴、Z轴重复精度高达0.1μm,单点线性精度达±0.03% of F.S.,平面线性精度±0.006% of F.S,实现速度与精度双飙升,告别扫描缓慢,微小瑕疵无处遁形,为行业用户带来全新3D测量体验。
优化光学成像性能,提升测量准确性
GL-8000系列改进了相机硬件和机械设计,优化散热、轻量化体积和增强机械刚性,提供出色的测量性能,确保数据精确稳定。采用先进非球面镜
......长按二维码访问原文
“科亿科技x国轩高科”深度协同,构建创新AI锂电质检--机器视觉网 2024-03-25 13:22:04
2024-03-25 13:22:04 来源: 中国机器视觉网
近日,科亿科技董事长颜天信一行,在桐城,与国轩高科高层及桐城国轩新能源有限公司(国轩高科子公司)管理团队,双方就锂电产品视觉检测要点、难点,以及深化合作事宜展开专题会交流。国轩高科总部部分分管领导同步在线参加交流会。
国轩高科工研总院副院长徐兴无对科亿科技一行到来表示欢迎,并表达了双方深度协同,构建创新AI锂电质检的目标。他表示,作为一家负责任的企业,单一追求商业价值的发展模式不可持续,需要在商业活动中考虑创造社会价值。桐城国轩新能源有限公司作为动力电池行业领军企业国轩高科的子公司,已经明确将“聚焦高质量 打造新质生产力”作为公司的最高纲领,与科亿科技长期友好的合作关系,双方应充分发挥各自优势,强化资源互补与技术创新合作,在AI锂电池视觉检测领
......长按二维码访问原文
双U相机惊艳登场,实现高效率和优质传输的双重突破--机器视觉网 2024-03-25 11:55:00
双U相机惊艳登场,实现高效率和优质传输的双重突破
2024-03-25 11:55:00 来源: 中国机器视觉网
海康机器人推出新一代CH系列高端型工业相机MV-CH250-90VM/C,首次采用双U口传输方式,通过两路USB3.0线缆同步进行图像输出,可将传输速率提升至6Gbps,支持在2500万分辨率下每秒传输30帧。
该相机采用Gpixel的GMAX0505 CMOS全局快门芯片,适用于SMT/PCB AOI、FPD 检测、光伏等行业。
产品性能特点
双USB3.0接口传输2500万分辨率30帧的高速图像;支持快采慢传功能,突破最大带宽限制,快速采集图像;内置丰富的ISP功能,支持Gamma、色调、LUT等参数调节;支持超短曝光模式,可选曝光1微秒到10秒;可选多种像素格式,支持8-12位输出;
......长按二维码访问原文
汇萃智能助力磁材视觉检测:精密,准确,高效--机器视觉网 2024-03-25 15:16:18
2024-03-25 15:16:18 来源: 中国机器视觉网
磁材视觉检测的应用背景广泛,贯穿于磁性材料行业的方方面面。磁材在电子器件、计算机、医疗、航空航天、工业电机、机器人、汽车及新能源等领域得到广泛应用,因此,对磁材的表面缺陷进行精准检测不仅有助于提高产品质量,同时也是满足行业运行和发展需求的必要手段。
磁铁磁材视觉检测设备是通过机器视觉产品CCD图像传感器将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号,图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作对产品做出精确的判断。
在磁铁磁材行业的生产制造过程中,视觉检测扮演着重要的角色。使用机器视觉检测技术,可以有效地提高生产效率、产品质量和降低生产成本。
......长按二维码访问原文
沃德普助力工业相机感光元件组保护玻璃定位检测--机器视觉网 2024-03-25 15:07:34
2024-03-25 15:07:34 来源: 中国机器视觉网
检测背景
感光元件组是将进入镜头的光转化为模拟电信号的电子元件,也是工业相机最关键的核心器件。
这款感光元件组表面有层保护玻璃(上图白色部分),用于保护下面的感光芯片。此次检测项目为保护玻璃的定位以及玻璃上方的脏污或者缺陷,若检测出保护玻璃的位置出现偏差、保护玻璃表面破损、脏污等,都会严重影响工业相机输出的成像质量。
检测项目
检测方案
由于这款芯片的保护玻璃表面反射率高,我们采用了远心镜头和高精度的同轴光源提供外置垂直方向的明场光效,能有效检测出芯片表面的脏污斑点和边缘的崩裂。
· 成像效果图
· 成像示意图
产品介绍
高精度同轴光源:COH系列。拥有高亮、高分辨率成像,在检测高反光工件时,可以消除重影现象。
......长按二维码访问原文
良品学习在高良率制造业中缺陷检测的应用--机器视觉网 2024-03-25 14:59:28
2024-03-25 14:59:28 来源: 中国机器视觉网
电子制造行业正逐步迈向高度“数智化”时代,越来越多的企业开始采用AI机器视觉技术进行缺陷检测和品质管控。
由于良品率极高,在大量正常的产品中,收集缺陷样本既耗时又低效。而模拟制造缺陷品也绝非易事,产品缺陷形态多变,还可能出现各种无法预测的异常情况,传统的缺陷模拟方法往往难以应对,这无疑增加了检测的成本和难度。
良品学习
阿丘科技的良品学习模式,拥有非监督分类与非监督分割两大功能,无需缺陷样本,通过学习良品的共性特征,即可自动识别异常,找出不良品。此功能经由真实工业场景打磨,已落地部署并批量复制,惠及电子制造行业各类生产工艺的品质管控。
只训练良品图,缩短样本收集和模型上线的时间;具有防呆效果,适用于检测无法预测的未知缺陷;精度准确率高,可
......长按二维码访问原文
深度解析棱镜相机镜头 —为何它能超越传统镜头?--机器视觉网 2024-03-25 14:48:07
2024-03-25 14:48:07 来源: 中国机器视觉网
棱镜式相机与标准的单传感器相机不同,它通过多个传感器同步采集多个不同波段的图像,使用单个镜头共享同一光路。这类相机将入射光线分配到多个通道,各个通道的图像无论是在运动时或是不同的测量视角下均可实现像素级的对准精度。
镜头的作用
镜头是成像系统的关键组成部分,将特定角度的光线聚焦于传感器,以此将三维空间呈现于二维平面。相机镜头通常包含多个镜片,其材料、厚度、半径、镀膜各不相同,这决定了镜头的视角(FOV)。针对不同的相机和应用场景进行的优化,也导致其成本各不相同。
棱镜式相机镜头选型的重要性无需赘言,不仅要考虑适当的焦距、成像圈以及满足帧率、景深和光照条件的光圈等参数,也要考虑镜头在设计上是否针对棱镜式相机进行了优化。那么真正的原因是什么呢?
......长按二维码访问原文
什么是光圈?它是如何影响成像的?--机器视觉网 2024-03-25 14:20:45
什么是光圈?它是如何影响成像的?
2024-03-25 14:20:45 来源: 中国机器视觉网
在选型中,F数不仅是影响景深的一个变量,同时也会影响镜头的分辨率。有些工程师提出过疑问:究竟光圈开到多大时,才能得到最好的成像呢?
我们中学时学过,光经过一个小孔会有衍射(绕射)的现象,如下图所示,衍射图案是中心亮,周边逐渐变暗的圆环(称为艾里斑)。而孔越小,衍射现象越明显,圆斑越大!对于镜头成像也一样,光经过镜头的孔径(光圈)成像到像面,也是一个衍射的过程,当然同样,光圈开得越小,成像的圆斑越大,图像越模糊。(计算公式:艾里斑直径=2.44*λ*F数)所以,我们大致有个方向:光圈开得越大,理论上成像越好!
我们一般用MTF曲线来评价镜头成像的好坏(可以发送“MTF”获取对应的介绍文章),那么,我们就看下光
......长按二维码访问原文
基于AI和光学测量的卷对卷在线缺陷检测系统―新闻频道- 视觉系统设计 2024/3/25 19:59:02
图1:SURFinpro是专门设计用于卷对卷生产的检测系统,它利用人工智能和光学测量技术,实时检测、分类和可视化缺陷。
德国弗劳恩霍夫材料与光束技术研究所(Fraunhofer IWS),专门针对卷对卷(roll-to-roll)加工应用开发了一种新型AI辅助的自动检测系统——SURFinpro,它利用AI和光学测量技术实时地检测、分类和可视化缺陷,可以快速、高分辨地获取表面三维信息。
卷对卷加工是指从一卷基材(如箔、柔性玻璃或塑料)开始,并在该基材上连续施加非常薄的多个层,以形成输出卷的制造过程。一旦材料卷加工完成后,就可以将其切割成合适的成品尺寸。
这种工艺通常用于制造薄膜晶体管和半导体等产品,因为它可以降低生产成本。表面计量团队负责人christopher Taudt透露,在开发这种检测解决方案的过
......长按二维码访问原文
高芯科技携红外全产业链产品和解决方案参展上海慕尼黑光博会―新闻频道- 视觉系统设计 2024/3/25 19:55:29
3月20-22日,上海新国际博览中心,由慕尼黑展览(上海)有限公司主办的第十八届慕尼黑上海光博会拉开大幕。本次慕尼黑光博会聚焦光学组件/材料、光学设备、光学检测/精密仪器、摄像镜头等关键领域,助力打造光电产业新生态,致力推动产业高质量发展。高芯科技协同兄弟厂商一站式展示红外热成像从探测器芯片、红外机芯模组,再到整机及平台系统的全产业链产品形态。
1280×1024@7.5μm
领衔制冷红外前沿,把控热像核心科技
大面阵红外焦平面阵列是高清热成像的必要条件,而小像元是实现高端红外组件轻量化的必经之路。高芯科技1280×1024@7.5μm红外探测器是业内百万像素小像元制冷红外核心器件的先驱之作,代表国内制冷红外核心技术进入全球头部行列。
行业机芯及模组
SWaP性能提升,行业深度赋能
当下各个厂商愈发
......长按二维码访问原文
海康机器人新一代CH系列高端型工业相机发布―产品聚焦频道- 视觉系统设计 2024/3/25 19:48:33
海康机器人推出新一代CH系列高端型工业相机MV-CH250-90VM/C,首次采用双U口传输方式,通过两路USB3.0线缆同步进行图像输出,可将传输速率提升至6Gbps,支持在2500万分辨率下每秒传输30帧。
该相机采用Gpixel的GMAX0505 CMOS全局快门芯片,适用于SMT/PCB AOI、FPD 检测、光伏等行业。
产品性能特点
双USB3.0接口传输2500万分辨率30帧的高速图像
支持快采慢传功能,突破最大带宽限制,快速采集图像
内置丰富的ISP功能,支持Gamma、色调、LUT等参数调节
支持超短曝光模式,可选曝光1微秒到10秒
可选多种像素格式,支持8-12位输出
兼容GenICam标准
双USB3.0传输方案
6G超大传输带宽
相机采用两个USB3.0标准接口共同
......长按二维码访问原文
异色检测创新方案:混合数据相机高精度彩色成像―技术与应用频道- 视觉系统设计 2024/3/25 19:39:44
图1:混合数据相机图片
在生产制造过程中,产品易受原材料、环境、制程等因素影响,产生氧化变色、变形、轻微磨损或坑眼等各类外观瑕疵。3C领域,如常见的手机、平板、智能手表及电脑,其外观品质直接影响消费者的购买决策,因此3C制造业对外观质量把控尤其严格。
3C制造业通常基于视觉检测来实现对产品颜色的检测,也就是行业里常说的“异色检测”。采用传统工业相机作为图像采集模组的检测系统,硬件构成较为复杂,同时需要基于经验不断尝试光源方案和硬件系统的部署架构。同一套系统往往只能够检测同一类产品,当实际检测对象需要切换时,检测方案也需要进行调整,整个系统部署的便利性和通用性(柔性)都需提升。
盛相科技混合数据相机以其出色的硬件端图像处理能力、高集成度的硬件和高柔性,在异色检测方面展示了巨大的潜力及价值。
表1:传统工业
......长按二维码访问原文
深视智能线激光助力手机中框点胶引导和胶路检测―技术与应用频道- 视觉系统设计 2024/3/25 19:27:01
手机中框点胶
在消费电子产品中,点胶引导和胶路复检是屏幕模组和手机中框贴合组装工序中保证手机质量的关键所在。传统2D视觉点胶引导使用LED光源,对壳料的材质及颜色兼容性差、对环境光敏感;成像为2D图片,无法抓取高亮或透明胶的真实高度和壳料胶道的真实边缘;拍照视野小,无法覆盖整个壳料胶道。
深视智能三维激光轮廓测量仪分辨率达6400像素点,测量精度高达1μm,最快扫描帧率67000Hz/s;在太阳光、快速环境光强度变化下,3D视觉能够可靠工作,不仅能够准确测量黑色、反光、半透明等多种胶水的轮廓,实现高速成像、高精度成像、高分辨率成像、抗反光成像;还能精确计算胶线位置、胶高、胶宽,并进行缺陷判定。
检测项目
......长按二维码访问原文
图像检测入门(十九)图像的分类:全连接层 2024-03-24 12:26
前面我们已经了解了简单的线条如何组成部件特征,那么由部件如何推理出图像的分类呢?我们已经知道,图像的分类是通过全连接层来实现的,这里我们就来讲解全连接层的原理。
在介绍“特征提取”的时候,我们已经知道,一个部件在图像中是否出现,仅需一个特征值即可表示,比如在上面的例子中,倘若在图像(或者二维矩阵)中出现一个正数(1865),则认为“左横”这一特征出现了,接下来再用一些加工方法,比如说池化,下采样层,对其进行简化,使其成为一个像素点,那么该点的值则代表了“左横”这一特征,如果特征值为非零,则认为“左横”这一特征被提取到了。
关于这些加工方法,我还没来得及做完整的分析验证,也许并不只是下采样那么简单,但有一点是肯定的,即在最后开始全连接的时候,全连接层的输入层,其每一个像素点确实代表了一个特征,而不是由每一通道
......长按二维码访问原文
2024年2月三维重建(NeRF & 3D Gaussian)领域最新论文(下) 2024-03-24 16:50
文章来自Arxiv,翻译来自ChatGPT,内容为作者本人手工整理
跟踪关键词
Neural Radiance Fields
NeRF
Gaussian Splatting
Multi-View Reconstruction
2402.12184 ——Colorizing Monochromatic Radiance Fields
尽管神经辐射场(NeRF)可以利用一组2D图像生成世界的彩色3D表示,但当仅提供单色图像时,这种能力就不存在了。由于颜色在表示世界时是必需的,因此从单色辐射场中再现颜色变得至关重要。为了实现这一目标,我们不直接操作单色辐射场,而是将其视为Lab颜色空间中的表示预测任务。通过首先使用单色图像构建亮度和密度表示,我们的预测阶段可以基于图像着色模块重新创建颜色表示。然后,我们
......长按二维码访问原文
2024年2月三维重建(NeRF & 3D Gaussian)领域最新论文(中) 2024-03-24 16:49
文章来自Arxiv,翻译来自ChatGPT,内容为作者本人手工整理
跟踪关键词
Neural Radiance Fields
NeRF
Gaussian Splatting
Multi-View Reconstruction
2402.05532 ——NCRF: Neural Contact Radiance Fields for Free-Viewpoint Rendering of Hand-Object Interaction
建模手物交互是三维计算机视觉中一项根本性挑战的任务。尽管在这个领域已经取得了显著的进展,但现有方法仍然无法逼真地合成手物交互,受到手和物体之间相互遮挡导致的渲染质量下降和不准确的手物体姿态估计的影响。为了解决这些挑战,我们提出了一种新颖的自由视点渲染框架,称为神经接触
......长按二维码访问原文
计算机视觉专家(伪装目标检测方向) 2024-03-25 14:35
职位名称:计算机视觉专家(伪装目标检测方向)
职位概述:
我们正在寻找一位经验丰富的计算机视觉专家,专注于伪装目标检测领域。该职位将负责领导和执行复杂的计算机视觉项目,特别是在伪装目标检测和识别方面。理想的候选人应具有深厚的理论知识和实践经验,能够利用先进的算法和技术来提高目标检测的准确性和效率。
主要职责:
1. 研究和开发先进的计算机视觉算法,专注于伪装目标的检测和识别。
2. 设计和实施实验,验证算法在实际场景中的性能。
3. 与团队合作,将计算机视觉算法集成到现有的系统和产品中。
4. 持续关注行业动态,评估和采纳新技术以提升团队的技术能力。
5. 编写技术文档,为团队成员提供培训和指导。
任职要求:
1. 计算机科学、电子工程、数学或相关领域的硕士或博士学位。
2. 至少
......长按二维码访问原文
[CVPR2024] 阴影生成数据集DESOBAv2开源 2024-03-24 12:46
我们开源了阴影生成数据集DESOBAv2,用于为合成图中新插入的前景物体生成阴影。DESOBAv2是我们之前DESOBA数据集的拓展。如下图所示,从左到右依次是合成图、前景物体掩码、前景阴影掩码、背景物体掩码、背景阴影掩码、目标图。
我们正式的DESOBAv2数据集一共21,575张图片,共包含28,573对物体和阴影。在构建数据集的过程中废弃不用的图片我们也一并公开,方便后续进一步扩展数据集。
GitHub链接:https://github.com/bcmi/Object-Shadow-Generation-Dataset-DESOBAv2
......长按二维码访问原文
华为发布diffusion图像新模型PIXART-Σ,图片成品清晰度4K,对比Dall3、MJ V6效果突出! 2024-03-24 22:37
前言
这两年,文本到图像生成模型 的需求不断增长,但 高质量图像 的生成往往面临资源密集型训练和慢推理的挑战,制约了其实际应用。
在年前,华为就发布了一款图像生成新框架 PIXART-δ ,引入ControlNet,加速文本生成图像生成,可以在 8GB GPU 上合成 1024px 图像,大大增强了其可用性和可访问性!
PIXART-δ 为SD模型系列提供了一种有前途的替代方案,而这不到2个月的时间华为诺亚方舟实验室又发布新一代图形生成模型 PIXART-Σ 。
不得不说华为真的是取名鬼才,把数学符号用到极致了。
PIXART-Σ 新模型更是可以生成 4K 图像。
项目介绍
PIXART-Σ 是华为诺亚方舟实验室联合香港大学、大连理工等共同研发的一款用于 4K 文本到图像生成的新模型。
相较于前
......长按二维码访问原文
艾科瑞特科技:计算机视觉-人脸生成 2024-03-25 14:06
艾科瑞特科技:计算机视觉-人脸生成
关键词:目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创
内容摘要:
人脸生成技术模型尤其擅长生成人脸图像,能够基于输入的随机种子生成高清晰度(分辨率为1024x1024)的人像图片,应用场景如下:
艺术创作:艺术家可以利用人脸生成模型生成独特的人脸图像,作为创作的灵感来源或直接作为艺术品。
娱乐产业:在电影、游戏和动画等娱乐产业中,人脸生成模可用于生成逼真的角色模型,提高视觉效果。
广告与营销:在广告制作和营销活动中,利用人脸生成模生成的人脸图片可以吸引目标受众的注意力,提升品牌形象。
社交媒体:在社交媒体平台
......长按二维码访问原文
艾科瑞特科技:计算机视觉-人群密度估计模型 2024-03-25 14:26
艾科瑞特科技:计算机视觉-人群密度估计模型
关键词:目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创
内容摘要:
人群密度估计模型是一种专门设计用于分析图像中人群数量的深度学习模型。它不仅能够估计图像中人群的总数,还能生成对应的heatmap图,展示人群在图像中的分布和密度情况,其应用场景如下:
公共安全监控:用于实时监测公共场所(如火车站、商场、体育场馆等)的人群密度,预防拥挤和踩踏事件。
交通管理:通过分析交通监控图像,评估交通拥堵情况,优化交通流量控制。
城市规划:辅助城市规划者了解城市不同区域的人群分布,优化公共设施布局。
大型活动管理:在
......长按二维码访问原文
艾科瑞特科技:计算机视觉-人脸检测关键点检测模型 2024-03-25 12:56
艾科瑞特科技:计算机视觉-人脸检测关键点检测模型
关键词:目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创
内容摘要:
人脸检测关键点模型具有广泛的应用场景,包括但不限于以下:
视频监控:在公共安全领域,模型可用于实时监测摄像头捕捉到的人脸,实现人脸识别、追踪和行为分析等功能,提升监控系统的智能化水平。
人像美颜:在摄影和图像处理领域,模型可自动定位人脸关键点,为美颜算法提供精确的人脸特征信息,实现自动磨皮、瘦脸、大眼等美颜效果。
互动娱乐:在游戏、社交等互动娱乐领域,模型可用于实现人脸表情识别、虚拟形象生成等功能,丰富用户的娱乐体验。
人脸比对:
......长按二维码访问原文
[分享][每日更新][2024.03.22][CV_arxiv_papers] 2024-03-25 12:10
Publish Date Title Title_CN Authors PDF Code
2024-03-22 Long-CLIP: Unlocking the Long-Text Capability of CLIP Long-CLIP:解锁 CLIP 的长文本功能 Beichen Zhang, Pan Zhang, Xiaoyi Dong, Yuhang Zang, Jiaqi Wang http:// arxiv.org/pdf/2403.1537 8v1 null
2024-03-22 Learning Topological Representations for Deep Image Understanding 学习拓扑表示以进行深度图像理解 Xiaoling Hu http:// arxiv.
......长按二维码访问原文
文章索引:视觉、文本表征和大模型 2024-03-24 18:43
前段时间写了几篇长综述类文章,系统总结了文本大模型和多模态大模型发展过程中的经典工作。这篇文章的内容汇总到了一张简图里,方便快速查看,顺便水一篇文章。后面有新的相关内容会更新到这篇文章里。
视觉和文本表征与大模型
文章链接:
......长按二维码访问原文
艾科瑞特科技:计算机视觉-人脸检测模型-轻量级版 2024-03-25 13:54
艾科瑞特科技:计算机视觉-人脸检测模型-轻量级版
关键词:目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创
内容摘要:
人脸检测模型-轻量级版是一个专门为快速且准确地检测图像中人脸位置而设计的模型,其适用场景:
人像美颜:在拍照或视频通话时,通过人脸检测模型定位人脸位置,进而实现自动美颜、磨皮等效果,提升用户体验。
互动娱乐:在游戏、社交平台等互动娱乐场景中,利用人脸检测模型实现人脸追踪、表情识别等功能,增加互动性和趣味性。
人脸比对:在安防、身份验证等领域,通过人脸检测模型定位人脸位置,再进行人脸特征提取和比对,实现快速准确的人员识别。
智能相册
......长按二维码访问原文
艾科瑞特科技:计算机视觉-人脸检测模型-高级版 2024-03-25 13:38
艾科瑞特科技:计算机视觉-人脸检测模型-高级版
关键词:目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创
内容摘要:
人脸检测模型是高效的模型,专门用于在图像中检测人脸的位置。该模型经过大量数据的训练和优化,能够准确识别出图像中的人脸,并返回人脸的位置信息。无论是单张人脸还是多张人脸,该模型都能进行准确的检测,适用于应用场景:
人像美颜:在拍照或视频通话时,自动检测人脸并进行美颜处理,提升用户形象。
互动娱乐:在游戏或应用中,通过人脸检测实现人脸识别登录、表情识别等互动功能。
人脸比对:在安全验证、身份验证等场景,通过比对两张人脸的相似性来进行身份确
......长按二维码访问原文
图像检测入门(十七)卷积网络的工作原理概述 2024-03-24 12:21
在介绍了卷积网络是什么之后,我们终于可以来分析为什么卷积网络能够实现图像检测的功能。首先,什么是图像的检测?图像检测其实要解决的是一个图像分类的问题,即这张图是什么。图像分类有两种方式,一种是二分类,即一张图像是某个对象,或不是某个对象,是回答一个是和否的问题。另一种方式是多分类,给定一个完整的分类列表,分别计算图像属于每一个分类的概率是多少,比如一张照片,它上面是猫,狗,兔子的概率分别是多少,还是什么都不是。
那么卷积网络是如何完成这一分类任务的呢?
还是借用上面那张图,用一个形象但不那么准确的解释:首先,网络第一步是提取特征,而提取特征又是按从小到大的过程,最开始提取到的是线条,由线条再组成部件,再由部件再组成整体。然后根据计算出来的每一类整体的概率,进行分类判断。
比如说,要识别一只猫,我们首先提取
......长按二维码访问原文
Live Object Detection and Image Segmentation with YOLOv8: 2024-03-23T06:16:25+00:00
Introduction
In computer vision, different techniques for live object detection exist, including Faster R-CNN, SSD, and YOLO. Each technique has its limitations and advantages. While Faster R-CNN may excel in accuracy, it may not perform as well in real-time scenarios, prompting a shift towards the YOLO algorithm.
Object detection is fundamental in compute
......长按二维码访问原文