文章目录[隐藏]
- 视觉招聘小黑板
- 行业资讯
- 考研经验贴|广东工业大学自控专业考研上岸,初试题型规律总结分享 2024-01-17 09:31
- CMVU会员企业梅卡曼德与知象光电双双入选2023福布斯中国·出海全球化品牌TOP 30--机器视觉网 2024-01-16 10:29:37
- 天准TZDI-4系列重磅上市,IC载板激光直接成像设备--机器视觉网 2024-01-17 10:13:58
- Teledyne推出Spinnaker SDK:专为机器视觉构建的 API 库--机器视觉网 2024-01-17 10:52:20
- 摇橹船科技入选“满天星”首批示范名单,“3D+机器人+智能视觉”--机器视觉网 2024-01-17 11:08:12
- 走进百威啤酒厂,寻找ifm传感器的智能运用--机器视觉网 2024-01-16 15:09:40
- 效率提升250%,高精度三维扫描打造精准高效控制机加工余量新方式!--机器视觉网 2024-01-16 14:32:27
- 常见滤波性光学器件优劣势对比--机器视觉网 2024-01-16 14:12:33
- AI机器视觉多场景应用迸发检测活力,引领食品及包装行业新发展--机器视觉网 2024-01-16 13:53:24
- 深视智能高速相机助力锂电行业机械动作故障监测--机器视觉网 2024-01-16 13:47:45
- 透明塑料件案例检测,高效满足生产需求--机器视觉网 2024-01-16 13:34:25
- 大族视觉医疗试管表面缺陷检测--机器视觉网 2024-01-16 13:25:06
- 标识包装视觉检测——二维码读取--机器视觉网 2024-01-17 13:24:47
- 机器视觉表面缺陷检测技术的主要问题与发展趋势--机器视觉网 2024-01-17 13:35:50
- 锂电密封钉漏焊、爆点和凹坑3D检测应用--机器视觉网 2024-01-17 13:43:46
- LINX-AI 虚拟数据生成器用起来,AIGC赋能工业--机器视觉网 2024-01-17 13:52:22
- 机器视觉中如何解决工业相机丢帧问题-电子发烧友网 2024-01-16 15:39
- 光学系统的 MTF 与分辨率之间有什么关系?-电子发烧友网 2024-01-16 10:11
- 机器视觉基础知识点总结 2023-10-07 16:39:43
- 人机界面-电子发烧友网 2024-01-16
- 瑞萨RZ/V系列产品介绍-电子发烧友网 2024-01-16 12:15
- 瑞萨公司产品和工程师社区-电子发烧友网 2024-01-17
- 新技术:使用超光学器件进行热成像 2023-12-15 13:58:19
- 光学器件-电子发烧友网 2024-01-04
- 光鉴科技完成2亿元B轮融资,推进3D视觉技术多领域落地应用―新闻频道- 视觉系统设计 2024/1/15 23:43:53
- 梅卡曼德入选2023福布斯中国・出海全球化品牌TOP 30―新闻频道- 视觉系统设计 2024/1/15 23:14:10
- Teledyne 发布最新版本的 Sapera Vision 软件―新闻频道- 视觉系统设计 2024/1/16 22:22:55
- 凌华科技SuperCAT运动控制器在LED芯片分选机上的应用―技术与应用频道- 视觉系统设计 2024/1/16 22:32:30
- 深视智能高速相机在激光3D打印领域的应用―技术与应用频道- 视觉系统设计 2024/1/16 22:50:12
- ResNet论文解读 2024-01-16 18:09
- NeRF-VO:实时稀疏视觉里程计与基于NeRF的稠密重建 2024-01-16 10:37
- ICRA 2024 | 首届RoboDrive自动驾驶挑战赛正式开始啦! 2024-01-16 07:42
- 涨点!改进航空图像中旋转小目标检测 2024-01-15 22:47
- 慕尼黑工业大学最新提出!单目实时密集建图的混合隐式场方法 2024-01-15 18:45
- 基于反卷积方法的重大突破:结构光系统中的测量误差降低3倍 2024-01-15 18:40
- AAAI 2024 | 首篇!FRED:航空图像目标检测中实现完全旋转等变性 2024-01-16 19:01
- 3D视觉生成LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching港科广陈颖聪团队 2024-01-16 19:24
- 论文解读:Multiclass Confidence and Localization Calibration for Object Detection (CVPR 2023) 2024-01-16 19:37
- DCNv4来袭,更快收敛、更高速度、更高性能! 2024-01-16 20:44
- DreamGaussian:高效3D生成的生成式Gaussian Splatting - 知乎 2024-01-16 23:24
- 大模型背景下计算机视觉年终思考小结(下) 2024-01-16 20:25
- CV计算机视觉每日开源代码Paper with code速览-2024.1.16 2024-01-17 00:00
- ICLR 2024 Oral | Adobe提出LRM:单个图像到3D的大型重建模型 2024-01-17 10:04
- 通过量子启发方法揭示隐藏在噪声中的图像 2024-01-17 08:41
- AAAI 2024 | TEx-Face,5秒内按需生成照片级3D人脸 2024-01-17 14:42
- 如何看待meta最新的工作:将MAE扩展到billion级别(模型和数据)? 2023-03-25 13:43
- 大规模视觉模型新突破!70亿参数!Apple新作AIM:大型自回归图像模型的可扩展预训练 2024-01-17 17:36
- How to Build a Parking Lot Monitoring System with Computer Vision: 2024-01-17T10:15:25.000Z
- YOLO Loss Function Part 1: SIoU and Focal Loss: 2024-01-16T14:00:00+00:00
视觉招聘小黑板
欲了解详情,请在公众号后台回复:240117
行业资讯
考研经验贴|广东工业大学自控专业考研上岸,初试题型规律总结分享 2024-01-17 09:31
深入了解广东工业大学考研难度及题型规律,助你轻松攻克自动控制原理试题!本文为你详细分析自控专业历年试题的题型规律,揭示基础题、时间域、复数域、频率域等题目的出题思路,为你提供学长独家整理的参考教材,分享实用的备考建议,快快点赞收藏,si信获取更多资料
一战成功上岸广东工业大学自控专业,给学弟学妹们分享一些复习建议,主要围绕题型规律总结进行分享,希望能给需要的同学带来帮助~
一、整体难度分析
广东工业大学的自控专业课试题难度适中,历年来自控平均分能够达到110+。虽然有时会出现超纲题目,但只要敢于面对困难,自控专业课依然可以成为总成绩取得高分的稳定保障。 建议选择自控专业课而非信号处理,因为信号处理相关资料较少,而自控资料丰富。考试范围大多在教材大纲之内,因此掌握大纲知识点是关键。
二、具体题型规律
参
......长按二维码访问原文
CMVU会员企业梅卡曼德与知象光电双双入选2023福布斯中国·出海全球化品牌TOP 30--机器视觉网 2024-01-16 10:29:37
2024-01-16 10:29:37 来源: 中国机器视觉网
福布斯中国秉承“立足中国,连接世界”的愿景,长期保持对中国商业社会发展的关注,并在2023年和福科无限携手推出“2023福布斯中国·出海全球化30 & 30评选”。
该榜单主要关注在2023年度中国品牌全球化领域中积极创新、且具有明显行业影响力的企业,设“领军品牌”和“赛道先锋”两个类别。此次共同入选此榜单的还有比亚迪、长城、一汽红旗、青岛啤酒等头部企业。
“领军品牌”入选品牌所在企业都是独角兽级别及以上企业,估值或市值均在100亿人民币以上,部分企业的市值超过1,500亿;“赛道先锋”入选品牌所在企业的总估值则超过1,000亿人民币。具体来看,所有30家全球化企业都已经在海外设立公司主体以及拥有海外雇员,其中有60%的企业,其出海业务占
......长按二维码访问原文
天准TZDI-4系列重磅上市,IC载板激光直接成像设备--机器视觉网 2024-01-17 10:13:58
2024-01-17 10:13:58 来源: 中国机器视觉网
随着科技的飞速发展,IC载板已经成为电子行业的重要组成部分。据Prismark统计,2022年全球IC载板行业规模已达174亿美元(同比增长20.90%);预计到2026年全球规模将达到214亿美元,复合增长率达到8%左右。
IC载板激光直接成像设备,引领IC封装行业发展
在快速增长的市场环境中,如何提高生产效率和产品质量,降低生产成本,成为了行业内关注的焦点。而IC载板激光直接成像设备的出现,正是解决这些问题的关键。它以其高效、精准的特性,为行业带来了革命性的变革,正在引领IC封装行业的发展。
传统的成像工艺采用有机菲林或者玻璃光罩形成电路图像,而IC载板激光直接成像设备仅使用计算机控制的高度聚焦激光束,直接在覆盖有光阻材料的PCB上形成
......长按二维码访问原文
Teledyne推出Spinnaker SDK:专为机器视觉构建的 API 库--机器视觉网 2024-01-17 10:52:20
2024-01-17 10:52:20 来源: 中国机器视觉网
借助广泛的 Teledyne GigE 和 USB3 面阵扫描相机支持,工程师可以使用 Spinnaker 快速开发用于视觉应用的软件解决方案。通过提供完全控制相机的选项,Spinnaker 允许用户管理图像处理管道的每一个环节。此外,Spinnaker 还支持通过相机功能来保证系统面向未来的方法,这些功能可以通过动态加载到计算机中来添加,而无需重新编译代码。
GigE Multiplicity
Teledyne IIS GigE Vision 框架旨在提供卓越的性能并与要求苛刻的应用程序无缝集成。Spinnaker 借鉴了 Teledyne IIS 数十年在全球提供一流机器视觉 GigE 相机的经验。它使系统能够保持零错误和从多个 GigE
......长按二维码访问原文
摇橹船科技入选“满天星”首批示范名单,“3D+机器人+智能视觉”--机器视觉网 2024-01-17 11:08:12
2024-01-17 11:08:12 来源: 中国机器视觉网
近日,重庆市经济和信息化委员会公示重庆市软件和信息服务业“满天星”示范企业(第一批)创建名单,摇橹船科技成功入选。据悉,进入创建名单的企业在创建期满后,达到创建标准的,重庆市经济信息委将对创建成功的企业命名为“重庆市软件和信息服务业‘满天星’示范企业”,同时将整合各方政策资源支持其持续发展壮大。
此次评选旨在深入落实《重庆市软件和信息服务业“满天星”行动计划(2022—2025年)》,助力数字重庆和现代制造业集群体系建设,加快培育一批细分领域优质软件企业,通过示范带动效应助力软件产业高质量发展。秉承“优中选优”的评审原则,入选示范企业不仅要具备较强的研发实力和较好的成长性,还需有突出的人才优势,并在深耕行业或细分市场有突破性创新成果。
摇橹船
......长按二维码访问原文
走进百威啤酒厂,寻找ifm传感器的智能运用--机器视觉网 2024-01-16 15:09:40
2024-01-16 15:09:40 来源: 中国机器视觉网
在食品饮料行业,尤其是啤酒酿造这样的复杂工艺中,制造商永远在追求最佳的过程可靠性和产品质量。哪怕一点点杂质都会造成灾难,例如导致整个批次产品召回或高昂的停机时间。因此ifm一直致力于针对食品饮料行业创新产品的研发,为客户提供高质量可靠的解决方案。
位于福建莆田的百威雪津啤酒厂是百威旗下的世界级低碳智慧工厂,单体产能全球领先,年产能可达200万吨。一罐罐品质上乘的啤酒从这里生产并销往世界各地。风味浓郁的佳酿需要经过糖化、发酵、过滤、灌装等环节。为了确保啤酒的高品质和优良口感,百威啤酒工厂采用了ifm先进的传感与控制技术。
糖化车间
糖化,是啤酒生产中至关重要的一步。在这个工序中,麦芽和其他辅料在糖化罐内混合并加热,形成麦芽浆。随后,啤酒花被引
......长按二维码访问原文
效率提升250%,高精度三维扫描打造精准高效控制机加工余量新方式!--机器视觉网 2024-01-16 14:32:27
2024-01-16 14:32:27 来源: 中国机器视觉网
高精度三维扫描技术作为一项高效准确的工业光学3D测量工具,在工业制造中为产品的形面尺寸控制、产品原型设计等提供了一项优选方式,实实在在助力制造企业降本增效。本期,我们将介绍高精度工业三维扫描技术在加工余量精准、高效控制中的作用。
机加工行业加工余量控制痛点
在精密机加工的过程中,由于产品的形面精度要求很高,加工余量的控制至关重要,一旦过切,则整个材料将报废,造成损失。
为了准确掌握加工余量,传统方式下,在加工末期,会不断使用三坐标来进行尺寸检测。但是,使用这种方式,必须将产品从机床上吊装下来,运送至三坐标室进行检测,之后再重新进行装夹和机加工。
如此往复,整体的加工效率低,且多次装夹会存在误差,还是较难避免过切的情况,总体而言效率较低且存
......长按二维码访问原文
常见滤波性光学器件优劣势对比--机器视觉网 2024-01-16 14:12:33
2024-01-16 14:12:33 来源: 中国机器视觉网
宽带光源&波长选择
光谱学和显微学利用光的物体相互作用来得到物理和化学信息。选择合适的波段输出是光谱学和显微成像学中的一个关键步骤。随着不同类型光源的发展、传感器灵敏度和探测速度的提升以及光学元件制造技术的发展,光谱学和显微学不断进步。这些系统被广泛应用于学术科研、医疗和工业等领域。
在光谱成像中,可以通过映射测量得到一个样品不同参数的数值,广泛地应用于食品加工、气候监测、医药成像技术和机器视觉。所需的光源波长会随着检测目的发生变化,因为激发波长的多样性和所得光谱中的信息数量存在着密切的关系。单色性的激光光源是光谱学和显微学的理想光源,因为其具有非常窄的半峰宽(FWHM)、强大功率和相干特性,但覆盖全波段的激光光源往往价格昂贵。
在宽带
......长按二维码访问原文
AI机器视觉多场景应用迸发检测活力,引领食品及包装行业新发展--机器视觉网 2024-01-16 13:53:24
2024-01-16 13:53:24 来源: 中国机器视觉网
随着食品安全意识的广泛传播,人们对食品质量和安全的要求越来越高,众多食品包装厂商加速产线数智化转型,迫切需要高效、准确且智能化的检测技术。
在现代食品及包装行业的自动化生产中,涉及到各种各样的识别、检测、测量等环节,通过机器视觉技术能够实现外观缺陷检测、尺寸测量和条码和字符识别等环节的高效应用,持续赋能连续大批量生产、外观质量要求较高的食品及包装行业场景。
机器视觉检测技术赋能食品包装多场景应用
机器视觉检测技术通过计算机视觉和人工智能技术,对图像进行分析和处理,以实现自动化的目标检测、识别和追踪。同时机器视觉检测能够适应不同场景检测需求,适用于缺陷形态繁杂、环境复杂的检测目标,尤其在食品、包装、饮料等需要对产品进行大批量识别、检测的行业中
......长按二维码访问原文
深视智能高速相机助力锂电行业机械动作故障监测--机器视觉网 2024-01-16 13:47:45
2024-01-16 13:47:45 来源: 中国机器视觉网
随着现代化工业的发展,工厂中的大规模批量制造和高速生产线,逐步利用高速工业机器人或高速高频机加工设备,代替人工完成重复性、周期性的体力劳动,例如快速印刷行业、高速贴片机、纺织机械和食品医药行业等。
同时效率和工艺要求的提高,也使机械运转的速度越来越快,机械运转过程中往往会出现各种机械动作故障。大部分机械运动动作很快,无法通过肉眼去观察到具体原因。
深视智能高速相机可以捕捉到快速旋转或震动的零部件的图像,从而确定故障的位置和原因以及毫秒级的时间精度。同时,通过轨迹跟踪算法,可以对运动状态进行准确分析和预测。
然而这些故障发生时间和位置具有很大的偶然性和不确定性,如锂电电芯卷绕过程中往往需要长时间采集,从海量数据中挑选出关键数据,这种方案费时费
......长按二维码访问原文
透明塑料件案例检测,高效满足生产需求--机器视觉网 2024-01-16 13:34:25
2024-01-16 13:34:25 来源: 中国机器视觉网
背景知识
在塑料件的生产过程中,表面缺陷及平面度检测是工业制造中的重要一环。常见的表面缺陷有裂纹、气泡、划痕等,这些缺陷会影响塑料的性能和使用寿命;而平面度是评定产品成形表面质量的关键指标之一,对于安装表面而言,平面度直接影响零部件的贴合效果和紧固性能。
塑料件平面度、表面缺陷检测
需求分析
材质:塑料件。尺寸:边长2cm正方形。颜色:透明。
相机选型
针对上述检测需求,翌视科技的LVM2520线激光3D相机能够胜任此项任务。LVM2520主要适用于微小零件的高速3D检测;能提供2500Hz全画幅采集速率,物理轮廓点数1920点,深度图均匀间距采样最高4096点;采集速率最高可达56KHz,以精确至0.4μm的Z方向重复精度,近端视野
......长按二维码访问原文
大族视觉医疗试管表面缺陷检测--机器视觉网 2024-01-16 13:25:06
2024-01-16 13:25:06 来源: 中国机器视觉网
行业背景
试管是医学/化学实验室中最常见的仪器之一,可以用来盛取少量液体或固体试剂、加热少量固体或液体、收集少量气体、作少量试剂的反应容器等。玻璃试管是最常见的一种试管。
玻璃试管表面缺陷会导致试管的强度、透光率、美观等性能下降,甚至引发试管的开裂和爆炸,给实验及实验员带来安全隐患和经济损失。通过对试管表面缺陷进行检测,可以及时发现并剔除不合格品,提高产品质量和信誉。
方案解析
● 检测项目
黑点、划痕、批锋等瑕疵,会影响试管的强度、透光率、美观等性能;进胶口高度、位置、形状,会影响试管的品质;管身及杯口形变,会引发试管的开裂和爆炸。
● 解决方案
大族视觉HV5.0智能软件系统,拥有成熟的视觉算法、丰富的业务工具和强大的逻辑处理能
......长按二维码访问原文
标识包装视觉检测——二维码读取--机器视觉网 2024-01-17 13:24:47
2024-01-17 13:24:47 来源: 中国机器视觉网
随着人们生活质量的提高,科技的发展,食品包装上采用了二维码防伪、食品溯源、食品加工视频等等功能。
防伪溯源二维码出现在食品包装上的已经越来越多了,能在最大程度上保护消费者的权益,避免买到假冒伪劣的商品。通过包装上的防伪溯源二维码,以及配合一些其他的代码,消费者可以了解到食物的真实生产加工信息、原产信息等。获知进口食物的来源、经过地、以及最终到达消费者端的详细过程。
食用油作为日常饮食的必需品,人们对它的健康安全系数也大大提高了,同样的产品,包装上提供的信息越详细,可追溯的信息越全面,人们对它的信任度相应也会越高。因此时下越来越多的品牌,在包装上会采用印刷二维码给客户提供更详细的可追溯信息。
食用油包装上二维码检测系统是泰视特视觉自主
......长按二维码访问原文
机器视觉表面缺陷检测技术的主要问题与发展趋势--机器视觉网 2024-01-17 13:35:50
2024-01-17 13:35:50 来源: 中国机器视觉网
很多工业生产的产品,为了追求更高的品质,其检测技术上的要求也越来越高。机器视觉检测相对于人工检测的优点有:在线高速检测,可以保证产品检测的一致性、高效性、稳定性,对于数据的抓取和分析更加方便,可在危险、恶劣的环境下工作等。检测技术由效率和精度较低的人工检测逐步转变为利用机械仪器或者更高级别的机器视觉进行检测,这是未来检测技术的发展趋势。
机器视觉系统中的缺陷检测技术
如划痕检测是工业产品的外观检测的一部分,是产品表面的缺陷检测。与划痕检测类似的是裂纹检测,多为已使用的零部件的品质检测,在外表上看,两者差不多。
利用机器视觉进行划痕检测的基本过程分为两个步骤:1、检测产品表面是否存在划痕。2、对产品表面划痕进行提取。 工业产品的图像大多表面光
......长按二维码访问原文
锂电密封钉漏焊、爆点和凹坑3D检测应用--机器视觉网 2024-01-17 13:43:46
2024-01-17 13:43:46 来源: 中国机器视觉网
行业应用
锂电池组装中的锂电密封钉是关键组件,负责确保电池内的电解质不泄漏至外部环境,同时有效阻止外部杂质进入电池内部。其质量和密封性能至关重要,对于维护电池的安全性和性能起着至关重要的作用。
密封钉的缺陷形态相当复杂,形状边缘难以界定,生产制造过程中容易出现偏移、翘钉和装反等问题。此外,在焊接过程中,还可能出现漏焊、爆点和凹坑等困扰,这显著降低了工作效率和密封钉的功能性,进而导致电池寿命减短以及潜在的安全问题。
解决方案
为解决上述问题,可选用镰刀龙TZS系列线扫激光3D 相机,这款相机具备出色的性能,可以全方位检测出密封钉的各种缺陷,也针对性克服了其表面高反光的难题。它通过扫描产品表面轮廓,生成高密度且均匀的3D点云图像及高清的2D灰
......长按二维码访问原文
LINX-AI 虚拟数据生成器用起来,AIGC赋能工业--机器视觉网 2024-01-17 13:52:22
2024-01-17 13:52:22 来源: 中国机器视觉网
在工业视觉领域,带有标注的训练数据是构建深度学习模型的关键。但实际场景中,企业往往难以提供足够数量的样本数据,训练样本不足一直制约人工智能算法的应用。
相信很多人已经领会过AIGC (Artificial Intelligence Generated Content人工智能内容生成) 的魅力。工业领域,AIGC的兴起,打破了深度学习任务中遇到的数据样本少、难收集,人工标注效率低、标注质量参差不齐等难题,可大幅减少企业数据收集和标注成本,提高标注效率。这意味着AIGC技术赋能工业数据生成与模型训练取得全新进展。
扩散模型是AIGC领域关键技术之一。基于扩散模型,灵西深度学习平台(LINX-AI)上线新功能——LINX-AI 虚拟数据生成器,能够
......长按二维码访问原文
机器视觉中如何解决工业相机丢帧问题-电子发烧友网 2024-01-16 15:39
工业 相机常见的丢帧现象一般有几种情况:如果工业相机在预览模式时,无法以满帧的速度传输图像;在触发拍照模式下,相机传输图像数量少于触发次数(触发频率应小于帧率);图像处理软件处理的图像小于预期。
dalsa工业相机
丢帧的原因与相机的传输 接口 没有太大关系,主要在于工业相机硬件和设计不良的驱动程序有关,这种情况对于 机器视觉 检测 来说,具有很不确定性的效果影响。
那么如何解决丢帧问题呢?需要从3个地方着手:
1. 工业相机的一部分
图像传感器 将图像传输到相机上的 USB芯片 ,将 USB 传输到PC,如果PC系统忙于处理接收到的图像,并且图像传感器继续传输新的图像数据,则工业相机必须有足够的存储器缓冲区,反之亦然。
2. 可视化软件程序部分
该可视化软件具有用于等待所计算的图像空间的缓冲机制
......长按二维码访问原文
光学系统的 MTF 与分辨率之间有什么关系?-电子发烧友网 2024-01-16 10:11
M TF 是在分辨率和对比度方面量化系统整体成像性能的最佳工具之一。MTF值越高,说明系统的分辨率越高,能够传递更小的细节。MTF是一种将分辨率和对比度合并到单个规范或规则中的方法。而分辨率描述了成像系统恢复场景细节的能力,通常用每毫米有多少线对(line pair)表示。MTF曲线同时显示了分辨率和对比度 信息 ,这使得它能够根据特定应用的需求评估镜头,并且可以用于比较多个镜头的性能。
MTF的全称是Modula ti on Transfer Function,俗称“调制传递函数”。MTF综合反映了镜头的反差和分辨率特性,它是用仪器测量的,可以完全排除胶片等客观因素的影响和人工判读的主观因素影响,是很客观很准确的一种镜头评价方法。
MTF曲线图
看懂MTF曲线可以分为三步:
1. X、Y坐标的含义:横
......长按二维码访问原文
机器视觉基础知识点总结 2023-10-07 16:39:43
一、 机器视觉 的定义
机器视觉是一种通过光学设备和非接触式 传感器 自动接收并处理真实物体的图像的设备,以获得所需 信息 或控制 机器人 的运动。
机器视觉就是用机器代替人眼进行测量和判断。本质上,机器视觉是图像分析技术在工厂自动化中的应用,通过使用 光学 系统, 工业 数码 相机和图像处理工具,以 模拟 人类的视觉功能并做出相应的决策,通过指挥特定的装置来实现这些决策。
在现代的自动化生产过程中,机器视觉已开始逐渐取代人工视觉,特别是在工况 检测 ,成品检验,质量控制等领域。随着工业4.0时代的到来,这种趋势已不可逆转。
二、为什么要使用机器视觉代替人工视觉?
原因有很多,主要有以下几点:
1、从生产效率的角度来看,由于长时间工作后操作者容易感到疲劳,因此人工视觉的质量低下,准确性不高,机器视觉
......长按二维码访问原文
人机界面-电子发烧友网 2024-01-16
人机界面技术
机器视觉基础知识点总结 照明是影响机器视觉系统输入的重要因素。光源系统的设计非常重要,它与输入数据直接相关,即图像的质量和应用效果。 2024-01-16 标签:ledCMOS人机界面 28 0
人机界面黑屏和PLC电源灯不亮的原因 此时自然把问题点放在开关电源上了!当开关电源正常工作时最左上角的那个工作指示灯会亮起!这代表开关电源处于正常工作状态!我找到此台设备的开关电源发现它的工... 2023-12-26 标签:开关电源plc显示屏 66 0
西门子840D数控系统故障诊断及维修 西门子 840D 数控系统在制造企业中的应用较为广泛,该系统主要分为数控与驱动系统及人机界面两部分,系统的正常运行需要这两部分的协调配合。在实际生产过程... 2023-12-07 标签:西门子人机界面数控系
......长按二维码访问原文
瑞萨RZ/V系列产品介绍-电子发烧友网 2024-01-16 12:15
背景
目前, AI 应用已渗透在 工业 及消费类 产品 的各个领域,提供客户更好的功能及帮助降低成本。在 瑞萨 RZ MPU产品整容中,RZ/V系列是专门提供面向视觉AI应用的产品。
RZ/V系列内置瑞萨 电子 独家AI加速器“DRP(Dynamically Reconfigurable Process or )-AI”的 微处理器 (MPU),兼具高AI推理性能和低功耗特性。
同时瑞萨电子提供相应的开发板、软件及工具供用户用于AI开发。在这里我们通过介绍RZ/V2L产品及一个非常实用的RZ/V系列AI一站式网站,帮助用户快速了解RZ/V产品,轻松掌握AI开发工具及提供超过100个以上的各类AI应用,提高用户提升开发能力、缩短开发时间。
RZ/V2L介绍
RZ/V2L配备Cortex-A55(1.2
......长按二维码访问原文
瑞萨公司产品和工程师社区-电子发烧友网 2024-01-17
提供瑞萨公司最新的产品和技术,工程师最喜爱的瑞萨技术社区 瑞萨电子(Renesas Electronics)是一家全球领先的半导体解决方案供应商,专注于提供微控制器(MCU)、模拟与功率半导体器件以及嵌入式软件等产品。
此次收购将为瑞萨电子提供自主的GaN技术,从而将其业务范围扩大到电动汽车、计算(数据中心、人工智能、基础设施)、可再生能
空气污染越来越被大家重视,人们80%的时间都是在室内度过的,室内的空气环境质量对人们的身体健康更是息息相关。本项目旨在开
目前,AI应用已渗透在工业及消费类产品的各个领域,提供客户更好的功能及帮助降低成本。在瑞萨RZ MPU产品整容中,RZ/
伟诠电在氮化镓(GaN)快充市场迎来了新的机遇,因为日本集成设备制造商(IDM)瑞萨公司近期宣布成功收购美国GaN厂商T
R
......长按二维码访问原文
新技术:使用超光学器件进行热成像 2023-12-15 13:58:19
研究人员开发出一种新技术,该技术使用超光学器件进行热成像。能够提供有关成像物体的更丰富 信息 ,可以拓宽热成像在自主导航、安全、热成像、 医学成像 和遥感等领域的应用。
普渡大学研究小组负责人Zubin Jacob表示:“我们的方法克服了传统光谱热成像仪的挑战,传统光谱热成像仪通常体积庞大,且由于依赖大型滤光轮或干涉仪而十分精密。我们将超光学器件和尖端计算成像 算法 相结合,创建了一个既紧凑又坚固的系统,同时还具有大视场。”
在Op ti ca中,作者描述了他们的新型光谱偏振分解系统,该系统使用一堆旋转的超表面将热光分解为光谱和偏振分量。这使得成像系统除了捕获传统热成像获得的强度信息外,还可以捕获热辐射的光谱和偏振细节。
研究人员表明,新系统可以与商用热像仪一起使用,成功地对各种材料进行分类,这对传统热像
......长按二维码访问原文
光学器件-电子发烧友网 2024-01-04
文章:117个 浏览:11584次 帖子:1个
光学器件技术
常用于激光切割机上的配件有哪些 激光切割机在长期运行过程中很多配件会发生损耗,特别是一些常用配件。若无法做到及时更换,不仅会影响设备的正常运行,延误工作周期,甚至还会在一定程度上损坏激... 2024-01-04 标签:激光系统光学器件激光切割机 235 0
未来十年的传感器发展路线图 微机电系统与专用集成电路的结合也在同时走向成熟,这将带来前所未有的产品。传感器的微型化推动了远程医疗、智能家居、智能城市、先进制造设施、手持可穿戴设备等... 2024-01-03 标签:mems晶体管微机电系统 168 0
陀螺仪感应器常见的应用领域 陀螺仪感应器是一种用于测量物体自转角速度的传感器。它通过检测物体的旋转和方向变化来确定其相对角速度。陀螺仪感
......长按二维码访问原文
光鉴科技完成2亿元B轮融资,推进3D视觉技术多领域落地应用―新闻频道- 视觉系统设计 2024/1/15 23:43:53
3D传感公司光鉴科技近日完成2亿元人民币B轮融资。本轮投资方为中金资本、一村淞灵、重庆科兴等,融资资金将用于业务拓展。
光鉴科技成立5年完成总计5亿元人民币融资。融资历程上,光鉴科技于2018年连获天使轮及Pre-A轮融资,均为数百万美元;2019年,完成由双湖资本及软银中国共同领投的1500万美元A轮融资;2020年,完成2000万美元A+轮融资;2021年,完成数千万人民币A++轮融资。
光鉴科技提出“光学+感知+计算”模式,为各行业提供软硬一体的视觉交互及感知方案,此前已实现首款消费级纳米光子芯片量产发布、合作推出首款屏下3D手机等。
光鉴科技产品
根据现有的生物识别、人机交互、机器视觉等多个业务方向,光鉴科技在移动支付、消费电子、智能座舱、移动机器人等多个领域取得进展,过去两年间营收持续实现数倍
......长按二维码访问原文
梅卡曼德入选2023福布斯中国・出海全球化品牌TOP 30―新闻频道- 视觉系统设计 2024/1/15 23:14:10
福布斯中国秉承“立足中国,连接世界”的愿景,长期保持对中国商业社会发展的关注,并在2023年和福科无限携手推出“2023福布斯中国·出海全球化30 & 30评选”。梅卡曼德成功入选2023福布斯中国·出海全球化品牌TOP 30,该榜单主要关注在2023年度中国品牌全球化领域中积极创新、且具有明显行业影响力的企业,设“领军品牌”和“赛道先锋”两个类别。此次共同入选此榜单的还有比亚迪、长城、一汽红旗、青岛啤酒等头部企业。
“领军品牌”入选品牌所在企业都是独角兽级别及以上企业,估值或市值均在100亿人民币以上,部分企业的市值超过1,500亿;“赛道先锋”入选品牌所在企业的总估值则超过1,000亿人民币。具体来看,所有30家全球化企业都已经在海外设立公司主体以及拥有海外雇员,其中有60%的企业,其出海业务占比已经超过
......长按二维码访问原文
Teledyne 发布最新版本的 Sapera Vision 软件―新闻频道- 视觉系统设计 2024/1/16 22:22:55
Teledyne DALSA 很高兴地宣布推出最新的 Sapera™ Vision 软件版本。该版本包括 AI 训练图形工具 Astrocyte™ 1.50 的增强版本,以及图像处理和 AI 库 Sapera Processing 9.50。
Teledyne DALSA 的 Sapera Vision 软件提供实时图像采集、控制、图像处理和人工智能功能,用于设计、开发和部署高性能机器视觉应用,例如金属板表面检测、硬件零件定位和识别、塑料分类,和PCB检查。
Teledyne DALSA 软件总监 Bruno Menard 表示:“Sapera Vision 软件的新版本提供了一系列丰富的新功能和改进功能,允许灵活设计并加速执行人工智能应用程序。” “该版本的主要功能之一是使用旋转对象检测算法在推理时输出位
......长按二维码访问原文
凌华科技SuperCAT运动控制器在LED芯片分选机上的应用―技术与应用频道- 视觉系统设计 2024/1/16 22:32:30
应用背景:
Mini/Micro LED 被看作未来 LED 显示技术的主流和发展趋势,是继 LED 户内外显示屏、LED小间距之后LED显示技术升级的新产品,具有“薄膜化,微小化,阵列化”的优势,目前已经逐步导入产业应用。同时,由于芯片的尺寸变得越来越小(<200um),对测试和分选设备的速度与精度的要求也越来越高。 在芯片测试端,由于MiniLED生产工艺尚不成熟且良率不足,行业普遍采用全测全分模式,芯片出厂前需进行至少一次光电测试,以剔除不良芯片,满足下游对良率的要求。LED芯片分选机的主要作用有两个:一是接收探针台测试的报告数据,对芯片进行区分拣选;另一个是芯片与标准样品核对进行表面问题检测,淘汰掉不好的产品。设备一般由芯片上料台、机械手、芯片分BIN台、图形采集CCD系统等部分组成。 ......长按二维码访问原文
深视智能高速相机在激光3D打印领域的应用―技术与应用频道- 视觉系统设计 2024/1/16 22:50:12
3D打印
3D 打印(3D Printing)技术又名增材制造(Additive Manufacturing, AM),区别于传统针对坯料进行切削成型的“减材制造”以及铸、锻类的“等材制造”等方法,3D 打印技术具有产品“从无到有”体积逐渐增长、形状设计自由度高、无需成型模具等显著特点。
凭借快速成型、无需模具、产品形状几乎没有几何限制等巨大优势,3D 打印技术在生物医疗、模具制造、航空航天等需要定制化、不规则零件的产业领域中展现出良好的应用前景,是近年来兴起并蓬勃发展的代表性先进制造技术之一。
技术优化
随着3D打印技术的蓬勃发展,对复杂合金的激光熔融沉积和表面重熔机理研究与应用可显著优化3D打印零件的机械性能。借助高速摄影技术,科研人员在此过程中可实现打印过程可视化,实时捕捉液态金属熔池形貌及激光调
......长按二维码访问原文
ResNet论文解读 2024-01-16 18:09
论文地址:
一、标题
Deep Residual Learning for Image Recognition
从标题可以看出,deep表示使用的是深度的神经网络,层数比较多,residual learning表示模型学习的是残差,主要用在图像识别领域。
二、摘要
更深的神经网络更难训练。我们提出了一种残差学习框架来减轻网络训练,这些网络比以前使用的网络更深。我们明确地将这些层重新规划为通过参考输入层x,学习残差函数,而不是学习没有参考的函数。我们提供的证据表明这些残差网络更容易优化,并可以显著增加深度来提高准确性。在ImageNet数据集上,我们对深度为152层的残差网络进行评估(比VGG nets 深8倍但仍具有较低的复杂度)。这些残差网络在ImageNet测试集上取得了3.57%错误率。这一结果
......长按二维码访问原文
NeRF-VO:实时稀疏视觉里程计与基于NeRF的稠密重建 2024-01-16 10:37
论文标题:
NeRF-VO: Real-Time Sparse Visual Odometry with Neural Radiance Fields
论文作者:
Jens Naumann,Binbin Xu,Stefan Leutenegger,Xingxing Zuo,∗Technical University of Munich,University of Toronto
导读:本文提出一种新型神经视觉里程计系统,结合了基于学习的稀疏视觉里程计、单目深度预测网络,进行基于神经辐射场优化,同时调整位姿和稠密地图。本系统展现优越的位姿估计精度,并提供高质量的稠密建图,同时保持较低的位姿跟踪延迟和 GPU 内存消耗。
本文引入一个新颖的单目视觉里程计系统,集成了基于学习的稀疏视觉里程计,该视觉里程计主
......长按二维码访问原文
ICRA 2024 | 首届RoboDrive自动驾驶挑战赛正式开始啦! 2024-01-16 07:42
首届 “RoboDrive” 自动驾驶挑战赛将于 The 41st IEEE Conference on Robotics and Automation :ICRA 2024期间举办,网址:https://2024.ieee-icra.org/,欢迎大家了解及参与!
网址和时间安排
比赛介绍
在快速发展的自动驾驶领域,感知系统的准确性和可靠性至关重要。 近期,自动驾驶场景感知及其相关领域的研究取得了突破性进展,尤其是在鸟瞰图 (BEV) 表征和 LiDAR 传感技术等方面取得了显著进步,进一步提升了 3D 场景感知模型在大型自动驾驶数据集上的准确率。
然而,现有的 3D 场景感知模型在各类具有挑战性的条件下的稳健性尚未得到充分评估,而此类情形往往与自动驾驶感知的安全性息息相关。 为了填补这一空缺,我们推
......长按二维码访问原文
涨点!改进航空图像中旋转小目标检测 2024-01-15 22:47
涨点!本文提出一种通过增强旋转目标检测模型的分类和回归任务来准确检测航拍图像中的旋转小目标的方法,其中引入注意力点网络,由引导注意力损失(GALoss)和框点损失(BPLoss)组成,对小目标检测性能提升显著!代码已开源!
点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、目标检测工作~
Improving the Detection of Small Oriented Objects in Aerial Images
代码:https://github.com/chandlerbing65nm/APDetection
论文:https://arxiv.org/abs/2401.06503
在大规模航空图像中代表微小像素区域的小方向物体由于其尺寸和方向而难以检测。 现有的旋
......长按二维码访问原文
慕尼黑工业大学最新提出!单目实时密集建图的混合隐式场方法 2024-01-15 18:45
我们提出了一种新颖的方法,它将基于深度学习的密集SLAM与神经隐式场相结合,实时生成密集地图,而无需像以前的方法那样依赖RGB-D或姿势输入。我们的方法充分利用了深度学习的表征能力和神经隐式场的适应性,为实时单目密集SLAM提供了鲁棒、高效和准确的解决方案。
推荐阅读
......长按二维码访问原文
基于反卷积方法的重大突破:结构光系统中的测量误差降低3倍 2024-01-15 18:40
结构光三维测量技术在工业自动化、逆向工程和图形学领域越来越受欢迎。然而,现有的测量系统在成像过程中存在不完美,会导致在不连续边缘周围出现测量误差。这种误差被称为“不连续引起的测量伪影”(DMA)。现有的DMA减小方法需要准确检测所有边缘,但在边缘模糊的情况下很难实现。同时,误差区域中的校正数据严重依赖于其最近的未受影响区域的数据,这在某些情况下使得校正数据不可靠。因此,本文提出了一种基于反卷积方法的灵活方法来解决上述两个问题。
推荐阅读
......长按二维码访问原文
AAAI 2024 | 首篇!FRED:航空图像目标检测中实现完全旋转等变性 2024-01-16 19:01
FRED:一种完全旋转等变性的旋转目标检测器,其从图像到边界框预测的整个过程是严格等变的,性能表现SOTA!同时模型参数显著减少!
点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、目标检测工作~
FRED
FRED: Towards a Full Rotation-Equivariance in Aerial Image Object Detection
单位:KAIST, 国立韩巴大学
论文:https://arxiv.org/abs/2401.06159
旋转等变性是旋转目标检测中一个重要但具有挑战性的属性。 虽然由于传统 CNN 的平移等变性,一般目标检测器自然地利用了对空间移动的鲁棒性,但实现旋转等变性仍然是一个难以实现的目标。 当前的检测器部署各种对齐技术来导
......长按二维码访问原文
3D视觉生成LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching港科广陈颖聪团队 2024-01-16 19:24
作者及机构
摘要
文本到 3D(Text-to-3D) 生成技术是生成模型的一个重要里程碑,为在现实世界的各种场景中创建富有想象力的三维资产提供了新的可能性。文本到 3D 生成技术的最新进展已显示出前景,但它们往往无法渲染详细和高质量的三维模型。由于许多方法都基于分数蒸馏采样Score Distillation Sampling (SDS),这一问题尤为突出。
本文指出了 SDS 的一个显著缺陷,即它为三维模型带来了不一致且低质量的更新方向、导致过度平滑效应。为解决这一问题,我们提出了一种名为区间分数匹配Interval Score Matching(ISM)的新方法。ISM 采用确定性扩散轨迹,并利用基于区间的分数匹配来消除过度平滑。此外,我们还将三维高斯拼接技术纳入我们的文本到 3D 的生成流程。
......长按二维码访问原文
论文解读:Multiclass Confidence and Localization Calibration for Object Detection (CVPR 2023) 2024-01-16 19:37
贴一下原论文地址:
一、主要贡献
1.研究了校准物体探测器的相对未探索的方向并观察到它们在域内和域外预测中本质上都是错误校准的。此外,现有的分类校准技术对于校准目标检测器来说并不是最佳的。
2.提出了一种新的训练时校准检测的方法,其核心是辅助损失项,试图联合校准多类置信度和边界框定位。我们利用多类置信度和边界框定位中的预测不确定性。
3.对具有挑战性的数据集进行了广泛的实验,其中包括几种域内和域外场景。我们的训练时校准方法始终减少基于 DNN 的目标检测范例的校准误差,包括 FCOS 和 Deformable DETR,无论是在域内还是域外预测中:
二、方法
方法核心是一个辅助损失函数。该辅助损失公式旨在联合校准多类别的置信度和边界框定位。
损失函数的两个关键量是:
(1)各类别和边界框定位的预
......长按二维码访问原文
DCNv4来袭,更快收敛、更高速度、更高性能! 2024-01-16 20:44
本文首发于AIWalker,谢谢关注~
https://arxiv.org/pdf/2401.06197.pdf
https://github.com/OpenGVLab/DCNv4
本文介绍了一种高效和有效的算子DCNv 4,它是专为广泛的视觉应用而设计的。与其前身DCNv 3相比,DCNv 4有两个关键增强功能:(1) 去除空间聚合中的softmax归一化,以增强其动态性和表达能力;(2) 优化存储器访问以最小化冗余操作以加速。这些改进显著加快了收敛速度,并大幅提高了处理速度,DCNv 4实现了三倍以上的前向速度。
在各种任务中,包括图像分类、实例和语义分割,特别是图像生成中,DCNv 4表现出卓越的性能。当集成到潜在扩散模型中的U-Net等生成模型中时,DCNv 4的性能优于其基线,强调了其增强生
......长按二维码访问原文
DreamGaussian:高效3D生成的生成式Gaussian Splatting - 知乎 2024-01-16 23:24
侃侃:3DGS真火啊!DreamGaussian刚被ICLR 2024(Oral)收录,引用量都快50了!项目star更是破3k!现在"手速快、做work了"就是王道!
【总结】DreamGaussian,一种3D 内容生成新框架,可以同时实现效率和质量,核心是设计一个生成 3D Gaussian Splatting模型,仅需 2 分钟即可从单视图图像生成高质量的纹理网格,与现有方法相比,实现了约 10 倍的加速!代码已开源!
点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、目标检测工作~
DreamGaussian
DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation
......长按二维码访问原文
大模型背景下计算机视觉年终思考小结(下) 2024-01-16 20:25
1. 引言
尽管在过去的一年里大模型在计算机视觉领域取得了令人瞩目的快速发展,但是考虑到大模型的训练成本和对算力的依赖,更多切实的思考是如果在我们特定的小规模落地场景下的来辅助我们提升开发和落地效率。本文从相关数据集构造,预刷和生成方向进行相关大模型落地的切入和思考。
闲话少说,我们直接开始吧!
2. 构造数据集
使用这些新的大模型的一个切实想法是保留我们的之前标准训练流程框架,举个栗子,通常在检测领域我们使用的 Yolo 检测器中,我们可以通过生成新的训练图像或生成新的标注来改进我们的训练数据集。具体流程如下:
如上图所示:
标准数据集由一组人工标注好的训练集和验证集组成
数据集扩充将使用强大的通用大模型来添加自动化标注:
对未标记图像进行新的标注 ⇒ 这需要一个已经适合该任务的模型。一般来说
......长按二维码访问原文
CV计算机视觉每日开源代码Paper with code速览-2024.1.16 2024-01-17 00:00
精华置顶
墙裂推荐!小白如何1个月系统学习CV核心知识:链接
点击@CV计算机视觉,关注更多CV干货
论文已打包,点击进入—>下载界面
点击加入—>CV计算机视觉交流群
1.【多模态】PIXART-δ: Fast and Controllable Image Generation with Latent Consistency Models
2.【人体姿态估计】Diffusion-based Pose Refinement and Muti-hypothesis Generation for 3D Human Pose Estimaiton
论文已打包,点击进入—>下载界面
群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关
......长按二维码访问原文
ICLR 2024 Oral | Adobe提出LRM:单个图像到3D的大型重建模型 2024-01-17 10:04
LRM:第一个大规模的三维重建模型,具有5亿个可学习参数,它可以在5秒内从单个输入图像中预测对象的3D模型,并在约100万个对象的海量多视图数据上以端到端的方式训练,以产生高质量的3D重建!
点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、目标检测工作~
LRM
LRM: Large Reconstruction Model for Single Image to 3D
单位:Adobe, ANU
主页:https://yiconghong.me/LRM/
论文:https://arxiv.org/abs/2311.04400
CVPR 2023 论文和开源项目合集—> https://github.com/amusi/CVPR2023-Papers-with-Cod
......长按二维码访问原文
通过量子启发方法揭示隐藏在噪声中的图像 2024-01-17 08:41
华沙大学物理学院与斯坦福大学和俄克拉荷马州立大学的研究团队推出了一种基于光强度相关测量的量子相成像方法,该方法对相位噪声具有鲁棒性。新的成像方法甚至可以在极其昏暗的照明下运行,并且在红外和X射线干涉成像以及量子和物质波干涉测量等新兴应用中证明是有用的。
无论您是用智能手机拍摄猫的照片还是用先进的显微镜对细胞培养物进行成像,您都是通过逐像素测量光的强度(亮度)来实现的。光的特征不仅在于其强度,还在于其相位。有趣的是,如果您能够测量透明物体引入的光的相位延迟,透明物体就可以变得可见。Frits Zernike凭借相差显微镜获得了1953年诺贝尔奖,它带来了生物医学成像领域的一场革命,因为它能够获得各种透明和光学薄样品的高分辨率图像。Zernike的发现催生的研究领域包括数字全息术和定量相位成像等现代成像技术。华沙
......长按二维码访问原文
AAAI 2024 | TEx-Face,5秒内按需生成照片级3D人脸 2024-01-17 14:42
公众号:将门创投(thejiangmen)
作者:Xiaolong Shen
本文介绍一篇来自浙江大学ReLER实验室的工作,"Controllable 3D Face Generation with Conditional Style Code Diffusion",目前该文已被AAAI 2024录用。
01. 研究动机
本文的核心出发点是,探索一种只需要单次优化的多条件控制的3D人脸生成模型。
目前的一些经典的Text-to-3D的工作,他们往往针对一个特定的物体(由文本描述的)优化一个随机初始化的3D表征,例如Nerf,从而导致耗费较长的优化时间以及只限于单个物体,无法泛化。此外,目前的这类方法还是没有办法做到真实照片级的效果。对于人脸领域,由于处于一个相似的分布,所以完全可以使用一种只需要训练
......长按二维码访问原文
如何看待meta最新的工作:将MAE扩展到billion级别(模型和数据)? 2023-03-25 13:43
Kaiming不在作者之列,确实值得8挂哈哈哈哈,有Ross Girshick和Piotr Dollár这些老朋友,做的又是MAE,却没有Kaiming。那么Kaiming去哪了呢,真是让人百思不得其姐了呢。
实验论文,主要看实验方法和实验结论
实验方法
核心贡献:
先自监督(MAE),再弱监督(WSP),最后再在下游任务训练,这里自监督被称作pre-pretraining:
弱监督,用弱的、有噪声的信息训练,如文本或者hashtags作为监督。本文是用互联网的图像和文本对训练,把文本转成标签,用多标签分类目标函数训练 自监督,本文直接用Masked Autoencoder(MAE)
训练数据(3B)和模型规模变大:ViT-B (86M) -> ViT-2B 、 ViT-6.5B
实验数据
预训
......长按二维码访问原文
大规模视觉模型新突破!70亿参数!Apple新作AIM:大型自回归图像模型的可扩展预训练 2024-01-17 17:36
70亿参数视觉模型!AIM:一种简单且可扩展的自回归方法,用于在没有监督的情况下大规模预训练视觉模型,轻松扩展至70亿个参数!在预训练过程中使用一个生成式自回归目标,并提出一些技术贡献,以更好地适应下游迁移,代码于17小时前开源!
点击关注 @CVer官方知乎账号,可以第一时间看到最优质、最前沿的CV、AI、目标检测工作~
AIM
Scalable Pre-training of Large Autoregressive Image Models
单位:Apple
代码:https://github.com/apple/ml-aim
论文:https://arxiv.org/abs/2401.08541
CVPR 2023 论文和开源项目合集请戳—> https://github.com/amus
......长按二维码访问原文
How to Build a Parking Lot Monitoring System with Computer Vision: 2024-01-17T10:15:25.000Z
This article was contributed to the Roboflow blog by Abirami Vina .
We spend a lot of our time commuting from place to place, and parking is always a hassle. For example, finding a parking spot at the mall when you go shopping can be a frustrating task. With that said, cameras and computer vision algorithms can work together in parking lots to know if a veh
......长按二维码访问原文
YOLO Loss Function Part 1: SIoU and Focal Loss: 2024-01-16T14:00:00+00:00
The YOLO (You Only Look Once) series of models, renowned for its real-time object detection capabilities, owes much of its effectiveness to its specialized loss functions. In this article, we delve into the various YOLO loss function integral to YOLO’s evolution, focusing on their implementation in PyTorch. Our aim is to provide a clear, technical understand
......长按二维码访问原文