机器视觉资讯20231107

文章目录[隐藏]


视觉招聘小黑板

机器视觉算法工程师 ,1.5-2万·14薪武汉·洪山区3-4年本科,医疗设备/器械民营
销售工程师(机器视觉) ,1-2万东莞·南城区3-4年大专,仪器仪表/工业自动化民营
算法工程师(图像/AI/机器视觉/深度学习) ,1.5-2万广州·南沙区3-4年本科,计算机软件创业公司
机器视觉应用工程师 ,8千-1.2万惠州·大亚湾区1年大专,电子技术/半导体/集成电路民营
机器视觉工程师 ,1-1.8万苏州2年本科,电子技术/半导体/集成电路民营
机器视觉销售工程师 ,1.6-2.1万苏州·吴中区1年大专,仪器仪表/工业自动化已上市
机器视觉硬件测试工程师 ,7千-1.2万·13薪深圳·南山区1年本科,计算机硬件民营
机器视觉应用工程师 ,9千-1.5万惠州·大亚湾区1年本科,电子技术/半导体/集成电路民营
机器视觉图像算法高级经理 ,3.5-5万上海·浦东新区5-7年本科,仪器仪表/工业自动化民营
机器视觉工程师 ,1.5-3万无锡·锡山区3-4年本科,汽车零配件民营
机器视觉软件工程师 ,1-2万深圳·龙华区2年本科,仪器仪表/工业自动化民营
机器视觉应用工程师/打光工程师 ,8千-1.5万惠州·大亚湾区3-4年大专,电子技术/半导体/集成电路民营
机器视觉/Halcon/VisionPro(挑战30万年薪) ,1.5-2.5万广州·黄埔区3-4年本科,机械/设备/重工民营
机器视觉调试工程师 ,1.2-1.8万北京·通州区3-4年大专,仪器仪表/工业自动化民营
机器视觉工程师(Halcon+C#) ,1.2-2万杭州·拱墅区2年本科,电子技术/半导体/集成电路民营
机器视觉调试工程师 ,8千-1.2万惠州·大亚湾区2年大专,电子技术/半导体/集成电路民营
机器视觉工程师 ,1.8-3.2万东莞·南城区5-7年本科,电子技术/半导体/集成电路民营
机器视觉调试工程师 ,8千-1.5万成都·龙泉驿区3-4年大专,仪器仪表/工业自动化民营
机器视觉主任工程师 ,1.8-2.5万江门5-7年本科,机械/设备/重工外资(非欧美)
机器视觉调试工程师 ,8千-1.2万昆山1年大专,电子技术/半导体/集成电路民营

欲了解详情,请在公众号后台回复:231107



行业资讯

修改了人工神经元后, 大量神经网络等着大家一起探索>✔ 2020-07-16 13:01

修改了人工神经元后, 大量神经网络等着大家一起探索>✔

此为个人主页,预印本方便宣传与占坑。不投期刊,保留版权,也好更新主页。 可以引用 构建学术影响力 https://doi.org/10.36227/techrxiv.12477266 70年前,人们通过模仿当时生物神经元的知识来设计人工神经元。今天,由于生物学的发展,我们对神经元,特别是树突的工作原理有了比较好的了解。我发现,在设计的时候,传统的人工神经元忽略了生物神经元或生物神经网络中树突参与预计算的事实。更具体地说,生物树突在大脑中对输入数据的交互信息进行预处理。为了理解图片任务,生物树突在提取输入图片各部分之间的关系方面发挥了作用。。。。。。 注:详细事项看本视频的评论

......长按二维码访问原文

Who Uses OpenCV? Part 1: Snap, Inc. (Meta): 2023-11-06T20:30:47+00:00

Hello OpenCV Community,

We hope this message finds you well. We’re back with another exciting update on our crowdfunding campaign‘s progress. Your individual support (all 200 of you so far!) has been a bright light in the campaign, and we’re making strides towards our goal. Today, we’d like to shine a spotlight on one of the biggest apps out there which use

......长按二维码访问原文

天准科技光伏全自动铜栅线图形化曝光设备正式交付客户--机器视觉网 2023-11-06 17:36:01

2023-11-06 17:36:01 来源: 中国机器视觉网

近日,天准科技股份有限公司(以下简称“天准科技”) 光伏全自动铜栅线图形化曝光设备正式交付光伏头部客户,助力客户更快实现GW级HJT电池铜栅线项目落地,标志着天准科技在助力光伏行业HJT铜栅线工艺实现0到1的发展阶段上取得突破性进展。

天准科技推出的光伏全自动铜栅线图形化曝光设备,依托天准科技在机器视觉测量检测领域多年行业深耕和技术积累,采用先进的精密光机电驱控技术,实现精确对位曝光和高速高精度控制,可确保曝光机的高效、稳定运行。单机产能达到8000pcs/h以上,线宽解析度可达10μm以内。

天准光伏全自动铜栅线图形化曝光设备

公司针对光伏行业持续多年投入高强度研发。2017年,天准科技以光伏硅片检测分选装备为深入布局新能源领域的第一款光

......长按二维码访问原文

“小巨人”数之联,携智能设备远赴墨西哥交付--机器视觉网 2023-11-07 15:49:09

2023-11-07 15:49:09 来源: 中国机器视觉网

近日,数之联机内检AOI(自动光学检测)设备首次整装出海交付。该产品是利用人工智能技术驱动的自动化检测设备,专为电视生产过程中的“一致性检验工艺段”而设计,能够有效提升产品检测的效率和精确度。

中国制造出海,专精特新“小巨人”崭露头角

1986年德国管理学家赫尔曼·西蒙提出“隐形冠军”概念,它指的是深耕在某一细分领域并在国际市场占据较高份额且具有独特优势的中小企业。这些中小企业支撑起德国制造业的基本盘,让德国成为当时全球第一大工业品出口国。德国的“隐形冠军”企业定位在产品出海抢占国际市场份额,那么中国的专精特新“小巨人”企业该如何定位呢?成为隐形冠军是目标,“专精特新”是路径,中国制造要走出去,势必需要一大批“专精特新”企业做支撑,并在强链、

......长按二维码访问原文

SICK更名公告:广东西克智能科技有限公司--机器视觉网 2023-11-07 15:41:29

2023-11-07 15:41:29 来源: 中国机器视觉网

为了更好地适应市场发展和业务拓展的需要,公司名称自2023年11月6日起将变更为“ 广东西克智能科技有限公司” 。

这是一个新的里程碑,也是发展的重要转折点。作为一家致力于提供全球化智能传感器解决方案的公司,SICK一直在不断创新和进步,以满足客户日益增长的需求。

......长按二维码访问原文

苏州城市学院与中科行智“实践教学基地”授牌仪式圆满落地--机器视觉网 2023-11-07 15:34:17

11月3日,苏州城市学院实践教学基地授牌仪式在中科苏州机器视觉技术研究院、苏州中科行智智能科技有限公司圆满举行。

中科苏州机器视觉技术研究院院长、苏州中科行智智能科技有限公司董事长彭思龙,销售总监唐建勇、产品部经理丁然及项目经理韩燕热情接待了苏州城市学院考察团一行。并交流研讨了产教融合、校企合作等相关事宜。

通过产品部经理丁然的细致讲解,逐渐知悉中科苏州机器视觉技术研究院、苏州中科行智智能科技有限公司自主研发的产品矩阵在工业视觉领域的特性优势,及相关科研成果的典型应用。

苏州城市学院考察团在销售总监唐建勇的带领下,参观了中科苏州机器视觉技术研究院展厅、光学实验室、工业机器视觉综合实验室等。

双方就产教融合、校企合作等话题,共同探讨应用型本科人才培养新模式,并一致认为培养可以了解掌握机器视觉领域基础技术操

......长按二维码访问原文

海康机器人MV-GE1004新功能,彻底解决丢包问题--机器视觉网 2023-11-07 15:11:01

2023-11-07 15:11:01 来源: 中国机器视觉网

网口相机在目前的工业自动化检测场景中使用广泛,而网口相机因为协议本身带来的丢包问题令使用者感到头疼。此前海康机器人发布的MV-GE1004针对这一痛点,在FPGA加持下,根源上解决了这一问题,深受客户青睐。

千兆网图像采集卡 稳定取流不丢包

......长按二维码访问原文

图漾科技3D视觉助力家电智造创新升级--机器视觉网 2023-11-07 16:03:11

2023-11-07 16:03:11 来源: 中国机器视觉网

传统劳动密集型生产已难以为家电行业带来竞争壁垒及持续的业绩增长点,自动化、智能化转型升级的发展压力也不断驱动着家电行业探索更高效的生产方式。

在产业转型背景下,智能制造既符合家电企业自身需求,又具备长远应用价值及业绩增长潜力,成为家电行业布局的首选方向。

图漾科技基于全球领先的3D机器视觉技术,与家电行业集成商客户伙伴紧密合作,将3D视觉与多类产线设备创新组合运用,推动改善传统生产结构,助力家电生产智能进阶及盈利水平提升。

3D视觉引导洗衣机内胆抓取

应用痛点 随着消费者对消费电子质量品质的要求提升,传统人工搬运方式受限于精力、体力、人眼视觉精度等生理因素,不能满足重复、繁重、精细的工厂作业;并且长时间体力消耗存在出错物损及人身安全风险,

......长按二维码访问原文

运动轨迹分析的新方法,堡盟VLXT相机--机器视觉网 2023-11-07 10:21:43

2023-11-07 10:21:43 来源: 中国机器视觉网

科研观察不仅费时费力,还容易因操作人员的疲劳而错过关键科学现象。那到底有没有一种自动化解决方案,能够彻底地给出智能化的解决方法,自动标出记录结果并给出图像分析,解放我们宝贵的科研人力呢?

显然是有的,堡盟VLXT相机就是这样一款用于科研运动轨迹观察与分析的相机,它能够出色地提高科研工作者的研发效率,为企业和科研机构节约宝贵的科研人力。

节约科研人力,提高研发效率,轨迹分析清晰可见

在科研与医学应用中有很多重要医学现象都是转瞬即逝,需要研究人员进行长时间的观察和记录,才有可能获得宝贵且短暂的有效信息,但是人力观察的效率极低,而错过关键科研信息却常有发生。

而目前自动化拍摄系统对运动物体记录的主要难点在于,拍摄的帧率不够容易引起被拍摄物体的模

......长按二维码访问原文

通过速度最快的相机和采集卡实现医学成像的实时全息渲染--机器视觉网 2023-11-07 10:11:53

2023-11-07 10:11:53 来源: 中国机器视觉网

在临床眼科中使用Coaxlink技术,可以克服全息激光多普勒成像装置实时观察眼底血管的局限性。血流检测在许多眼部疾病的诊断中起着核心作用。例如年龄相关性黄斑变性、青光眼、糖尿病性视网膜病变等可导致永久性视力丧失的眼部疾病。

测量眼部血流量的动机是研究血管化在疾病发展中的作用:及早发现疾病,在视力丧失之前阻止疾病进展;以及评估管理治疗的效率。采用CoaXPress图像传输标准的超高速数码相机问世后,实现了数字图像采集与高频激光多普勒测量的兼容。它为视网膜血管血流的无创成像提供了非凡的性能和图像质量。

眼部血流成像的目标是:以高空间分辨率显示血管;量化所有血管中的血流(cm/s 或 µl/min);以高时间分辨率测量变化。

在这个实施示例中,一

......长按二维码访问原文

以技术立身,做民族企业--专访--机器视觉网 2023-11-06 17:42:53

2023-11-06 17:42:53 来源: 中国机器视觉网 1069

“耿耿星河欲曙天,星星之火可燎原”星河泰视特是以技术立身,产业报国的民族企业,也是一家深耕于检测领域的企业。那么这样一家民族企业是如何一步步走出国门走向世界的呢?机器视觉技术又与检测领域碰撞出怎样的火花呢?近日,记者有幸邀请北京星河泰视特科技有限公司总经理江俭做客《机器视觉》杂志,让我们来听听江总关于企业的介绍吧。

M:MACHINE VISION

J:江俭

M:江总您好,可以聊聊星河泰视特的名字由来吗?

J:公司的名称来源于“耿耿星河欲曙天,星星之火可燎原”这句话,是江泽民同志任电子工业部部长时给佛山无线电八厂(星河品牌的原创企业)的提词,我司的初创团队就来自于佛山无线电八厂,我们一群人几十年来,一直坚守在自动化检测设备行业,

......长按二维码访问原文

http://china-vision.org/paper-detail/216102.html: 2023-11-07 09:58:13

......长按二维码访问原文

2024中国智能汽车技术展实力彰显―新闻频道- 视觉系统设计 2023/11/6 22:59:32

汽车产业是成渝地区双城经济圈的主导产业、核心产业、优势产业,成渝正合力打造万亿级汽车产业集群。两地通过开展新能源与智能网联汽车关键技术攻关,联手打造车联网和高速公路车路协同等应用场景,推进氢燃料应用示范,推动两地整车与零部件企业互配互供等举措,预计到2025年力争两地汽车产量突破300万辆、行业产值突破6000亿元,将成渝地区双城经济圈打造成为全球重要的汽车研发、制造、应用基地。

目前,川渝地区共有整车企业45家,各级配套商达到1600多家,年产值超7000亿元,汽车年产量近300万辆,占全国比重达到12%。汽车产业转型升级的强大带动力将重塑成渝地区产业格局。

为助力川渝乃至国内汽车行业转型升级,推进产业链各方合作优势互补,由中国汽车工业协会主办,重庆市福祥会展服务有限公司承办的“2024中国智能汽车技术展

......长按二维码访问原文

思特威车规级图像传感器产品SC533AT荣获“年度传感器产品奖”―新闻频道- 视觉系统设计 2023/11/6 22:14:43

2023全球电子成就奖之“年度传感器产品奖”

作为思特威Automotive Sensor (AT) Series系列最新力作,SC533AT搭载先进的SmartGS®-2 Plus技术和LightBox IR®技术,集5MP高分辨率、高快门效率、超低噪声、卓越的色彩表现、优异的近红外灵敏度五大性能优势于一身,为高端驾驶员监控系统(DMS)、乘客监控系统(OMS)带来了更精确、可靠的舱内视觉感知能力。

此外,在车规安全性方面,SC533AT符合AEC-Q100 Grade 2及ISO 26262 ASIL B功能安全等级要求,可用于DMS/OMS等智能座舱监测系统,以安全可靠的车规级品质保障行车安全性,为车辆智能化发展注入强大动力。

作为全球电子行业极具地位和影响力的评选活动,全球电子成就奖旨在评选并表彰

......长按二维码访问原文

光虎工业低畸变双远心镜头TTL18.5-60-160―产品聚焦频道- 视觉系统设计 2023/11/6 22:29:44

双远心镜头对精密尺寸测量有着非常重要的意义,随着机器视觉的不断发展,对双远心镜头的性能要求也越来越高。本公司致力于双远心镜头的研发,着重提高镜头的各项性能参数。

光虎双远心镜头系列拥有高远心度、低畸变率的性能特点,主要应用于精密测量领域及高精度视觉定位。

TTL18.5系列标准双远心镜头标准C接口,最大兼容1.1"(对角线18.5mm)靶面工业相机。

产品特点

>>光学倍率在1.609x-0.059x

>>视野范围在11.5mm-315mm之间,满足对不同视场的需求

>>工作距离在25mm-545mm之间,满足对不同工作距离的需求

>>低于0.05%的畸变,小于0.05°的远心度

>>双侧远心设计,超大景深,高分辨率

>>多层镀膜设计,光透过率高

>>工业级防水

>>高分辨或大景深两种选择

......长按二维码访问原文

得利捷Matrix系列固定式工业扫描器解决电子行业的可追溯性和DPM挑战―技术与应用频道- 视觉系统设计 2023/11/6 22:23:04

在电子行业,多功能性和速度非常重要。可追溯性解决方案能优化生产工具的可用性和使用效率,大限度地减少不合格品,从而加快生产速度,让产品更安全、更优质。

高要求行业的批量处理

可追溯性对于维护电子产品的安全和质量至关重要,因此必须严格控制环境参数,以避免生产并快速识别问题部件。为便于查看信息,制造商会在电子部件上附上印有直接零件标记(DPM)条码,其中记录了来源、批次等重要信息。制造商需要以合理的价格进行批量生产,以缓解成本上升和劳动力短缺问题,同时遵守严格的质量标准。

得利捷Matrix扫描器如何满足行业需求

自动通知意外方向变化

在产品或扫描器改变方向时自动发出通知,防止产品损坏并确保包装始终一致。

电子对焦调整

电子对焦调整可以让扫描更准确、更快速以每次都能获得精确的结果。

经济实惠

高产能

......长按二维码访问原文

VC MIPI 摄像模组应用于 arculus AMR 导航机器人的精确导航―技术与应用频道- 视觉系统设计 2023/11/7 21:29:28

挑战:导航机器人

来自永恒力旗下公司 arculus 的自主移动机器人 (AMR) 以其高度的灵活性和智能联网彻底改变了内部物流和制造流程。与其他机器人系统协作的先决条件是 AMR 在 +/- 5 毫米范围内的精确定位。

解决方案:摄像头读取地面上的标记

VC MIPI® 摄像模组读取地板上预先测量的标记,从而在狭窄的通道中实现高度精确的对齐,例如在行驶到运输架上或运输架下时。由于 MIPI CSI-2 标准,它们与机器人控制单元中使用的 NVIDIA 处理器平台会最佳兼容。

AMR arculee:自主移动机器人 arculus GmbH 永恒力旗下公司

Arculee 将自动驾驶汽车技术引入工厂车间,实现全新的生产流程。移动机器人有各种尺寸,运输能力可达一吨。

内部物流和制造流程的革命

很难想

......长按二维码访问原文

CoaXPress-12接口的优势与应用―技术与应用频道- 视觉系统设计 2023/11/7 21:25:10

CoaXPress-12接口是一种专为传输高速视频和数据而设计的通信标准。

这种接口使用标准同轴电缆进行传输,能够提供高达12.5 Gbps的数据传输速率,被越来越多的应用于需要高速数据传输的高要求机器视觉应用。

它的优势包括:

高速传输

提供高达12.5 Gbps的数据传输速率,满足高分辨率、高帧率视频和图像的传输需求。

长距离传输

支持长达100米的传输距离,使得在大型工厂、仓库等大面积场所的应用更加灵活。

易于安装

可使用标准的同轴电缆进行传输,安装简便,且成本较低。

兼容性好

可兼容多种不同类型的设备,如相机、监控系统、传感器等,可广泛应用于工业、医疗、安防等领域。

实时传输

CoaXPress-12接口的高带宽和低延迟特性可保证图像和视频的实时传输,满足实时图像处理和分析的需求

......长按二维码访问原文

Zebra 的固定式工业扫描和机器视觉解决方案助力自动化制造―技术与应用频道- 视觉系统设计 2023/11/7 21:19:01

在制造速度更快、质量更好、成本更低的需求推动下,各种规模的制造商都在采用各种形式的自动化,以降低成本、增加产量和缩短响应时间。如何简化生产各个阶段的流程以及提升产品质量?斑马技术可根据您的工厂需求提供和定制固定式工业扫描器和机器视觉解决方案,帮助您轻松实现自动化和优化制造流程。

01.简化和精简检查流程

在生产过程中发现生产缺陷和装配错误,提高生产准确性和确保产品质量。

02.为工厂运营找到合适的解决方案

您可以利用相同的硬件,将设备从入门级扫描器转变为综合机器视觉解决方案,满足您当前和未来的需求。

03.节省生产时间和成本

您可以借助Zebra的固定式工业扫描和机器视觉解决方案,自动化和优化制造流程,减少生产缺陷,生产更多产品,增加企业利润。

......长按二维码访问原文

快速搞定SIFT算法 2023-11-06 12:50

尺度不变特征转换(Scale-invariant feature transform, SIFT)是一种机器视觉算法,其作用是在各种尺度空间中搜索图像的关键点,并计算它们的尺度、旋转不变量以及位置等信息,实现对图像的详尽描述。

SIFT算法的实质是在不同的尺度空间上查找关键点,并计算出关键点的方向。这些关键点一般比较突出,不会因光照、仿射变换和噪音等因素而变化,如角点、边缘点、暗区的亮点及亮区的暗点等。

SIFT算法主要步骤:

Scale-space Extrema Detection——尺度空间极值检测

Keypoint Localization——关键点定位

Orientation Assignment——方向分配

Keypoint Descriptor——关键点描述子

总体来看,其实

......长按二维码访问原文

【ICME2023】 A Two-stage hybrid CNN-Transformer Network for RGB Guided Indoor Depth Completion: 2023-11-06 16:54

......长按二维码访问原文

ACM Multimedia 2023 Brave New Idea Award:基于解剖特征的手指语义重定向 2023-11-05 10:54

近日,清华大学贾珈教授团队提出了基于解剖特征的手指语义重定向方法,论文已被ACM Multimedia 2023录用,并获得“Brave New Idea Award”。论文第一作者为博士生叶梓杰。

本文就来分享一下这篇工作:

目前这篇文章的代码也已经开源:

正如论文标题中所讲,这篇工作所解决的问题是在不同的数字人之间进行动作重定向的时候,保持手指动作的细微语义特征。具体而言,给定一个源角色和一段Source Motion,我们希望能够驱动任意的目标角色的手指做出和Source Motion语义一致的动作。

由于不同角色手部比例和关节朝向不同,直接复制手指关节旋转角使得"竖大拇指"手势难以辨认。

背景介绍

近些年来角色动画生成的相关工作已经能够在许多应用场景下为数字人生成逼真的手部动作,如说话手势生

......长按二维码访问原文

4DRVO-Net:使用多模态和多尺度自适应融合的深度4D毫米波雷达-视觉里程计 2023-11-07 07:59

原标题:4DRVO-Net: Deep 4D Radar–Visual Odometry Using Multi-Modal and Multi-Scale Adaptive Fusion

论文链接: https:// arxiv.org/abs/2308.0657 3

作者单位:同济大学

论文思路:

四维 (4D) 毫米波雷达-视觉里程计 (4DRVO) 集成了 4D 毫米波雷达和摄像机的补充信息,使其成为实现准确、稳健的姿态估计的有吸引力的解决方案。然而,由于三个主要因素,4DRVO 可能会出现显着的跟踪误差:1)4D 毫米波雷达点云的稀疏性; 2)4D毫米波雷达与摄像机之间数据关联不准确、特征交互不足; 3)环境中动态物体引起的干扰,影响里程估计。本文提出了 4DRVO-Net,这是一种 4D 毫

......长按二维码访问原文

4DRVO-Net:使用多模态和多尺度自适应融合的深度4D毫米波雷达-视觉里程计 2023-11-06 07:47

原标题:4DRVO-Net: Deep 4D Radar–Visual Odometry Using Multi-Modal and Multi-Scale Adaptive Fusion

论文链接: https:// arxiv.org/abs/2308.0657 3

作者单位:同济大学

论文思路:

四维 (4D) 毫米波雷达-视觉里程计 (4DRVO) 集成了 4D 毫米波雷达和摄像机的补充信息,使其成为实现准确、稳健的姿态估计的有吸引力的解决方案。然而,由于三个主要因素,4DRVO 可能会出现显着的跟踪误差:1)4D 毫米波雷达点云的稀疏性; 2)4D毫米波雷达与摄像机之间数据关联不准确、特征交互不足; 3)环境中动态物体引起的干扰,影响里程估计。本文提出了 4DRVO-Net,这是一种 4D 毫

......长按二维码访问原文

2023年顶会域自适应分割 2023-11-06 22:04

MIC: Masked Image Consistency for Context-Enhanced Domain Adaptation

From:CVPR2023

大多数以前的UDA方法都难以处理在目标域上具有类似视觉外观的类,因为没有GT可用于学习轻微的外观差异。为了解决这个问题,本文提出了一个掩蔽图像一致性(MIC)模块,作为额外的线索以提高UDA学习的目标域的空间上下文关系索。MIC强制执行掩蔽的目标图像的预测之间的一致性,其中随机块被保留,并且伪标签基于由指数移动平均老师生成的完整图像。MIC可以集成到各种UDA方法中,跨越不同的视觉识别任务,如图像分类,语义分割和目标检测。

MIC

Refign: Align and Refine for Adaptation of Semantic Seg

......长按二维码访问原文

新视觉Backbone!英伟达提出ViR:视觉Retention网络 2023-11-05 21:00

一句话总结

本文提出一类新型计算机视觉模型,称为视觉保留网络(ViR),具有双重并行和循环公式,在快速推理和具有竞争性能的并行训练之间取得了最佳平衡,代码即将开源!

ViR: Vision Retention Networks

单位:NVIDIA

论文:https://arxiv.org/abs/2310.19731

近年来,视觉Transformer (ViT) 因其在建模远程空间依赖性和大规模训练的可扩展性方面的卓越能力而受到广泛欢迎。 尽管自注意力机制的训练并行性在保持良好性能方面发挥着重要作用,但其二次复杂度阻碍了 ViT 在许多需要快速推理的场景中的应用。 在需要对输入特征进行自回归建模的应用中,这种效果更加明显。 在自然语言处理(NLP)领域,一系列新的努力提出了具有循环公式的可并行模型,

......长按二维码访问原文

首篇!潜力巨大!ICTC:以文本为条件的图像聚类 2023-11-06 22:59

发论文,小蓝海方向?本文提出一种新的方法,通过利用现代视觉语言模型(VLM)和大语言模型(LLM),可以根据用户指定的文本标准执行图像聚类,加入人为干预,并授予用户对聚类结果的显著控制权!代码刚刚开源!

Image Clustering Conditioned on Text Criteria

单位:首尔大学, KRAFTON, UW–Madison

代码:https://github.com/sehyunkwon/ICTC

论文:https://arxiv.org/abs/2310.18297

如果你想看更多CVPR / ICCV 2023论文和代码,在CVer微信公众号后台回复:CVPR2023或者ICCV2023,即可下载CVPR / ICCV 2023论文和代码开源合集!

经典的聚类方法不为

......长按二维码访问原文

CV计算机视觉每日开源代码Paper with code速览-2023.11.6 2023-11-06 21:54

精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【点云3D目标检测】(NeurIPS2023)Flow-Based Feature Fusion for Vehicle-Infrastructure Cooperative 3D Object Detection

2.【多模态】(NeurIPS2023)FETV: A Benchmark for Fine-Grained Evaluation of Open-Domain Text-to-Video Generation

3.【多模态】MixCon3D: Synergizing Multi-View and Cross-Mo

......长按二维码访问原文

全球首发!总结七十余种开源数据集,一览自动驾驶开源数据体系(AI Lab等多家单位) 2023-11-07 07:45

基于数据驱动的各类深度学习模型任务,近年来随着数据集规模的不断扩大,性能逐渐被提升,国内外各大自动驾驶公司都在不断建立自己的数据库,以及数据闭环系统,期待数据的丰富能够解决下半场自动驾驶问题,那么如何构建数据集?如何搭建自己的数据闭环系统解决长尾等各类问题呢?

现有自动驾驶数据集可大致分为两代,第一代数据集的传感模态复杂度相对较低、数据集规 模相对较小,且大多局限于感知级任务,第一代数据集以发布于 2012 年的 KITTI 为代表。相比于第一代数据集,第二代数据集的特征为传感模态复杂度较高、数据集规模与多样性较丰富、所设置任务从感知扩展到预测、规控上,第二代数据集以 2019 年前后提出的 nuScenes、Waymo 为代表。

《自动驾驶开源数据体系:现状与未来》是由上海人工智能实验室牵头,上海交大、复

......长按二维码访问原文

《底特律:变人》会用到计算机视觉技术吗? 2023-11-07 11:51

一、首先知道一下计算机视觉和机器视觉得有什么区别:

计算机视觉是利用计算机技术对图像进行分析和处理的技术,它主要包括图像处理、模式识别、计算机图形学等方面。计算机视觉的应用范围比较广泛,图形识别、目标跟踪、三维建模等领域。计算机视觉可以为人们提供方便,对生产和生活带来便利和效益

机器视觉主要在图像处理上实现的自动化,它是他通过摄像头或者高精度传感器获取的图像信息,然后通过图像处理的算法对环境进行识别、定位和判断,实现更加精准、高效的操作;机器视觉的的应用范围非常的广泛,包括工业自动化、智能交通、医疗影像领域,提高生产效率 降低人力成本。

总的来说,两者都是利用计算机的技术实现对图形进行处理和分析技术,但是它们实现方式应用范围有所不同。

二、两者主要应用的行业:

计算机视觉:

1、无人驾驶:无

......长按二维码访问原文

李群上的优化 2023-11-07 21:49

在SLAM问题中,我们通常需要解决“什么样的相机位姿最符合当前的观测数据”这样的问题。一种典型的方式是把它构建成一个优化问题。求解最优的 \mathbf{R}, \mathbf{t} ,使得误差最小化。

这将涉及到李群 \text{SO}(3), \text{SE}(3) 上的优化。考虑到旋转矩阵自身是带有约束的(正交且行列式为 1 )。它们作为优化变量时,会引入额外的约束,使得优化变得困难。通过李群-李代数之间的转换关系,可以把位姿估计转换成无约束优化问题。

BCH公式与其近似形式

两个李代数指数映射乘积的完整形式,由Baker-Campbell-Hausdorff公式(BCH公式)给出:

\ln(\exp(\mathbf{A}) \, \exp(\mathbf{B})) = \mathbf{A} +

......长按二维码访问原文

书籍推荐-《深度学习在自然语言处理、语音和计算机视觉中的应用》 2023-11-07 12:18

书籍:Deep Learning Approach for Natural Language Processing, Speech, and Computer Vision: Techniques and Use Cases

作者:L. Ashok Kumar,D. Karthika Renuka

出版:CRC Press

入群邀请:7个专业方向交流群+1个资料需求群

原文地址:书籍下载-《深度学习在自然语言处理、语音和计算机视觉中的应用》

01 书籍介绍

《深度学习在自然语言处理、语音和计算机视觉中的应用》提供了深度学习方法论及其在自然语言处理(NLP)、语音和计算机视觉任务中的应用的概述。本书以全面的方式简化和呈现了深度学习的概念,并通过案例研究、代码实验和支持性分析,旨在弥合理论和应用之间的差

......长按二维码访问原文

NeurIPS 2023 | BackBone之战:计算机视觉任务模型大比较 2023-11-07 14:38

paper:https://arxiv.org/pdf/2310.19909

code:https://github.com/hsouri/Battle-of-the-Backbones

要解决的问题:

距离深度学习的突破之作AlexNet已过去10年之久,期间各种网络架构层出不穷,那么作为研究者和实践者,该如何选择网络架构?

解决方案:

通过对各种预训练模型(包括视觉-语言模型、自监督学习模型等)在多种计算机视觉任务(如分类、对象检测等)上的性能进行大规模比较,来帮助研究者和实践者更好地选择合适的模型。这就像是在各种预训练模型中进行一场“角逐”,看看哪个模型的性能最好。

结论:

1、尽管Vision Transformer(ViTs)和自监督学习(SSL)越来越受欢迎,但在大多数任务中,文章发现

......长按二维码访问原文

CV计算机视觉每日开源代码Paper with code速览-2023.11.7 2023-11-07 14:54

精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构】Understanding Deep Representation Learning via Layerwise Feature Compression and Discrimination

2.【图像分类】(ICLR2023)Cross-Level Distillation and Feature Denoising for Cross-Domain Few-Shot Classification

3.【开放世界目标检测】Proposal-Level Unsupervised Domain Adaptatio

......长按二维码访问原文

CV最新论文 | 11月6日 arXiv更新论文合集 2023-11-06 11:31

以下内容由马拉AI整理,今天为大家带来11月6日 arXiv 计算机视觉和模式识别相关论文

1、EmerNeRF:基于自我监督的紧急时空场景分解

EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision

摘要:我们提出了EmerNeRF,这是一种简单而强大的方法,用于学习动态驾驶场景的时空表示。EmerNeRF 以神经场为基础,通过自引导同时捕获场景几何形状、外观、运动和语义。EmerNeRF依赖于两个核心组件:首先,它将场景分层为静态场和动态场。这种分解纯粹来自自我监督,使我们的模型能够从一般的野外数据源中学习。其次,EmerNeRF将动态场的感应流场参数化,并利用该流场进一步聚合多帧特征,放大动态对象的

......长按二维码访问原文

视觉魔法师

我还没有学会写个人说明!

相关推荐