文章目录[隐藏]
- 行业资讯
- 你们相信控制理论研究能产生出第二个像PID这样有广泛影响、普遍适用的控制吗? 2023-06-22 08:23
- 世椿智能“工业机器人+3D视觉技术”实现精密点胶--机器视觉网 2023-10-12 14:30:32
- 帆声科技2023重磅新品,U-EYE100色彩分析仪--机器视觉网 2023-10-12 13:56:22
- 菲特成功认定天津市企业技术中心,是坚持核心技术攻关的重要里程碑--机器视觉网 2023-10-12 13:38:36
- 深入新能源汽车产线,易思维在线测量保障整车质量实时监控--机器视觉网 2023-10-12 15:35:38
- 凌云光「视觉+AI」助力锂电极片工艺质量升级--机器视觉网 2023-10-12 15:29:26
- 德国农业巨头Baywa公司实现安全高效运行的秘诀--机器视觉网 2023-10-12 15:11:15
- 锂电池防爆阀焊接缺陷检测,为动力电池生产质量保驾护航--机器视觉网 2023-10-12 14:12:41
- 安森美推出超低功耗图像传感器系列―新闻频道- 视觉系统设计 2023/10/11 22:05:17
- SICK物流解决方案助力物流4.0―新闻频道- 视觉系统设计 2023/10/12 16:07:35
- 视觉龙“融通发展 链接共赢”龙华区“小巨人”创新成果展―新闻频道- 视觉系统设计 2023/10/12 16:01:27
- JAI诚邀您参加成都 VisionCon 视觉技术会议―新闻频道- 视觉系统设计 2023/10/12 15:58:32
- 低光目标检测| Making of Night Vision: Object Detection Under Low-Illumination 2023-10-12 17:06
- 第十章 MMDetection3D解析系列_数据集(dataset)(车道线感知) 2023-10-12 15:19
- LLaVA v1.5(多模态图像模型)与 GPT-4V 来解释 Transformer 架构 2023-10-12 13:30
- ICCV 2023 | 论文速递:基于拓扑几何约束的动态snake卷积用于管状结构分割 2023-10-12 02:42
- 10月-算法学习路线图 - 数学(Math)、计算机视觉(CV)、自然语言处理(NLP)和机器人(Robot) 2023-10-12 09:25
- EViT:借鉴鹰眼视觉结构,南开大学等提出ViT新骨干架构,在多个任务上涨点 2023-10-12 13:02
- CV计算机视觉每日开源代码Paper with code速览-2023.10.12 2023-10-12 16:47
- VPT:一个视觉提示调优方法 2023-10-12 00:59
- PowerBEV:一种强大而轻量级的鸟瞰图实例预测框架 2023-10-12 17:09
- 图像修复简介 2023-10-12 08:45
- AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队 2023-10-12 13:49
- OpenAI被曝“在憋大招”:构建ChatGPT应用成本暴降95% 2023-10-12 13:30
- 移植猪肾猴子成功存活两年!Nature发布跨物种器官移植最新成果 2023-10-12 13:13
- “九章三号”光量子计算机问世!比超算快一亿亿倍,来自中科大潘建伟团队 2023-10-12 13:38
- 突发!Hinton入局机器人创业,公司新获9000万投资 2023-10-12 12:07
- 陈丹琦团队新作:5%成本拿下SOTA,“羊驼剪毛”大法火了 2023-10-12 12:05
行业资讯
你们相信控制理论研究能产生出第二个像PID这样有广泛影响、普遍适用的控制吗? 2023-06-22 08:23
我认为有很多。(经众多读者要求本人再更新一下相关RST控制器的介绍和其效果图)
RST就有这个潜力。阶数只比PID高一阶。可以分立的处理参考输入到输出的传递函数和敏感度传递函数(干扰到输出),可以在抑制干扰的情况下保证闭环控制系统原本的响应不受影响。还可以继续加入鲁棒(让模型存在不确定性因素下满足稳定性和时域指标),还可以最小化任意传递函数大小以达到衰减/放大某个节点信号的目的(比如我可以最小化噪音到控制器输出的传递函数等)。而且算出来的控制器直接是离散的,没有连续到离散的转化损失。而且结果是严格因果的,这个时刻的输出只取决于之前时刻的信号(不会和未来的信号以及当前的信号相关联),非常容易写入硬件。最主要的是PID可以写成它的形式,它也可以降一阶变成PID,这意味着什么呢?这意味着PID可以用它来找参数,这个
......长按二维码访问原文
世椿智能“工业机器人+3D视觉技术”实现精密点胶--机器视觉网 2023-10-12 14:30:32
2023-10-12 14:30:32 来源: 中国机器视觉网
随着点胶工业需求的不断发展,点胶机器人被广泛使用。针对传统点胶机器人空间性、灵活性不足的行业性问题,深圳市世椿智能装备股份有限公司(简称世椿智能)推出“工业机器人+3D视觉技术”柔性点胶解决方案,为客户提供点胶精度、可靠性和自动化水平更高的服务。
世椿智能“工业机器人+3D视觉技术”的成功结合带来了许多关键性突破,包括高精度定位和导航、智能识别和检测、高灵活性、高适应性、高协作性等,改善了工业生产的效率、准确性和安全性,在提升工业制造业的竞争力和发展方面发挥了重要作用。
3D视觉技术赋予工业机器人“慧眼”,推动智能制造转型升级
在人工智能、机器人、生物识别、物联网等产业快速发展的背景下,制造业智能制造转型不断深入,机器视觉技术愈发受到关注。
......长按二维码访问原文
帆声科技2023重磅新品,U-EYE100色彩分析仪--机器视觉网 2023-10-12 13:56:22
2023-10-12 13:56:22 来源: 中国机器视觉网
近日,帆声科技重磅推出2023年度新品,U-EYE100色彩分析仪。U-EYE100色彩分析仪选用27mm镜头,采用非接触式量测设计,以量测显示器面板的辉度与色彩表现。
本产品采用先进的数位信号处理器及光电转换技术研发而成,搭配精密的光学元件与电路设计,具有高速、精确、稳定的色彩测量能力。
该产品具备:符合CIE1931/CIE1964标准;支持LCD/OLED/Micro-LED等面板色校准;支持Flicker JEITA和FMA模式闪烁测量;支持USB串口控制;超高精准度测量,色域xy误差±0.0005,Lv误差±0.1% 闪烁度误差±1%;测量速度可达100次/秒;暗态画面仍可高速测量等特点。
U-EYE100色彩分析仪具备独有的高速
......长按二维码访问原文
菲特成功认定天津市企业技术中心,是坚持核心技术攻关的重要里程碑--机器视觉网 2023-10-12 13:38:36
2023-10-12 13:38:36 来源: 中国机器视觉网
近日,天津市工业和信息化局、市发展改革委、市科技局、市财政局等四部门联合评审认定的2023年第三十批天津市企业技术中心名单公布。菲特(天津)检测技术有限公司深耕工业领域,专注于光学、人机交互、人工智能等技术的研发和创新,通过初审推荐、材料审查、第三方评价和专家评审等环节,成功认定。此次认定,是菲特坚持核心技术攻关的重要里程碑!
天津市企业技术中心是由天津市工业和信息化局会同市发展改革委、市科技局、市财政局等部门,按照《天津市企业技术中心认定管理办法》(津工信规〔2021〕1号)的要求联合审批认定,根据先进制造研发基地建设和高质量发展的需要,对创新能力强、创新机制好、引领示范作用大、信用状况良好、符合条件的企业技术中心予以认定,鼓励引导行业骨干企
......长按二维码访问原文
深入新能源汽车产线,易思维在线测量保障整车质量实时监控--机器视觉网 2023-10-12 15:35:38
2023-10-12 15:35:38 来源: 中国机器视觉网
2022年,我国新能源汽车渗透率达到25.6%,产销量连续8年位居世界第一。新消费需求的爆发加速了自主品牌的崛起,更智能、更柔性化的生产工厂,也成为各大车企满足订单需求,实现高质量、高标准交付的保障。2019年,某国产新能源汽车头部品牌建立起第一座现代化工厂。为了满足两条产线兼容多款车型生产、年产能10万辆车的生产需求,保障每一辆汽车都能高标准交付到消费者手中,该工厂采用了全球先进的自动化设备。
同时,该企业在多个工位应用了易思维在线测量系统,实现了对焊装车间底板总成、白车身总成等关键位置尺寸的实时在线测量和质量监控,保证每一辆车都能先测量后流出,单车测量时间不超过一分钟。
为什么选择易思维
车身测量是检测汽车白车身质量是否达标、为前序工艺
......长按二维码访问原文
凌云光「视觉+AI」助力锂电极片工艺质量升级--机器视觉网 2023-10-12 15:29:26
2023-10-12 15:29:26 来源: 中国机器视觉网
凌云光分享了凌云光先进光学成像、智能AI算法在锂电极限制造领域的成功实践。在碳达峰、碳中和的全球大背景下,新能源电池作为绿色产业的重要组成部分,有着前所未有的发展机遇,同时质量安全问题也面临严峻考验,其生产全工艺段严格的质量检测和管理十分必要。
凌云光秦庆旺博士表示:在锂电极片涂布及辊分工艺段,还存在箔材、涂布区高低反射率材料高动态成像、微米级极片毛刺动态成像等难题,以及缺陷精确分类分级、海量数据实时精确检测带来的挑战。为此,凌云光积极投入研发资源,在极片工艺质量检测领域取得一系列创新实践解决方案。
精准成像
面对锂电行业极限制造不断提升的工艺要求,凌云光通过单相机光源同步频闪分时曝光技术,成功解决高动态范围成像难题,实现虚边缺陷的精准抓取
......长按二维码访问原文
德国农业巨头Baywa公司实现安全高效运行的秘诀--机器视觉网 2023-10-12 15:11:15
2023-10-12 15:11:15 来源: 中国机器视觉网
您是否思考过,当苹果到达超市和消费者手中时,它经历了哪些过程?从采摘、检查、储存、分类和包装,很少有公司像Baywa一样熟悉这些流程。Baywa公司也是因为劳易测传感器的技术,促使整个过程能够安全高效地运行。
根据客户要求进行分类和转运
苹果的收获从8月份一直持续到10月底,大约有30个苹果品种。从苹果储存开始,果农会将他们的苹果装在每个300公斤的箱子里,首先要检查苹果的质量。如果它们适合长期储存,就会被放置在气调库(果蔬保鲜贮藏方法)中。在克雷斯波洛,Baywa公司有40个仓库可存放农产品,每个仓库可容纳约350吨,相当于1000个箱子。
一旦气调库被打开,苹果就会被高空作业车装在箱子里运到分拣区,在从箱子中倒出后,苹果在之后的过程中有
......长按二维码访问原文
锂电池防爆阀焊接缺陷检测,为动力电池生产质量保驾护航--机器视觉网 2023-10-12 14:12:41
2023-10-12 14:12:41 来源: 中国机器视觉网
动力电池防爆阀是锂离子动力电池中的关键零件。当电芯内部压力过大的时候,防爆装制会自动打开泄压,以防止出现爆炸的现象。动力电池防爆阀是一种透气、防水、防爆的汽车配件,在新能源电动汽车上用的比较多。如何提高动力电池防爆阀片的生产质量,保证动力电池的安全性,创科视觉有着丰富的视觉检测项目经验,专为动力电池生产质量保驾护航。
动力电池防爆阀片焊接检测
检测要求:动力电池防爆阀片漏焊、偏焊、焊高、断焊、焊洞等视觉检测。
检测方案:视觉系统软件CKVisionBuilder+3D视觉系统。
检测流程:相机和光源固定安装,相机从上往下拍照,每次拍照检测一个产品,产品到达位置后PLC触发视觉拍照,检测完成后反馈PLC结果。
检测效果:
动力电池防爆阀
......长按二维码访问原文
安森美推出超低功耗图像传感器系列―新闻频道- 视觉系统设计 2023/10/11 22:05:17
安森美(onsemi)宣布推出适用于工业和商业相机的Hyperlux LP图像传感器系列,场景覆盖智能门禁、安防摄像头、增强现实(AR)/虚拟现实(VR)/扩展现实(XR)头戴装置、机器视觉和视频会议等。此传感器系列基于1.4 µm 像素,提供业界领先的图像质量和低功耗,同时大幅提高图像性能,即使在恶劣的照明条件下也能捕获清晰、生动的图像。
此产品系列还采用堆叠式架构设计,能最大限度地减少产品体积,最小型号小如一粒米,成为受尺寸限制困扰的紧凑型设备的理想选择。客户可以根据使用情况,选用500万分辨率的AR0544、800万分辨率的AR0830或2000万分辨率的AR2020。
......长按二维码访问原文
SICK物流解决方案助力物流4.0―新闻频道- 视觉系统设计 2023/10/12 16:07:35
随着⼯业4.0概念不断地在各类型制造⾏业中被应⽤,智能制造成为了现阶段炙⼿可热的话题之⼀。
作为其中的重要⼀环,物流自动化逐渐成为了⼀种趋势。许多制造型企业开始思考如何提⾼工厂内物流的⽆⼈化及⾃动化程度,以物流4.0为目标,进一步提高生产效率的同时,进行降本增益。
我们为您整理并分类了物流行业中各类常见应用场景下的众多解决方案,相信无论您在哪一个物流环节面临着挑战,都能从中找到适合您的解决方案。
仓储和输送技术
仓储和输送技术在内部物流中起着重要的作用。这里要求更大的吞吐量以及理想地使用存储空间。高动态市场、创新的物流过程和可变的输送带对灵活性提出了更高的要求。此外,传感器是重要的影响因素。SICK不仅提供齐全的传感器和服务产品组合,而且还具备丰富完整的行业知识,为您的仓储和输送技术取得成功实现重要的增
......长按二维码访问原文
视觉龙“融通发展 链接共赢”龙华区“小巨人”创新成果展―新闻频道- 视觉系统设计 2023/10/12 16:01:27
深圳市中小企业服务局携龙华区投资推广和企业服务中心于10月11日在龙华区捷顺科技中心一楼国际会议中心举办了一场别开生面的“融通发展 链接共赢”龙华区“小巨人”创新成果展暨供需对接会。视觉龙作为专精特新"小巨人"企业代表受邀参加此次活动。
视觉龙凭借在机器视觉领域的创新发展,荣获2023年度“深圳市专精特新中小企业”认定和“深圳市创新型中小企业”认定。
视觉龙是一家专注于机器视觉产品开发与应用的高新技术企业,在本次活动中向大家展示了一系列视觉龙自主创新产品和技术,借此也充分展示了视觉龙在智能制造领域20多年以来积累的专业能力和独特优势。
非常感谢政府举办此次活动,不仅让参会企业了解到行业最新的发展趋势和技术创新方向,还为企业提供了一个展示自身实力和优势的平台。未来,视觉龙将继续致力于为智能制造行业客户提供数
......长按二维码访问原文
JAI诚邀您参加成都 VisionCon 视觉技术会议―新闻频道- 视觉系统设计 2023/10/12 15:58:32
JAI将携AP-3200T 3CMOS多光谱棱镜相机 (真彩相机) 出席VisionCon (成都) 视觉系统设计技术会议。届时,JAI 的高级应用工程师李雪敏将在本次活动中发表演讲,分享工业相机技术的进步如何提高您的机器视觉性能。在本次会议中,我们将重点介绍:
☑ 当代机器视觉光谱需求
☑ 新一代紫外技术和应用
☑ 棱镜的可见光技术和应用
☑ 棱镜的多光谱NIR+SWIR技术和应用
现场演示 真彩相机AP-3200T系列
❖Apex系列 3传感器RGB棱镜式面阵扫描相机
❖300万像素的3CMOS棱镜相机
❖最大帧率: 55.6fps (Camera Link), 38.3fps (USB), 12fps (GigE)
❖可对R, G, B分别调整增益
❖应用:制药、电子、印刷/包装、显微
......长按二维码访问原文
低光目标检测| Making of Night Vision: Object Detection Under Low-Illumination 2023-10-12 17:06
专门设计了一个特征金字塔网络和上下文融合网络用于低光照目标检测。
作者发现直接使用low-level的亮度增强网络对数据集尽进行增强然后再训练的效果不好,以下是使用不同的低光增强算法对数据集进行增强之后的视觉图片以及检测结果
并且作者可视化了不同亮度的数据集(coco和exdark)训练出来的模型在检测时不同卷积层提取出的特征,表明使用exdark低光照数据集训练的模型在进行低光照的特征提取时具有更好的效果,同时也为低光照目标检测指明了一个方向,也就是进行特征增强。
由上述实验可以得到,有价值的信息在深层可能会丢失,在低光图片中这种现象尤为明显,低光图片中物体在卷积的过程中容易合并到黑暗的背景当中去。整体检测框架如下:
其中红色的框表示特征金字塔的融合过程,作者对原始的特征金字塔融合进行了改进,可以更大
......长按二维码访问原文
第十章 MMDetection3D解析系列_数据集(dataset)(车道线感知) 2023-10-12 15:19
一 前言
近期参与到了手写AI的车道线检测的学习中去,以此系列笔记记录学习与思考的全过程。车道线检测系列会持续更新,力求完整精炼,引人启示。所需前期知识,可以结合手写AI进行系统的学习。
二 概述
数据集与数据加载器是MMEngine中训练流程的必要组件,它们的概念来源于 PyTorch数据集,并且在含义上与 PyTorch 保持一致。通常来说,数据集定义了数据的总体数量、读取方式以及预处理,而数据加载器则在不同的设置下迭代地加载数据,如批次大小(batch_size)、随机乱序(shuffle)、并行(num_workers)等。数据集经过数据加载器封装后构成了数据源。我们将按照从外(数据加载器)到内(数据集)的顺序,逐步介绍它们在 MMEngine 执行器中的用法,并给出一些常用示例。你将会:
掌握
......长按二维码访问原文
LLaVA v1.5(多模态图像模型)与 GPT-4V 来解释 Transformer 架构 2023-10-12 13:30
使用 LLaVA v1.5(多模态图像模型)与 GPT-4V 来解释 Transformer 架构。
在多次测试中并不完全如此,但它的大小令人惊讶(只有 13B )。
针对自定义视觉任务对该模型进行微调可能会成为新的“YOLOv”模型。 LLaVA v1.5 可能是更多开源大型多模态模型 (LMM) 的开始,以下是训练数据集:https://github.com/haotian-liu/LLaVA#train…
对于8x A100 上的 LLaVA-v1.5 (13B)视觉指令调整仅需约 20 小时(约 350 美元)
......长按二维码访问原文
ICCV 2023 | 论文速递:基于拓扑几何约束的动态snake卷积用于管状结构分割 2023-10-12 02:42
在各个领域,如血管和roads等拓扑管状结构的准确分割对于确保下游任务的准确性和效率至关重要。然而,许多因素使这项任务变得复杂,包括细长的局部结构和多变的全局形态。在这项工作中注意到管状结构的特殊性,利用这一知识来引导DSCNet在三个阶段同时增强感知:特征提取、特征融合和损失约束。首先,提出了一种动态snake卷积,通过自适应地关注细长和曲折的局部结构,精确捕捉管状结构的特征。随后,提出了一种多视角特征融合策略,在特征融合期间,从多个角度补充对特征的关注,确保保留不同全局形态的重要信息。最后,基于持续同调的连续性约束损失函数,用于更好地约束分割的拓扑连续性。在2D和3D数据集上的实验表明,与几种方法相比,DSCNet在管状结构分割任务上提供更好的准确性和连续性。
论文链接:Dynamic Snake Con
......长按二维码访问原文
10月-算法学习路线图 - 数学(Math)、计算机视觉(CV)、自然语言处理(NLP)和机器人(Robot) 2023-10-12 09:25
[Pascal算法摆渡人]公众号、知乎、小红书等感谢关注。Hi,大家好!我是Pascal_M。
我们一起读起来!!!了解过往历史文献的方法和不足之处,展望最新的文献和技术。
当然,大家对感兴趣文献可以留言哦。说不定下期就出现了。
月报会越来越长,大家可以看左边的目录挑选自己感兴趣的领域。
计算机视觉CV - 技术学习路线图(持续更新)
计算机视觉CV和自然语言处理NLP - (高阶版)技术学习路线图AIGC和LLMs
☆ 应用领域
1)自动驾驶
Pascal算法摆渡人:[CV - Object Detection]自动驾驶 - 全景驾驶感知系统 YOLOPv1模型
Pascal算法摆渡人:[CV - Object Detection]自动驾驶 - 全景驾驶感知系统 YOLOPv2模型
......长按二维码访问原文
EViT:借鉴鹰眼视觉结构,南开大学等提出ViT新骨干架构,在多个任务上涨点 2023-10-12 13:02
精华置顶
墙裂推荐!小白如何1个月系统学习CV核心知识:链接
点击@CV计算机视觉,关注更多CV干货
点击加入—>CV计算机视觉交流群
今天跟大家分享南开大学和中国民航大学联合提出的一种新的Vison Transformer架构EViT,该结构是CNN和ViT的混合架构,在设计时参考了鹰眼成像的生理结构,在目标检测、实例分割等多个下游任务中表现优秀。
1.动机
自2012年起,CNN开始主导多个计算机视觉任务,由于卷积核的感受野限制,CNN难以捕捉图像的全局信息,从而限制了CNN的进一步发展和应用。此时,在NLP领域中快速发展的transformer结构进入了计算机视觉学者的视野。与CNN相比,transformer擅长对特征的全局依赖建模,能很好地捕捉广泛的上下文信息,这种能力对图像分类、目标检测
......长按二维码访问原文
CV计算机视觉每日开源代码Paper with code速览-2023.10.12 2023-10-12 16:47
精华置顶
墙裂推荐!小白如何1个月系统学习CV核心知识:链接
点击@CV计算机视觉,关注更多CV干货
论文已打包,点击进入—>下载界面
点击加入—>CV计算机视觉交流群
1.【目标检测】A Novel Voronoi-based Convolutional Neural Network Framework for Pushing Person Detection in Crowd Videos
2.【目标检测、分割】Relational Prior Knowledge Graphs for Detection and Instance Segmentation
3.【异常检测】PAD: A Dataset and Benchmark for Pose-agnostic Anomaly Detect
......长按二维码访问原文
VPT:一个视觉提示调优方法 2023-10-12 00:59
22年3月发表的论文“Visual Prompt Tuning”,来自Cornell大学、Meta AI和哥本哈根大学。
一种调优预训练模型的操作涉及更新所有主干参数,即全微调。 本文介绍了视觉提示调优(VPT)作为视觉中大规模 Transformer 模型全面微调的高效且有用的替代方案。 受高效调优大语言模型的启发,VPT 在输入空间中仅引入少量(不到模型参数的 1%)可训练参数,同时保持模型主干冻结。 通过对各种下游识别任务的大量实验,与其他参数高效调优的协议相比,VPT 实现了明显性能提升。 最重要的是,在许多情况下,VPT 在模型容量和训练数据规模方面甚至优于全微调,同时降低了每个任务的存储成本。
如图所示是视觉提示调优(VPT)与其他迁移学习方法的比较。 (a) 当前的迁移学习协议根据调整范围进行
......长按二维码访问原文
PowerBEV:一种强大而轻量级的鸟瞰图实例预测框架 2023-10-12 17:09
作者:自动驾驶专栏 | 原文出处:公众号【自动驾驶专栏】
摘要
本文介绍了PowerBEV:一种强大而轻量级的鸟瞰图实例预测框架。精确地感知实例并且预测它们未来的运动是自动驾驶汽车的关键任务,使其能够在复杂的城市交通中安全行驶。尽管鸟瞰图(BEV)表示在自动驾驶的感知中很常见,但是它们在运动预测方面的潜力却很少被探索。现有的从环视相机进行BEV实例预测的方法依赖于多任务自回归设置以及复杂的后处理,以时空一致的方式来预测未来的实例。在本文中,我们不采用这种方法,并且提出了一种高效的新型端到端框架,称为PowerBEV,其在若干设计选择上有所不同,目的是减少先前方法中固有的冗余。首先,PowerBEV没有通过自回归方式预测未来,而是使用一种由轻量级2D卷积网络构建的并行、多尺度模块。其次,我们证明了分割和向心反
......长按二维码访问原文
图像修复简介 2023-10-12 08:45
1. 什么是图像修复
以上图片来自 MAT 。
图像修复( Image Inpainting ,在paperswithcode上有单独的任务项)通常又称作图像填充,包括:对象移除、图片填充、风格转换等。
2. 图像修复的方法分类
1)传统的基于Patch的方法,核心思想是将图像分块,使用与填充块最接近的块进行填充,代表方法有: Exemplar-Based 、 PatchMatch 。
2)基于深度学习的方法,包括:基于CNN的方法(主要使用编解码器结构),基于GAN的方法以及基于注意力机制的方法,代表方法有: Context Encoders 、 Deep Image Prior 、 Contextual Attention 、 LaMa 、 RePaint 。
3)基于多帧信息的方法(目前有逐渐
......长按二维码访问原文
AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队 2023-10-12 13:49
Michael 投稿自 凹非寺
量子位 | 公众号 QbitAI
谷歌人机验证已经拦不住AI了!
最新多模态大模型,能轻松找到图中所有交通信号灯,还准确圈出了具体位置。
表现直接超越GPT-4V。
这就是由苹果和哥伦比亚大学研究团队带来的多模态大模型“雪貂”(Ferret)。
它具备更强的图文关联能力,提升了大模型在“看说答”任务中的精确度。
比如下图中非常细小的部件(region 1),它也可以分辨出来是避震。
GPT-4V没能回答正确,在细小部分上的表现不佳。
所以,Ferret是如何做到的呢?
“点一点”图像大模型都懂
Ferret解决的核心问题是让引用(referring)和定位(grounding)两
......长按二维码访问原文
OpenAI被曝“在憋大招”:构建ChatGPT应用成本暴降95% 2023-10-12 13:30
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
ChatGPT对开发者吸引后继乏力,OpenAI要搞大动作了!
据路透社爆料,OpenAI正计划推出一次重大更新,让开发者基于ChatGPT搭建APP的成本一次性缩水95%。
不仅如此,OpenAI还打算推出更多开发者工具,并构建一些“样本APP”,进一步吸引开发者们入驻ChatGPT社区。
种种举措,都是因为OpenAI发现,虽然ChatGPT短期内吸引了不少消费者的注意力,但开发者对它兴趣寥寥——
距离OpenAI想要实现的大模型应用商店,还有不少距离。
OpenAI认为,这都是因为开发者调用ChatGPT等大模型成本太高了。
所以,是时候“打个折”,让它们变得对开发者更有吸引力。
OpenAI要更新啥?
目前来看,O
......长按二维码访问原文
移植猪肾猴子成功存活两年!Nature发布跨物种器官移植最新成果 2023-10-12 13:13
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
跨物种器官移植,又有新进展了!
最新一期的Nature刊载了一项关于基因编辑猪肾移植的研究。
植入这种改造肾脏的猴子,最长存活时间达到了两年。
这项研究由美国一家名为eGenesis的生物技术公司牵头,多所高校和研究机构共同参与。
研究团队敲除了会引起人类人类排异反应的基因,并引入了人类的免疫调节蛋白,得到了“人类化”的肾脏供体。
这些肾脏被植入15只食蟹猕猴(Macaca fascicularis)体内,其中有9只生存时间超过一年,最长寿的一只活了两年。
Nature介绍,在跨物种器官移植案例中,两年的存活时间十分罕见。
那么,研究团队是如何做到的呢?
让猪肾更适合人类
技术层面,解决跨物种器官移植的中心思想就是让供体器官尽可能和受
......长按二维码访问原文
“九章三号”光量子计算机问世!比超算快一亿亿倍,来自中科大潘建伟团队 2023-10-12 13:38
丰色 发自 凹非寺
量子位 | 公众号 QbitAI
我国量子计算迎来新突破。
中科大官网消息:
新一代量子计算原型机“九章三号”成功研制,255个光子(比“九章二号”多了1倍多),计算能力刷新世界纪录。
具体有多强?
(1)处理高斯玻色取样的速度,比上一代“九章二号”还要快一百万倍,比目前全球最快超算(Frontier)则快上一亿亿倍;
(2)在1微秒(10的负6次方秒)内所处理的最高复杂度样本,如果换作全球最快超算来做,它得花超二百亿年(简单理解为1微秒=200亿年)。
网友表示:
这才是真的牛。
从意义上来看,中科大表示:
“九章三号”的诞生主要是进一步巩固我国在光量子计算领域(与之对应的是超导量子)的领先地位。
它背
......长按二维码访问原文
突发!Hinton入局机器人创业,公司新获9000万投资 2023-10-12 12:07
明敏 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
图灵奖得主、深度学习之父Geoffrey Hinton的下一程,定了!
刚刚,Hinton亲自宣布,将加入机器人初创公司Vayu Robotics,担任顾问一职。
消息一出,网友们一水儿的Congratulations!
还有人说,这回机器人管家更有希望了。
今年5月,Hinton突然从任职十载的谷歌离职,轰动整个科技圈。
他本人当时表示,这么做是为了可以自由地讨论人工智能风险。
自从离职后,这位AI教父收到邀约不断,但都没能吸引到他——直到Vayu Robotics出现。
所以这家名不见经传的初创公司,凭什么?
Hinton给出的理由是,它们的技术路线和其他很多AI应用相比,AI道德风险更低。
当然Vayu Robotics自身
......长按二维码访问原文
陈丹琦团队新作:5%成本拿下SOTA,“羊驼剪毛”大法火了 2023-10-12 12:05
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
只用3%的计算量、5%的成本取得SOTA,统治了1B-3B规模的开源大模型。
这一成果来自普林斯顿陈丹琦团队,名为LLM-Shearing大模型剪枝法。
以羊驼LLaMA 2 7B为基础,通过定向结构化剪枝得到1.3B和3B剪枝后的Sheared-LLama模型。
分别在下游任务评估上超越之前的同等规模模型。
一作夏梦舟表示,“比从头开始预训练划算很多”。
论文中也给出了剪枝后的Sheared-LLaMA输出示例,表示尽管规模只有1.3B和2.7B,也已经能生成连贯且内容丰富的回复。
相同的“扮演一个半导体行业分析师”任务,2.7B版本的回答结构上还要更清晰一些。
团队表示虽然目前只用Llama 2 7B版做了剪枝实验,但该方法可以扩展到其
......长按二维码访问原文