ICCV2025涨点神器:新方式在视觉类领域提升精度(附源代码)

发布时间 - 2025-07-14 00:00:00    点击率:

iccv2025的提升精度神器:视觉领域的新方法(附源代码)

论文链接:https://www./link/c9344998d1ecc002e56b572b310a2ab1

源代码链接:https://www./link/b941a08af07454487cd79c7f5f0af926

前言

基于非局部的模块设计被用于捕获计算机视觉任务中的远程时空依赖性。尽管表现出色,这些模块仍然缺乏对图像或视频元素之间丰富的结构化信息进行编码的机制。

在今天的分享中,为了从理论上分析这些基于非局部的模块的属性,研究者提供了一个新的视角来解释它们,将它们视为在全连接图上生成的一组图过滤器。具体地,在选择Chebyshev图滤波器时,可以导出一个统一的公式,用于解释和分析现有的基于非局部的模块(例如,非局部模块,非函数阶段,双重注意力模块)。此外,通过考虑谱的特性,研究者提出了一种高效且稳健的谱非局部模块,与现有的非局部模块相比,当插入深度神经网络时,该模块可以更稳健和灵活地捕获远程依赖关系。实验结果证明了新提出的方法在图像分类、行为识别、语义分割和行人重识别任务上的显著改进和实际适用性。

背景

为何提出非局部?在计算机视觉领域,特别是对于动态视频序列,帧内和帧间的依赖关系非常重要。例如,在下图中视频的行为分类任务中,全局内容的理解以及不同帧间的联系对分类结果有很强的导向作用。目前常见的做法是通过循环卷积网络联系t和t-1,或者通过更深的网络增大感受野来提高对全局内容的理解。

尽管如此,这种方式仍旧是比较局部的,无论是时间方向还是空间位置。甚至,最大的问题是:无法进行远距离信息的来回传递;而且更深的网络计算量大但效率低,梯度优化起来也比较困难。

因此,针对远距离信息传递问题,提高长距离依赖,本论文从传统的非局部均值滤波方法中受到启发,提出了卷积网络中的非局部,即:某一像素点处的响应是其他所有点处的特征权重和,将每一个点与其他所有点相关联,实现非局部思想。

非局部可以被认为是通道级别和空间级别的泛化。这种方式通过注意力加强距离依赖,更直接地实现了全局的联系性。既有注意力的思想也有上下文联系的思想。基于这个非局部,后面相继又有几个网络结构提出来,本质还是做注意力机制,只不过操作不一样,或者是改进版的。例如,CCNet,GCNet。可以看上图。另外,想说一点关于注意力的见解。在像ResNet,AlexNet等通用网络结构中,我们可以理解为空间或者通道间的所有位置,其重要性均等,即权重都为1。而注意力机制的根本目的,就是对原本平均分配的权重通过手动或者自学习的方式进行非等份分配。

所以,从这个角度看,挂在嘴边的先验知识或是上下文关系(局部,全局,上下文)都可以理解为对原本等价权重的非等份分配。在诸如SENet,CBAM中,通过网络训练的方式得到权重;而人为先验,是不是就是手动的权重分配,针对我们觉得重要的部分进行高权重赋值然后操作?

——引自《知乎:起舞的跳跳虫》

新框架

上图,非局部模块的空间 (A) 和光谱 (B) 视图。粉红色点表示特征图中的每个补丁,“Aggregation”表示计算加权平均值作为下面方程的分子。虚线箭头表示“copy”,实线箭头表示“feed forward”。绿色条是节点特征,长度表示它们的强度(最佳颜色视图)。

为了从理论上分析这些基于非局部的模块的属性,研究者提供了一个新的视角来解释它们,将它们视为在全连接图上生成的一组图过滤器。具体地,在选择Chebyshev图滤波器时,可以导出一个统一的公式,用于解释和分析现有的基于非局部的模块(例如,非局部模块,非函数阶段,双重注意力模块)。

此外,通过考虑谱的特性,提出了一种高效且稳健的谱非局部模块,与现有的非局部模块相比,当插入深度神经网络时,该模块可以更稳健和灵活地捕获远程依赖关系。

实验

在图像分类任务上的表现:

在行为识别任务上的表现:

在语义分割任务上的表现:


# git  # 循环  # copy  # github  # https  # 提出了  # 组图  # 理论上  # 图中  # 源代码  # 图上  # 几个  # 也有  # 又有  # 我们可以 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: laravel怎么为应用开启和关闭维护模式_laravel应用维护模式开启与关闭方法  edge浏览器无法安装扩展 edge浏览器插件安装失败【解决方法】  悟空识字怎么关闭自动续费_悟空识字取消会员自动扣费步骤  JavaScript如何操作视频_媒体API怎么控制播放  如何在橙子建站中快速调整背景颜色?  Gemini怎么用新功能实时问答_Gemini实时问答使用【步骤】  如何制作新型网站程序文件,新型止水鱼鳞网要拆除吗?  如何在建站之星网店版论坛获取技术支持?  购物网站制作费用多少,开办网上购物网站,需要办理哪些手续?  Laravel如何与Docker(Sail)协同开发?(环境搭建教程)  php json中文编码为null的解决办法  Laravel如何使用Facades(门面)及其工作原理_Laravel门面模式与底层机制  rsync同步时出现rsync: failed to set times on “xxxx”: Operation not permitted  做企业网站制作流程,企业网站制作基本流程有哪些?  Laravel如何发送邮件和通知_Laravel邮件与通知系统发送步骤  nodejs redis 发布订阅机制封装实现方法及实例代码  laravel怎么为API路由添加签名中间件保护_laravel API路由签名中间件保护方法  如何在腾讯云免费申请建站?  js实现点击每个li节点,都弹出其文本值及修改  Win11应用商店下载慢怎么办 Win11更改DNS提速下载【修复】  利用JavaScript实现拖拽改变元素大小  如何获取PHP WAP自助建站系统源码?  Angular 表单中正确绑定输入值以确保提交与验证正常工作  如何实现javascript表单验证_正则表达式有哪些实用技巧  微信小程序 scroll-view组件实现列表页实例代码  佛山网站制作系统,佛山企业变更地址网上办理步骤?  html5如何设置样式_HTML5样式设置方法与CSS应用技巧【教程】  企业在线网站设计制作流程,想建设一个属于自己的企业网站,该如何去做?  如何挑选最适合建站的高性能VPS主机?  jimdo怎样用html5做选项卡_jimdo选项卡html5实现与切换效果【指南】  车管所网站制作流程,交警当场开简易程序处罚决定书,在交警网站查询不到怎么办?  如何用美橙互联一键搭建多站合一网站?  Laravel怎么进行数据库回滚_Laravel Migration数据库版本控制与回滚操作  Laravel如何使用Scope本地作用域_Laravel模型常用查询逻辑封装技巧【手册】  EditPlus中的正则表达式实战(6)  青岛网站建设如何选择本地服务器?  Swift中switch语句区间和元组模式匹配  如何在IIS7中新建站点?详细步骤解析  googleplay官方入口在哪里_Google Play官方商店快速入口指南  HTML5打空格有哪些误区_新手常犯的空格使用错误【技巧】  Windows10怎样连接蓝牙设备_Windows10蓝牙连接步骤【教程】  深入理解Android中的xmlns:tools属性  韩国服务器如何优化跨境访问实现高效连接?  Laravel怎么实现一对多关联查询_Laravel Eloquent模型关系定义与预加载【实战】  如何在万网自助建站平台快速创建网站?  网站制作公司哪里好做,成都网站制作公司哪家做得比较好,更正规?  jQuery 常见小例汇总  Laravel如何使用软删除(Soft Deletes)功能_Eloquent软删除与数据恢复方法  网站视频制作书签怎么做,ie浏览器怎么将网站固定在书签工具栏?  laravel怎么在请求结束后执行任务(Terminable Middleware)_laravel Terminable Middleware请求结束任务执行方法