实验室简介

陈斌副教授课题组研一硕士生钟新皓、大三本科生连牛论文获CVPR 2025录用

发表时间:2025-03-19 16:21:50 来源: 作者: 浏览:

【文章导读】近日,陈斌副教授课题组的研一硕士生钟新皓、大三本科生连牛分别以第一作者身份完成的2篇论文被计算机视觉领域的顶级会议——2025年计算机视觉与模式识别大会(CVPR-25)录用。CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)是计算机视觉领域的国际顶级会议,位列中国计算机学会CCF-A类推荐榜单。今年共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%,为近些年最低。指导教...


近日,陈斌副教授课题组的研一硕士生钟新皓、大三本科生连牛分别以第一作者身份完成的2篇论文被计算机视觉领域的顶级会议——2025年计算机视觉与模式识别大会(CVPR-25)录用。CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)是计算机视觉领域的国际顶级会议,位列中国计算机学会CCF-A类推荐榜单。今年共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%,为近些年最低。指导教师陈斌副教授为通讯作者,哈尔滨工业大学(深圳)为第一单位。


论文题目:Hierarchical Features Matter: A Deep Exploration of Progressive Parameterization Method for Dataset Distillation

论文作者:钟新皓,方豪,陈斌(通讯作者),辜旭林,邱美康,漆舒汉,夏树涛

作者单位:哈尔滨工业大学(深圳),清华大学国际研究生院,奥古斯塔大学

论文简介:已有的参数化数据集蒸馏方法通过将优化空间从像素域转移到额外的函数隐空间(如生成对抗网络(GAN)的特征空间),通过改变优化对象实现了有效的性能提升。然而这类方法需要人工地确定合适的特征空间作为优化空间,在面对不同方法乃至不同数据集时最优解空间往往是动态变化的,这极大地提升了实际部署的难度。在已有的基于GAN的参数化数据集蒸馏方法基础上,我们提出一种层级遍历所有特征空间的优化方式H-PD,消除了预实验的要求并进一步提升了性能。具体来说我们从GAN的最初层对应的隐空间内开始优化,在当前层内优化极少量轮次后抛弃该层及之前层,将优化后的隐编码送入下一层内重复上述操作,直到到达像素域完成优化。与已有方法的对比如图1所示,通过这种逐级优化的贪心策略,我们实现了计算效率以及性能的同步提升。


图1 H-PD方法流程图


表1:H-PD的实验效果


第一作者简介钟新皓,哈尔滨工业大学(深圳)2024级硕士研究生。在本科期间加入陈斌老师课题组学习并打下了扎实的科研基础,致力于研究以数据为中心的高效AI算法。目前以第一作者身份发表的论文已被ICLR(2025)以及CVPR(2025)录用。


论文题目:AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing

论文作者:连牛(大三本科生),黎俊(大三本科生),王锦鹏(通讯作者),罗瑞生,王耀威,夏树涛,陈斌(通讯作者)

作者单位:哈尔滨工业大学(深圳),清华大学深圳国际研究生院

论文简介:AutoSSVH论文研究了自监督视频哈希领域中帧自动化采样的关键问题。传统的自监督视频哈希方法往往忽视了视频中每一帧的信息密度和重构难度,将所有帧视为相同,这导致了生成的哈希码在语义信息上存在不足,影响了检索性能。为了解决这一问题,论文提出了一种基于对抗策略的轻量化采样器,采用了梯度翻转层(GRL)和Gumbel-Softmax方法,以可微的方式采样出那些重构难度较大的帧进行重构,从而有效增强了模型的鲁棒性。同时,鉴于对抗策略训练效率较低,AutoSSVH设计了一种集成学习的哈希投票算法,显著加速了模型的收敛过程,并提高了哈希码的邻域信息,使得哈希码的生成更加高效与快速(图2)。该方法不仅提升了自监督视频哈希的效果,也为未来视频领域中的帧采样问题提供了新的解决思路。


图2:AutoSSVH的流程总览图


第一作者简介:连牛,大三本科在读。大二上学期结束加入了陈斌老师课题组进行科研实习,目前已发表多篇顶会,包含AAAI-25的共一第二、CVPR-25一作等。

(审核:王轩)