
哈工大(深圳)信息学部/计算机科学与技术学院陈斌教授指导的博士生钟新皓两篇论文《Rectified Decoupled Dataset Distillation: A Closer Look for Fair and Comprehensive Evaluation》和《Closing the Safety Gap: Surgical Concept Erasure in Visual Autoregressive Models》被国际表征学习会议International Conference on Learning Representations (ICLR 2026)录用。成果覆盖数据集高效蒸馏与压缩、可控视觉生成与安全等人工智能热点方向。
国际表征学习会议ICLR是人工智能领域的顶级国际会议,与NeurIPS、ICML并称为机器学习三大顶级会议。ICLR2026将于2026年4月23日至4月27日在巴西里约热内卢举办。本届会议投稿规模再创新高,约为19000篇,经专家严格评审,总录用率约为28.18%。
01
论文信息
论文题目:Rectified Decoupled Dataset Distillation: A Closer Look for Fair and Comprehensive Evaluation
论文作者:钟新皓,孙朔阳,辜旭林,朱晨阳,陈斌(通讯作者),王耀威
作者单位:哈尔滨工业大学(深圳),清华大学深圳国际研究生院,鹏城实验室
论文简介
数据集蒸馏的目标在于生成高度紧凑的合成数据集,使得基于此训练出的模型能够达到与在完整真实数据集上训练相当的性能,同时显著降低存储与计算成本。早期的双层优化方法(例如MTT)已在小规模数据集上展现出巨大潜能,但其可扩展性受限于高昂的计算开销。为解决这一局限性,近期的解耦式数据集蒸馏方法
将教师模型的预训练过程与合成数据生成过程分离。这些方法还在后期评估阶段引入随机数据增强与时序软标签,以提升性能与泛化能力。然而,现有的解耦式蒸馏方法面临评估协议不一致的问题,这阻碍了该领域的进一步发展。本论文提出一个全新的校正解耦式数据集蒸馏评估框架(Rectified Decoupled Dataset Distillation,
),并系统性地探究了不同后期评估设置如何影响测试准确率。本论文进一步考察了现有方法间所报告的性能差异,究竟是体现了真实的方法学进步,还是源于评估流程的不一致性。实验结果表明,大部分性能波动可归因于评估过程的不一致,而非合成数据内在质量的差异。通过建立标准化基准与严谨的评估协议,
为未来数据集蒸馏研究提供了公平且可复现比较的基础框架。

基于
评估框架的解耦式蒸馏方法重评估
02
论文信息
论文题目:Closing the Safety Gap: Surgical Concept Erasure in Visual Autoregressive Models
论文作者:钟新皓(共同一作),周义旻(共同一作),张智祺,李俊豪,孙燚,陈斌(通讯作者),夏树涛,王轩,徐恪
作者单位:哈尔滨工业大学(深圳),吉林大学,清华大学,清华大学深圳国际研究生院,鹏城实验室
论文简介
视觉自回归模型的快速发展为文本到图像生成带来了新的机遇,同时也加剧了安全性方面的隐忧。现有概念擦除技术主要面向扩散模型设计,由于其基于下一尺度标记预测的范式,这些方法难以直接适用于VAR模型。本文首先提出一种新颖的视觉自回归模型擦除框架VARE,该框架通过利用辅助视觉标记降低微调强度,从而在VAR模型中实现稳定的概念擦除。在此基础上,本论文进一步提出S-VARE,这是一种专为VAR模型设计的新型高效概念擦除方法。该方法通过引入经过筛选的交叉熵损失函数,精准识别并最小化调整不安全的视觉标记,同时结合语义保持损失来维护生成内容的保真度,从而有效解决简单微调可能导致的语言漂移和多样性下降等问题。大量实验表明,本论文的方法能够在保持生成质量的同时实现精准的概念擦除,弥补了早期方法在自回归文本到图像生成领域的安全缺陷。

S-VARE总体框架示意图

S-VARE在不同概念擦除任务的实验结果
第一作者简介:
钟新皓,哈尔滨工业大学(深圳)2026级博士研究生(2024级硕士转博),研究方向为多媒体生成与压缩,人工智能安全。指导老师为陈斌教授。本论文受到鹏城国家实验室、广东省安全智能新技术重点实验室和国家自然科学基金面上项目的资助。
通讯作者简介:
陈斌,博士,计算机科学与技术学院教授,博士生导师,哈工大”青年拔尖人才计划”,鹏城国家实验室感知所联培博士生导师,“鹏城孔雀计划”特聘岗位,主要从事信息论与编码理论、多媒体压缩编码、大模型安全与隐私等方向的教学与科研工作。以信息论为理论指导,课题组致力于研究面向人工智能的可靠容错、多媒体内容的高效压缩、大模型的可信推理。构建数据的高效表示与大模型的可靠验证理论。主持国家自然科学基金面上/青年项目,广东省自然科学基金,深圳市基础研究项目,华为技术合作项目10余项。
图文|钟新皓
初审|陈 斌
复审|漆舒汉
终审|王 轩