近日,实验室胡胜山副研究员指导的硕士生周子淇和赵睿智的论文“Downstream-agnostic Adversarial Examples”被第19届计算机视觉国际大会(IEEE/CVF International Conference on Computer Vision, ICCV 2023)录用。
自监督学习的兴起使得大量无标签数据可以用于预训练通用编码器,这些编码器通过轻量级微调即可适用于各类下游任务,为资源受限的用户提供了便利。尽管许多公司已经公布了这些预训练编码器用于商用,但它们的安全性仍未得到充分研究。对此,论文提出了AdvEncoder——第一个针对预训练编码器生成下游无关通用对抗样本的攻击框架。论文在14种自监督训练方法、4个图像数据集、多种模型结构上进行了实验,在分类、检索、图像分割、目标检测等多个下游任务上验证了攻击的有效性和强迁移能力。同时,该论文与其他6种最先进的针对传统模型设计的攻击算法进行了比较实验。实验结果显示,AdvEncoder的攻击成功率最高可达90.70%,比现有方法高出40%以上。该论文填补了预训练编码器对抗样本研究的空白,揭示了预训练模型应用中存在的严重安全隐患,对未来预训练模型安全性研究提出了新的要求。
ICCV每两年举办一届,是计算机视觉和人工智能研究领域的顶级会议,与CVPR、ECCV并列为世界三大计算机视觉会议,也是中国计算机学会(CCF)推荐的A类会议,在计算机视觉领域拥有极高声誉。近年来,该会议的录取率约为25%。
(通讯员:赵睿智)