LOGO LOGO
博士生叶君尧、杜小虎的论文分别被软件工程领域顶会FSE 2025录用
时间:2025-04-03 09:14:11

近日,33届国际软件工程基础会议(The 33rd ACM International Conference on the Foundations of Software EngineeringFSE 2025录用结果揭晓,2022级博士生叶君尧(导师邹德清教授)和2021级博士生杜小虎(导师文明副教授)的论文作为长文均被录用。

叶君尧的论文题目为"A Causal Learning Framework for Enhancing Robustness of Source Code Models"。该研究针对深度学习模型在软件工程任务中面临的鲁棒性挑战提出了创新解决方案。近年来,深度学习模型虽在多个软件工程任务中取得显著进展,但在对抗性攻击面前表现脆弱,准确率可能从90%以上骤降至10%甚至更低,主要因为它们学习了与模型预测存在虚假相关的特征,而非真正的因果关系。论文提出的CausalCode框架通过两种关键技术增强模型鲁棒性:利用因果数据增强生成干预样本打破虚假相关性,并通过正则化策略学习不变表示,减少虚假特征影响同时放大因果特征重要性。实验表明,CausalCode在针对代码缺陷检测、功能分类、代码翻译和代码修复四种任务显著提升了模型鲁棒性。与现有方法相比,CausalCode在提高准确率的同时大幅降低攻击成功率,如在代码缺陷检测任务中,面对标识符重命名攻击,在提高准确率0.20%的同时将攻击成功率降低46.77%;面对死代码插入攻击,准确率提高2.82%,攻击成功率降低29.92%

杜小虎的论文题目为“Statement-level Adversarial Attack on Vulnerability Detection Models via Out-Of-Distribution Features”。该研究提出了一种针对代码漏洞检测模型的高效对抗攻击方法SLODA。现有的对抗攻击方法存在扰动范围受限和缺乏对抗特异性等问题,导致攻击效率低下且容易被检测。SLODA创新性地引入了两种分布外特征作为对抗扰动。这种设计的目的是通过这种对抗扰动诱导样本在特征空间中发生分布偏移,从而跨越模型的决策边界。这两种分布外特征分别是基于代码逆优化生成的通用分布外特征和从模型历史中错误分类样本中提取的标签特异性分布外特征。它们使得对抗扰动具有更好的对抗特异性,从而在指导对抗样本的生成过程中可以更好地偏离原来的数据分布。实验表明,SLODA15个模型上超越了5种现有最先进的攻击方法,在攻击效果、效率和抗检测性上分别提升了77.21%4.13倍和1.03倍。此外,SLODA生成的对抗样本还可以进一步提升模型鲁棒性,在对抗训练中使模型检测准确率提升37.84%-93.53%

FSE由国际计算机学会(ACM)主办,每年举办一次,是软件工程领域的顶级会议之一,本届会议录用率约为22.24%

(通讯员:叶君尧、杜小虎)