LOGO LOGO
实验室博士生吴月明的论文被顶级国际会议ASE 2020录用
时间:2020-08-14 08:24:40

近日,第35届IEEE/ACM自动化软件工程国际研讨会(The 35th IEEE/ACM International Conference on Automated Software Engineering,ASE 2020)录用结果揭晓,实验室博士生吴月明的论文 “SCDetector: Software Functional Clone Detection Based on Semantic Tokens Analysis”被录用。


现有的克隆代码检测工作中基于token的方法效率最高,可以在以亿为单位的代码量上进行扫描检测。然而,由于这些方法没有考虑程序的语义信息,导致其精确度并不理想,不能检测语义克隆。为了检测语义克隆,研究者将程序语义用图进行刻画,并利用图匹配来检测语义克隆。但是,图匹配本身是个高开销的工作,使得这些基于图的方法可扩展性很低。


因此,我们提出了一个基于语义token分析的系统,将基于token方法的高效率和基于图方法的高精度进行结合,实现高效率、高精度的语义克隆代码检测。我们首先通过静态分析提取函数代码的控制流程图(CFG),然后对CFG进行中心性分析,并将所有基本块的度中心性分配给基本块中的每一个token。最后,同一个token的所有度中心性会相加得到对应token的权重,我们将这些带有权重信息的token称为“语义token”。这些语义token会被送入Siamese-GRU网络中进行训练,得到一个语义克隆检测器。实验表明,该系统在检测语义克隆代码时可以达到97%的精确度,而所耗时间却比传统基于图的方法快了14倍。


ASE是软件工程领域的顶级国际会议,本届会议共收到414篇投稿,录用93篇,录用率约为22.5%。


(通讯员:吴月明)