桂创意,实验室2017级博士生,师从廖小飞教授,进行图分析系统研究。近日,桂创意的论文被 USENIX年度技术会议(USENIX Annual Technical Conference,ATC 2023)录用,论文题目为“Cyclosa: Redundancy-Free Graph Pattern Mining via Set Dataflow”。
近年来,图算法在各行各业中得到了广泛的应用,面向图结构分析的大规模通用图挖掘系统的研究成为当前的学界和业界热点。以图模式为中心的系统通常将一个通用的图挖掘问题描述为连续的一系列集合计算问题。现有系统提供了多样化的方法来优化搜索空间以减少任务量,然而由重复出现的集合计算所导致的内在冗余极大影响了性能。该论文探索了通用图挖掘系统的冗余计算消除方法。论文首先提出了计算相似性概念,能够有效识别运行过程中来自相同或者不同子图实例上的显式冗余和隐式冗余计算;接着提出了一种基于集合数据流的执行模式,实现以集合为中心的细粒度并行和数据重用;进一步利用图挖掘中的计算幂律性设计了计算结果缓存,最大化计算重用效率。实验对标前沿图挖掘系统GraphPi,可取得最高16.28倍性能提升。
ATC是系统结构领域最重要的国际会议之一,也是中国计算机学会(CCF)推荐的A类会议。本届会议共收到353篇投稿,共录用65篇论文,录用率约为18.41%。
(通讯员:桂创意)