近日,赵进博士的论文“An Efficient ReRAM-based Accelerator for Asynchronous Iterative Graph Processing”被 ACM Transactions on Architecture and Code Optimization (TACO) 录用。
图处理作为许多实际应用的焦点,存在计算通信比低和数据局部性差的问题。可变电阻式存储器 (Resistive Random Access Memory,ReRAM) 通过将计算逻辑集成到内存中,具有高内存带宽和高计算并行性的特性,成为了支持高效图处理的关键技术之一。然而,现有的基于ReRAM的图处理方法仍然面临着冗余计算开销大的问题,这是因为许多子图中的顶点为了使用其他子图中的顶点状态更新自己,在ReRAM交叉阵列上进行大量无效且重复的迭代处理,却忽视了子图之间的依赖关系。
为解决此问题,提出了一种依赖感知的异步处理模型。首先,把图划分为强连通分量构成的有向无环图,沿着强连通分量之间的拓扑顺序进行处理,在每个强连通分量内跟踪活跃顶点与其后继顶点之间的依赖关系动态地构造子图;其次,识别具有高值(已经从其邻居积累了许多状态传播,并且能够影响更多其他邻居顶点)的子图进行优先处理,使得顶点状态尽可能地沿着顶点间的依赖关系传播,从而减少冗余计算开销;最后,提出子图感知的混合处理方法以加速内部紧密连接的对角子图的状态传播,进一步加快收敛速度。通过整合上述技术,构建了一个基于ReRAM的依赖感知图处理加速器ASGraph。实验结果表明,与两个基于ReRAM的图处理加速器GraphR和GaaS-X相比,ASGraph分别减少了81.4%~97.3%和52.2%~79.2%的矩阵计算,并获得了25.5倍和4.8倍平均性能加速比。
ACM Transactions on Architecture and Code Optimization (TACO) 属于中国计算机学会CCF A类期刊,是计算机系统结构和编译领域最权威的国际学术期刊之一。每季度出版一期,每期录用论文20篇左右,主要关注计算机系统结构和代码优化方面的硬件、软件和系统研究等方面的研究。
(通讯员:何东皓)