LOGO LOGO
博士生陈聃的论文被计算机体系结构领域顶刊TC录用
时间:2023-03-13 09:43:58

近日,实验室博士生陈聃(导师金海教授)的论文“Accelerating Graph Convolutional Networks Through A PIM-Accelerated Approach”被 IEEE Transactions on Computers 录用。

图卷积神经网络 (Graph Convolutional Networks,GCNs) 是一类基于深度学习处理图结构数据的模型。 GCNs推理主要分为两个阶段。第一个是聚合阶段,依赖于不规则的图结构聚合邻居顶点特征。第二个是组合阶段,通过一个全连接网络更新所有顶点特征。GCNs因其顶点高并行性,通常用GPU进行加速。然而,GCNs聚合阶段中涉及的不规则内存访问,以及组合阶段中顶点特征稀疏导致GPU效率低下。聚合阶段因为访问大量不规则的邻居顶点特征,总是受限于内存瓶颈。组合阶段有着不确定的性能瓶颈,顶点特征稠密时,受限于计算瓶颈,可以高效的被GPU执行;当顶点特征稀疏时,受限于内存瓶颈。

为此陈聃在论文中基于存内计算 (Processing in Memory,PIM) 提出GPU-PIM架构来加速GCNs。计算瓶颈的组合阶段由GPU执行,而聚合阶段和内存瓶颈的组合阶段卸载到PIM端加速。为使这种GPU-PIM架构效率最大化,论文提出了一种新的针对GCNs的图划分方法来减少PIM端的通信开销,以及一种性能瓶颈估算机制用来准确预测组合阶段的性能瓶颈。实验结果表明,相比于NVIDIA Tesla V100 GPU,论文提出的GPU-PIM架构获得了96.01x的加速比。

IEEE Transactions on Computers是计算机体系结构领域的顶级期刊之一,属于中国计算机学会CCF A类期刊,2022年影响因子为3.183。


(通讯员:陈聃)