LOGO LOGO
博士生牛富平的论文被计算机体系结构顶会HPCA 2024录用
时间:2023-10-24 14:50:34

近日,2018级博士生牛富平(导师廖小飞教授)的论文“FlashGNN: An In-SSD Accelerator for GNN Training”被计算机体系结构顶会The 30th International Symposium on High-Performance Computer Architecture (HPCA 2024)录用。

论文探讨了传统的以CPUGPUASIC(供专门应用集成电路)为中心的GNN训练框架所面临的系统扩展性差、无法应用于大规模数据集以及计算部件利用率低下的问题。根据对实验结果的分析,上述系统由于内存与缓冲区容量有限,故需要通过缓慢的PCIe总线来频繁地进行数据交换,这个过程开销极大,以至于系统将大部分运行时间都花费在了数据准备阶段上。为解决该问题,论文提出了一种基于SSD内近数据处理的图神经网络(Graph Neural NetworkGNN)训练框架FlashGNNFlashGNN采用了一种高效的闪存块请求调度算法,其在每个迷你批(Mini Batch)的消息传播阶段开始前完成对采样子图内所有数据依赖关系的整理和分析,并根据各个结点对应的特征向量在闪存上的分布情况来决定闪存块的读取顺序,从而显著提高访存效率。为及时处理来自闪存的数据而不使计算部件陷入长时间的闲置,FlashGNN提出了新颖的基于结点的GNN训练模式,当结点的依赖数据可用时,就会立即触发相应的计算,从而消除了基于层的训练所引入的同步开销。此外,FlashGNN在闪存芯片上部署了数据过滤器,以避免在速度较慢的闪存通道总线上进行不必要的数据传输。为提高子图生成的效率,FlashGNN设计了一种数据驱动的子图生成算法,其重用内存中的图拓扑数据以提前构建未来的迷你批所需的子图,因而减少了对闪存的访问次数。实验表明,与最先进的以GPU为中心的GNN训练系统Ginex相比,FlashGNN实现了4.6012.20倍的加速,同时降低了40.36209.52倍的能耗。

HPCA是计算机体系结构领域的顶级会议,也是中国计算机学会(CCF)推荐的A类会议,H5指数53。该会议一直被认为是计算机体系结构领域难度最大、理论水平最高的会议之一,在全球范围内享有盛誉。此次HPCA 2024会议投稿量410篇,录用率约为18.3%


(通讯员:牛富平)