LOGO LOGO
博士生陈聃、刘海峰的论文分别被计算机体系结构领域顶会ISCA 2023录用
时间:2023-03-20 09:36:14

近日,第50届计算机体系结构国际研讨会(The ACM/IEEE 50thAnnual International Symposium on Computer Architecture,ISCA 2023)录用结果揭晓,实验室博士生陈聃(导师金海教授)和博士生刘海峰(导师郑龙副教授、廖小飞教授)的论文分别被ISCA 2023录用,陈聃的论文题目为“MetaNMP: Leveraging Cartesian-Like Product to Accelerate HGNNs with Near-Memory Processing”,刘海峰的论文题目为“Accelerating Personalized Recommendation with Cross-level Near-Memory Processing”。

基于元路径的异质图学习对异质图中丰富的结构和语义信息有着强大的捕捉能力。然而异质图学习由于存储预处理生成的大量元路径实例,引起了巨大的内存开销,从而限制了异质图学习在大图上的应用;元路径实例之间的特征聚合也存在着严重的冗余计算。此外,异质图学习中的计算主要受限于内存瓶颈。为此,陈聃在论文中提出了首个针对异质图学习的近内存计算加速器MetaNMP。论文首先提出了类似笛卡尔积的计算范式,在运行时快速生成元路径实例以避免存储开销,同时感知元路径实例之间的关联来消除冗余计算。论文又针对这种计算范式基于近内存计算设计了加速器来克服内存瓶颈。实验结果表明,该工作减少了约51.9%的内存空间开销, 同时相比于Nvidia V100 GPU,该工作获得了高达415.18x的性能提升。

近些年来,推荐系统在各行各业中发挥着越来越重要的作用。其中推荐系统的嵌入层(Embedding Layer)由于庞大的数据量和不规则的访问模式,成为整个推荐系统的性能瓶颈。现有的近内存计算加速嵌入层方案往往只考虑在内存中添加更多的计算单元PE(Processing Elements)以取得更高的内存并行性,从而实现性能提升。然而,由于推荐系统的嵌入层数据展现出独特的数据局部性和访问模式,使得更高的内存并行性难以有效转换成性能提升。为此,刘海峰在论文中首次将推荐系统数据特性与内存架构特性相结合,提出了跨层级的嵌入层近内存计算加速方案,针对不同类型的数据,采用不同的内存并行级别,有效克服推荐系统嵌入层的内存瓶颈并实现更好的负载均衡。试验结果表明,相比于当前最优的方案,该工作可以提升1.8倍性能的同时降低4倍额外的硬件开销,显著提升资源利用率。

ISCA是计算机体系结构领域的顶级国际会议,也是中国计算机学会CCF A类会议。本届会议共收到372篇投稿,共录用79篇论文,录用率约为21.2%。


(通讯员:陈聃、刘海峰)