LOGO LOGO
博士生刘海峰的论文被计算机体系结构领域顶会ISCA 2024录用
时间:2024-03-22 15:04:41

近日,实验室博士生刘海峰(导师郑龙教授、廖小飞教授)的论文“Enabling Efficient Large Recommendation Model Training with Near CXL Memory Processing”被第51届计算机体系结构国际研讨会(The ACM/IEEE 51th Annual International Symposium on Computer Architecture,ISCA 2024)录用。

个性化推荐已成为当今最重要的互联网服务之一。训练和部署推荐系统模型的一个关键挑战是其数据量庞大的嵌入层对内存容量和带宽的极高要求,并且推荐模型的发展和规模扩大速度要远超出现有硬件发展速度。分离式内存技术和CXL(Compute Express Link)等一致性互连技术的出现为内存资源的扩展提供了全新的解决方案。然而研究人员发现,当把推荐系统的嵌入层移入CXL内存中时,受制于有限的CXL传输带宽,训练性能大幅降低。为此,论文首先探讨了CXL内存对内存密集型应用的性能影响,并提出可扩展的高效推荐系统训练解决方案ReCXL。ReCXL采用高效的近内存计算架构,在CXL内存内部完成嵌入层的整个训练过程,以提高内存内部带宽并且降低CXL链路的数据传输量。此外,ReCXL 采用了软硬件协同优化,包括无依赖预取和细粒度数据更新调度等,以最大限度地提高硬件利用率,进一步提升性能。评估结果表明,ReCXL在实现高可扩展性的同时,性能相比原始CXL内存方案高出12.7倍至31.3倍。

ISCA是计算机体系结构领域的顶级国际会议,也是中国计算机学会CCF A类会议。本届会议共收到423篇投稿,直接接收54篇论文,录用率约为12.8%。


(通讯员:刘海峰)