LOGO LOGO
博士生董雨康的论文被计算机系统结构和编译领域权威期刊TACO录用
时间:2026-05-08 10:46:19

近日,2024级博士生董雨康(导师蒋文斌教授)的论文“BlockSmith: Ultra-dense Block Transformation for Efficient Sparse Matrix Multiplication Using Tensor Cores”ACM Transactions on Architecture and Code OptimizationTACO期刊录用。

稀疏密集矩阵乘法(Sparse-dense Matrix Multiplication, SpMM)是众多领域中的核心算子。近年来,研究者尝试通过行重排序等预处理方法提升GPU张量核心上的SpMM性能。然而,现有重排序方法通常未能充分适配张量核心的块状执行特性,因而难以形成高质量的稠密计算块,限制了整体加速效果。针对这一挑战,论文提出BlockSmith框架,围绕将稀疏矩阵锻造成高密度计算块这一核心思想,构建了一套面向张量核心的端到端SpMM优化方案。首先,论文发现在稀疏矩阵行重排序过程中,相似度计算宽度会同时影响重排序效果与预处理效率,并非宽度越小越优。基于这一观察,论文提出Ultra-dense Block TransformationUBT预处理方法,通过自适应相似度宽度计算和GPU加速的迭代聚类,在提升数据局部性和分块密度的同时显著降低预处理开销。实验结果表明,BlockSmith383SuiteSparse稀疏矩阵上,相较当前先进方法取得了平均4.35×、最高超过100×的加速效果,展现出优异的整体性能。

ACM Transactions on Architecture and Code OptimizationTACO)是计算机系统结构和编译领域最权威的国际学术期刊之一,也是中国计算机学会CCF A类期刊。


(通讯员:董雨康)