近日,2022届硕士毕业生雷博(导师金海教授)的论文“A Compilation Tool for Computation Offloading in ReRAM-based CIM Architectures”被ACM Transactions on Architecture and Code Optimization (TACO) 期刊录用。
近年来,基于电阻式随机存储器(Resistive Random-Access Memory,ReRAM)的存算一体(Computing-In-Memory,CIM)加速器架构得到了广泛研究。但是,传统AI应用程序并不能直接运行在这种异构计算架构下。因此,论文提出了一套编译器工具RCCT来自动识别并转换传统处理器上执行程序的可加速计算,并卸载到CIM加速器执行,开展了以下研究工作以实现RCCT。首先,根据CIM加速器广泛的应用场景,分析并抽象得到它能加速的基本计算范式为矩阵向量乘法、矩阵-矩阵乘法以及位图布尔逻辑操作。第二,RCCT根据这些范式识别LLVM(Low Level Virtual Machine)中间表示(Intermediate Representation,IR)中是否存在与之匹配的代码片段,并进一步根据自定义的计算卸载的调度模型检查对应的计算任务的规模是否可以被加速。第三,RCCT根据范式类型和CIM提供的接口自动将原IR代码转换成可以在这种异构架构下执行的目标IR代码,实现遗留程序的计算卸载及加速,而无需修改源代码,降低了程序移植开销。由于LLVM IR可以从源码或二进制可执行文件得到,所以RCCT能同时支持有源码和没有源码的应用。实验结果表明,RCCT可以有效地将许多传统的遗留程序自动转换成能被CIM执行的二进制可执行文件,对源码生成的可加速IR范式的识别正确率超过95%。与通用的X86处理器相比,典型应用的性能和能效分别提高达51倍和309倍。
ACM Transactions on Architecture and Code Optimization (TACO) 属于中国计算机学会CCF A类期刊,是计算机系统结构和编译领域最权威的国际学术期刊之一,每季度出版一期,每期录用论文20篇左右,主要关注计算机系统结构和代码优化方面的硬件、软件和系统研究等方面的研究。按照惯例,被ACM TACO录用的文章也会被邀请在次年1月份召开的HiPEAC国际会议宣讲论文。
(通讯员:刘海坤)