近日,2019级博士生董英帅(导师廖小飞教授)的论文“DTAP: Accelerating Strongly-Typed Programs with Data Type-Aware Hardware Prefetching”被 ACM Transactions on Architecture and Code Optimization (TACO) 期刊录用。
在当前计算环境下,链式数据结构如树和图等,尽管在键值存储、在线数据分析和机器学习等领域应用广泛,却因其依赖的指针追逐内存访问模式而饱受缓存错误与性能损失的困扰。这种随机内存访问模式导致数据局部性差,增加了缓存缺失的频率,从而显著降低了程序性能。针对这一问题,论文创新性地提出了一个软件与硬件协同设计的解决方案——DTAP,旨在优化以强类型语言实现的链式数据结构的处理效率。DTAP方案的核心在于其独特的编译器扩展与硬件预取器组合。编译器扩展智能地从代码中提取类型信息,为每一个加载指令附加类型注解,并将这些信息传递给硬件预取器。预取器则利用这些类型信息来精准识别并预取相关联的对象及其指针,确保在程序实际访问这些对象时,它们已被缓存在高速缓存中,从而显著减少缓存缺失的发生。相比传统的硬件预取技术,DTAP能够更有效地识别并应对指针追逐的语义,避免误判与低效预取,为链接数据结构提供了更为精准和高效的预取支持。实验结果显示,在多个内存密集型应用程序评估中,包括Olden基准、SPEC CPU2006、C++ STL库及Hash Join等,平均优于各类代表性预取器5.9%至25.5%。
ACM Transactions on Architecture and Code Optimization (TACO) 是计算机系统结构和编译领域最权威的国际学术期刊之一,也是中国计算机学会CCF A类期刊。每季度出版一期,每期录用论文20篇左右,主要关注计算机系统结构和代码优化方面的硬件、软件和系统研究等方面的研究。
(通讯员:董英帅)