近日,2020级博士生刘超强(导师廖小飞教授)和2023级博士生付宇涛(导师张宇教授)的2篇论文分别被第62届设计自动化国际会议(The 62nd Design Automation Conference,DAC 2025)录用。
刘超强的论文题目为“SeIM: In-Memory Acceleration for Approximate Nearest Neighbor Search”。近似最近邻搜索(Approximate Nearest Neighbor Search,ANNS)在许多应用中至关重要,特别是在大语言模型(Large Language Model,LLM)推动的检索增强生成(Retrieval-augmented Generation,RAG)场景中。然而,深入分析表明,ANNS涉及多样化操作,对内存和计算资源造成了巨大压力,成为系统性能的关键瓶颈。为此,文章提出SeIM,一种层次化的存内计算(Processor-in-Memory,PIM)架构,专为ANNS加速设计。SeIM将高并行、受内存限制的操作卸载至内存bank级别执行,并引入统一的执行模式以复用硬件单元。同时,计算密集且涉及跨单元数据访问的排序操作被放置在内存控制器级别执行,并结合自适应传输过滤技术,减少排序期间无效数据的传输和处理开销。实验结果表明,与当前最先进的CPU、GPU和ASIC方案相比,SeIM在吞吐量上分别提升268倍、22倍和5倍,延迟降低306倍、59倍和4倍,能效提升3081倍、287倍和2倍。
付宇涛的论文题目为“PairGraph: An Efficient Search-space-aware Accelerator for High-performance Concurrent Pairwise Queries”。近些年来,点对点查询作为一种高效的图查询算法被广泛的关注和研究。它们在导航系统、推荐系统以及社交网络分析等关注两实体间关系的领域被被广泛的应用。然而,目前提出的方法只关注提高单个查询的执行效率,并不能高效处理并发查询中存在的数据重叠,这导致了当前软硬件解决方案中的不规则内存访问与碎片化数据共享,严重影响了其性能和能效。因此,文章提出了基于搜索空间感知的并发点对点查询加速器——PairGraph。PairGraph首先通过感知点对点查询的搜索空间以识别在并发查询时值得共享的图区域,之后通过数据驱动的执行方式以充分共享这些区域中的图结构数据,从而实现重叠数据的空间局部性和时间局部性。实验表明,相较于目前最前沿的三种图加速器(LCCG,ScalaGraph和ReGraph),PairGraph分别获得了1.67∼2.72倍、1.93∼4.26倍和2.66∼4.28倍的加速。
DAC是设计自动化领域的顶级国际会议,是中国计算机学会(CCF)推荐的A类会议。该会议近五年的录用率约为23%。
(通讯员:刘超强、付宇涛)