LOGO LOGO
硕士生谷昌伟的论文被数据挖掘与人工智能领域顶会KDD2026录用
时间:2026-05-20 10:50:35

近日,实验室硕士生谷昌伟(导师金海教授)的论文“Structure Is All You Need to Reuse: Accelerating GraphRAG via Meta-Structure-Aware KV Caching”数据挖掘与人工智能领域顶级国际学术会议 (ACM SIGKDD Conference on Knowledge Discovery and Data MiningKDD 2026) 录用。

随着大语言模型的广泛应用,基于知识图谱的检索增强生成(GraphRAG)系统通过引入结构化证据,显著增强了模型的多跳推理能力。然而,现有的 GraphRAG 系统通常将检索到的子图线性化为冗长的文本提示,迫使 LLM 在面对不同查询时重复计算相同的模式级(Schema-level)推理逻辑。由于生成的文本对实体表述极其敏感,这种以文本为中心的设计面临严重的复用悖论,不仅导致缓存复用率极低,还引发了高昂的预填充延迟与大规模的内存开销。为应对这一挑战,文章提出了一种首创的结构感知 KV 缓存框架 MetaKV。该方法从根本上摒弃了将逻辑与特征实体强绑定的计算方式,将静态的结构逻辑与动态的实体语义解耦。在准备阶段,MetaKV 挖掘知识图谱中的高频元结构,并计算其 KV 缓存作为可复用的骨架 KV”。在在线推理时,系统只需将查询特定的实体特征注入预留的结构槽中,从而直接跳过对图拓扑结构的冗余注意力计算。同时,该工作还创新性地引入了拓扑掩码,将模型的注意力域严格限制在有效的图边上,从而有效控制了幻觉的产生并保证了对图结构的忠实度。实验基于 HotpotQA MetaQA 等大规模数据集验证了该方法的有效性。结果表明,MetaKV 在保持了极具竞争力的推理准确率的同时,实现了高达 6.4 倍的预填充加速和 73% 的有效缓存命中率,为实现高吞吐量、低延迟的 GraphRAG 推理提供了一种全新的高效解决方案。

ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD) 是数据挖掘、知识发现及人工智能领域的权威顶尖国际学术会议,也是中国计算机学会(CCF)推荐的 A 类国际会议。该会议汇聚了全球领域内的顶尖学者与工业界专家,主要关注大数据分析、数据科学、机器学习等前沿技术的研究与创新应用。

(通讯员:谷昌伟)