近日,第20届欧洲计算机系统会议 (The 20th European Conference on Computer Systems, EuroSys 2025) 秋季投稿周期录用结果揭晓,实验室何强教授以及2021级博士生齐豪(导师金海教授)、2020级博士生何海恒(导师郑龙教授)共计三篇论文均被录用。
何强的论文题目为“Hourglass: Enabling Efficient Split Federated Learning with Data Parallelism”。联邦学习(Federated Learning,FL)是一种能够保护数据隐私的模型训练方案。在训练大规模模型时,现有的FL方法面临客户端计算负担过重的问题。最近的研究尝试将分割学习(Split Learning)引入到联邦学习,提出了分割联邦学习(Split Federated Learning)。分割联邦学习将机器学习模型划分为两部分:在客户设备上训练的客户端模型块和在云端服务器或边缘服务器上训练的服务器端模型块。在现有的分割联邦学习系统中,每个客户的服务器端模型块需要使用一块 GPU 进行独立训练。这种训练方式对 GPU资源的需求极高,难以在实际场景中应用和推广。为此,文章提出了一种新型的分割联邦学习系统——Hourglass。Hourglass 通过在服务器端维护由客户端共享的服务器端模型块,并依据特征差异性对客户端模型块上传的中间特征进行分组,接着利用 GPUs 并行处理不同分组的中间特征,从而高效地训练服务器端模型块。该方法不仅避免了频繁交换模型块带来的计算开销,还能加速客户端之间的知识共享。实验结果表明,相较于最先进的分割联邦学习系统SplitFed,Hourglass 能够将模型收敛速度提升最多35.2倍,同时将模型精确度提高9.28%。
齐豪的论文题目是“OHMiner: An Overlap-centric System for Efficient Hypergraph Pattern Mining”。超图模式挖掘 (Hypergraph Pattern Mining,HPM)已广泛应用于社会科学、生物信息学等多个领域。然而,现有的解决方案采用以顶点为粒度的计算范式,导致大量的枚举开销和冗余计算。为了高效支持HPM,文章首先提出了一个以重叠为中心的执行模型,通过集合计算和比较超边之间的重叠来判定子超图同构。该模型旨在高效地处理共享计算的顶点。为避免冗余集计算并准确自动地检索任意模式的重叠语义,文章进一步提出了一种无冗余编译器,该编译器为模式构建重叠交集图 (Overlap Intersection Graph,OIG),对 OIG 进行优化,并生成以重叠为中心的执行计划来指导 HPM 过程。此外,文章设计了一个度数感知数据存储和以重叠为中心的并行执行引擎,分别用于高效生成候选集和验证候选集。实验结果表明,相比于现有最先进的HPM系统——HGMatch,文章提出的方法可实现最高22.2倍的性能提升。
何海恒的论文题目是“MetaHG: Enhancing HGNN Systems Leveraging Advanced Metapath Graph Abstraction”。近年来,异构图神经网络(Heterogeneous Graph Neural Network,HGNN)在学习异质图的语义和结构信息方面表现出色。传统的HGNN的实现方法经常面临元路径实例过多的挑战,需要高昂的元路径实例匹配的时间开销以及存储实例的空间开销。这些方法通常存在冗余的实例编码和高延迟的语义图构建。为了解决这些问题,文章提出了一个高效的HGNN推理系统MetaHG。它引入了一种高级元路径图(Metapath Graph,MG)抽象,将所有元路径实例的结构信息封装在一个紧凑的表示中。在MG的基础上,文章提出了中心划分的图划分算法来平衡每个批次中的编码工作负载,使用基于层的编码与聚合方法以最大限度地消除冗余计算,并且不需要构建语义图,从而实现了HGNN的快速推理。实验表明MetaHG能够高效的实现HGNN的推理,与传统的HGNN实现方法,即BFS-HGNN与DFS-HGNN相比,MetaHG的平均性能分别提高了42.5和4.53倍。
EuroSys是系统结构领域最重要的国际会议之一,也是中国计算机学会(CCF)推荐的A类会议。本届会议秋季投稿周期共收到381篇投稿,共录用44篇论文,录用率仅为11.5%。
(通讯员:何强、齐豪、何海恒)