LOGO LOGO
实验室4篇论文被分布式领域国际会议IPDPS 2023录用
时间:2023-02-16 14:34:48

近日,第37届并行分布式处理国际研讨会(IEEE International Parallel & Distributed Processing Symposium,IPDPS 2023)录用结果揭晓,实验室4位博士生黄卓(导师吴松教授)、吴浩(导师吴松教授)、卢浩迪(导师刘海坤教授)、何海恒(导师郑龙副教授)的4篇论文均被录用。

黄卓的论文题目为“Duo: Improving Data Sharing of Stateful Serverless Applications by Efficiently Caching Multi-read Data”。当前服务器无感知计算架构中,计算与存储会充分解耦,不同执行单元之间都通过第三方存储进行数据交换。这种架构有助于提升应用的弹性和系统的资源利用率。但是对于数据交互频繁的有状态服务器无感知应用来说,数据访问的延迟极高,严重影响了应用的执行效率。现有的存储系统通常利用小块内存作为缓存,采用传统替换算法,来加速数据的访问。由于服务器无感知计算作为一种新型的应用架构,使得应用访问数据的模式与传统架构的数据访问存在较大差别,导致缓存命中率不高,缓存加速提升不明显。针对这一问题,黄卓提出了一种基于访问间隔的数据缓存加速方法。该方法通过快速缓存多次读的数据,优先驱逐缓存中的冷数据,预取关联数据等三个策略来提升缓存的有效性。实验结果表明,与传统缓存策略相比,基于访问间隔的数据缓存加速方法使得缓存的命中率提升了2.1倍,在高并发情况下函数启动数据的读取延迟减少了62%。

吴浩的论文题目为“QoS-Aware and Cost-Efficient Dynamic Resource Allocation for Serverless ML Workflows”。服务器无感计算具有弹性扩展和细粒度收费等优点,可以大大简化复杂任务的部署,因此服务器无感计算模式的机器学习任务流成为趋势。在服务器无感计算中高效且低成本的运行任务需要为执行单元(function)选择合适的资源配置。然而,现有资源分配的方法是静态的,且依赖于离线预测,不适用于资源需求动态变化的机器学习任务流。针对这一问题,吴浩提出了一种动态资源配置方法CE-scaling,指导服务器无感计算模式下机器学习任务流的高效资源分配。对于超参数调整,CE-scaling根据各个阶段(stage)的资源需求和计算效率重新划分整体资源,从而最大限度地减少资源浪费。此外,CE-scaling还基于在线预测的方法,在模型训练的运行过程中动态调整资源分配。同时在AWS Lambda上实现了CE-scaling,且使用不同的机器学习模型进行测试。实验结果表明,与最先进的静态资源分配方法相比,超参数调整的任务完成时间(JCT)和成本分别减少63%和41%;模型训练的任务完成时间和成本分别减少58%和38%。

卢浩迪的论文题目为“Software-Defined, Fast and Strongly-Consistent Data Replication for RDMA-based PM Datastores”。现代存储系统通常在多个服务器上保存多个数据副本以提供高可靠性、可用性和高性能。然而,现有分布式存储系统的副本复制协议往往不能同时提供低延迟、高吞吐、强一致性的多副本同步机制。为此,卢浩迪在论文中提出了一种基于远程直接内存访问技术(RDMA)的内存数据复制系统Whale。通过将元数据多播过程与备份节点的数据复制过程解耦,并使用乐观提交机制来提前响应客户端访问,从而提供了低延迟的强一致性数据访问。此外,Whale还基于RDMA技术优化了链式复制协议,将数据从主节点异步传播到备份节点,实现了高吞吐量复制。为了进一步降低数据复制的开销,Whale采用一种日志结构的数据存储模式以充分利用单边RDMA传输原语和持久内存的硬件优势。实验结果表明,与当前最新的复制协议相比,Whale展现了更高的数据复制吞吐量和更低的访问延时。

何海恒的论文题目为“GraphMetaP: Efficient MetaPath Generation for Dynamic Heterogeneous Graph Models”。近年来,基于元路径的异质图模型(Metapath-based Heterogeneous Graph Model,MHGM)在学习异质图的语义和结构信息方面表现出色。元路径匹配是MHGM中寻找所有元路径实例的重要处理步骤,与总的模型执行时间相比,带来了难以忍受的开销(高达96%)。更糟糕的是,在动态异构图中,元路径实例需要在图更新时重新匹配。为此,何海恒提出了一种有效的增量元路径维护方法(GraphMetaP),以消除动态异质图中的匹配开销。GraphMetaP为元路径实例引入了一种新的格式来捕捉元路径实例之间的依赖关系,它根据图的更新来增量维护元路径实例,从而避免了在更新图上的重新匹配元路径开销。此外,GraphMetaP使用折叠方式来简化格式,以便更快地恢复所有元路径实例。实验表明,GraphMetaP能够有效地维护动态异构图上的元路径实例,与匹配元路径的方法相比,平均性能提高了172.4倍。

IPDPS是展示和讨论并行计算领域最新和重要研究成果的国际会议,也是中国计算机学会(CCF)推荐的B类会议。本会议近五年的论文录用率约为25%。


(通讯员:黄卓、吴浩、卢浩迪、何海恒)