2024年5月30日,新加坡国立大学计算机学院副院长何丙胜教授和上海交通大学孙世轩副教授应邀在东五楼210学术报告厅分别作了题为“Rethinking Benchmarks for Machine Learning Systems”和“面向新兴计算架构的高效图数据处理”的学术报告。
何丙胜教授指出新的机器学习应用的出现为重新思考和重新设计基准测试方法提供了独特的机会。这涉及重新评估如何衡量机器学习系统性能,并为这些系统抽象出各种设计因素。接着介绍了在开发针对不同机器学习应用的基准测试方面的努力。首先,根据联邦学习中Non-IID数据分布的不同设计原理构建了一个基准测试。这个基准测试 NIID-Bench专门用于评估模型准确性和联邦学习系统的其他关键方面。其次,开发了一个专注于在线应用程序实时特征提取的基准测试 FEBench (https://github.com/decis-bench/febench)。基准测试研究产生了许多有趣的结果和见解,特别是在机器学习系统的基准测试方面。最后,何教授重点介绍在为未来机器学习系统创建基准测试时面临的一些挑战。
孙世轩副教授指出作为有效建模和分析实体间关联关系的方式,图被广泛用于社交网络、在线支付、互联网等实际应用中。然而,图数据的海量性、稀疏性和异构性,以及图计算负载的多重动态性,为大规模图计算的性能和硬件资源的有效利用带来巨大挑战。为了应对上述挑战,他们着重研究面向新兴计算架构的图数据处理,基于图数据和计算负载特性,挖掘新兴计算架构的优势,提升系统的高效性。孙副教授介绍了他们在基于Serverless架构和GPU加速的图数据处理方面的进展。
报告结束后,现场师生就报告中所涉及的基准测试集的实用性、准确性、合理性等问题进行了提问,也对数据处理时如何划分,以及划分的粒度和集群的容量等问题进行了提问。何丙胜教授、孙世轩副教授就相关问题进行了耐心细致的回答,解决了大家的疑惑,现场气氛十分活跃。经过热烈的讨论和交流,参与的师生都收获颇丰,报告在掌声中圆满结束。
何丙胜,现任新加坡国立大学计算机学院教授兼副院长。何教授本科毕业于上海交通大学,博士毕业于香港科技大学,随后在微软亚洲研究院担任研究员,新加坡南洋理工大学任教。目前的研究方向为云计算、数据库系统和高性能计算。他在SIGMOD、IEEE/ACM ICCAD、PACT、IEEE TPDS和FPGA等顶级会议上多次获得“最佳论文奖”。多次主持IEEE CloudCom、ICDCS和ICDE等顶级国际会议和研讨会。担任IEEE TCC、IEEE TPDS、TKDE、DAPD和CSUR等国际期刊编辑委员会委员,是美国计算机学会杰出会员。
孙世轩,上海交通大学计算机科学与工程系长聘教轨副教授。此前,于香港科技大学获得博士学位(2015-2020),并在新加坡国立大学从事博士后研究员工作(2020-2023)。主要研究方向是大数据系统和并行计算,目前专注于高性能图数据处理的研究。研究成果发表在SIGMOD、VLDB、ASPLOS、ICDE等顶级会议。他入选了国家级青年人才引进计划,上海市青年人才引进计划等项目。
(通讯员:毛伏兵)