LOGO LOGO
北京大学崔斌教授应邀做学术报告
时间:2020-10-20 14:36:39

2020年10月18日上午,北京大学崔斌教授应邀在东五楼210学术报告厅作了题为“分布式机器学习算法的系统优化”的学术报告。

近年来,随着数据量级的快速提升,机器学习中的训练样本数据量大大超过了单机处理能力。而且,大数据本身所具有的复杂特征,导致机器学习模型愈加庞大复杂,在单机环境下处理这些庞大的机器学习模型也愈加困难。分布式机器学习是解决以上问题的一个重要方向。为此,考虑到机器学习技术的特点,业界为高效执行大数据场景下的大模型训练及分析任务,设计了多种分布式机器学习系统。

本次报告围绕分布式机器学习及其关键技术展开。在报告中,崔斌教授认为分布式机器学习系统其核心在于算法设计和系统设计,关键技术在于数据压缩、并行策略及同步协议。他介绍了其团队在分布式机器学习系统中设计优化的一些工作,包括面向高维海量数据的并行策略、面向异构环境的同步协议、基于数据草图的梯度压缩方法。报告最后也介绍了北京大学与腾讯合作研发的分布式机器学习系统Angel,该系统针对海量训练数据和高维的模型参数做了深度优化,在易用性、稳定性、可扩展性等方面获得了良好的效果,并支持多种不同类型的机器学习算法。Angel系统作为腾讯第三代高性能机器学习计算平台,已经在腾讯的多个实际业务中得到了应用,并在GitHub开源。

崔斌教授的报告内容丰富且详实,对分布式机器学习系统在学术界和工业界的作用阐述得很清晰,在场的老师和同学们都收获颇丰。在提问环节,现场的同学和老师与崔斌教授一起围绕面向稀疏梯度的数据压缩技术以及如何控制模型的精度损失等技术细节进行了深入的交流和讨论。

崔斌教授是长江学者特聘教授,北京大学计算机系副主任、网络与信息系统研究所所长。研究方向包括数据库系统设计和性能优化、数据挖掘、大数据管理和分析等,在相关领域发表了100多篇学术论文。他担任中国计算机学会数据库专委会副主任,VLDB理事会理事,IEEE TKDE、VLDB Journal等国际期刊编委,担任过数十个国际会议的程序委员会委员。他是中国计算机学会杰出会员,2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会“CCF 青年科学家奖,2014年获教育部自然科学二等奖。


通讯员:张照博