主题:分布式机器学习算法的系统优化
嘉宾:崔斌 北京大学
时间:2020年10月18日上午10:00-11:00
地点:东五楼210
报告摘要:
分布式机器学习算法已经被广泛地用于大规模数据分析与挖掘。在分布式机器学习系统中,我们需要考虑一些对系统性能有重要影响的因素,如并行策略、同步协议和网络通信等。报告将介绍我们在分布式机器学习系统设计优化的一些工作,包括面向高维海量数据的并行策略、面向异构环境的同步协议、基于数据草图的梯度压缩方法。报告最后也将介绍北京大学与腾讯合作研发的分布式机器学习系统Angel,系统针对海量训练数据和高维的模型参数做了深度优化,在易用性、稳定性、可扩展性等方面获得了良好的效果,并支持多种不同类型的机器学习算法。Angel系统作为腾讯第三代高性能机器学习计算平台,已经在腾讯的多个实际业务中得到了应用,并在GitHub开源 (https://github.com/Tencent/angel)。
报告人简介:
崔斌,北京大学计算机系副主任、特聘教授,网络与信息系统研究所所长。研究方向包括数据库系统设计和性能优化、数据挖掘、大数据管理和分析等,在相关领域发表了100多篇学术论文。担任中国计算机学会数据库专委会副主任,VLDB理事会理事,IEEE TKDE、VLDB Journal等期刊编委,以及数十个国际会议的程序委员会委员。他是中国计算机学会杰出会员,于2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会 “CCF 青年科学家奖”,2014年获教育部自然科学二等奖。