LOGO LOGO
北京航空航天大学马帅教授应邀作学术报告
时间:2021-01-18 08:40:15

2021年1月15日上午10:00-12:00,北京航空航天大学计算机学院的马帅教授应邀为实验室师生作了题为“大数据近似计算”的学术报告,受疫情影响,此次报告是通过腾讯会议在线上分享的,实验室大数据方向全体师生积极上线参与。

如何在规模巨大、动态变化、可靠性低的大数据中快速准确地搜索有价值的信息已成为当前亟待解决的一个重要挑战性问题。近年来,大数据搜索从理论、算法到系统都取得了很好的进展。但当查询处理等计算任务中难以计算最优解或非必要时,追求可以高效计算且满足需求的近似结果已成为解决从大数据中快速准确地搜索有价值的信息这一挑战性难题的关键。

本次报告介绍和探讨了大数据近似计算方法。从生活中的例子出发说明了现实生活中的很多实际问题是难以计算的。因此高效高质量的近似计算就很有必要。具体的近似计算方法包括对查询语言的改进和对数据集的削减。对查询语言的改进中,介绍了时态网络中的稠密子图发现问题。通过生物趋同演化的性质来高效的实现了将平方的区间组合降为常数组合。在数据集的削减过程中,介绍了最短路径的查询和链路预测问题。通过找到网络中的“代理”实现了对数据集的削减以提高最短路径的查询效率。通过观察传统链路预测中的非负矩阵分解方法中存在的低效率、数据稀疏的问题,设计了高效的数据抽样方法来实现高效高质量的链路预测。最后,马帅教授为我们介绍了近似计算在算法、系统和机器学习中的挑战和有趣的研究方向。

马帅教授的报告内容丰富详实,深入浅出,系统详细地介绍了近似计算的方法。在提问环节,他和线上的老师、同学们围绕时态网络中的新模型新算法和怎么在机器学习中融入近似算法的框架等细节进行了深入交流和讨论。他看待问题的严谨性和科研经验分享让实验室的老师、同学受益匪浅。

马帅,北京航空航天大学计算机学院教授,国家杰青,数据库专委常委、大数据专委委员;先后获得北京大学博士学位、英国爱丁堡大学博士学位、英国爱丁堡大学博士后。曾在美国贝尔实验室总部实习,在微软亚洲研究院访问。担任VLDB Journal和IEEE Transactions on Big Data编委等。长期从事大数据分析和管理,研究成果持续发表在国际顶级数据库、数据挖掘与计算机系统期刊(TODS、VLDB Journal、TKDE、TMC、TCS 等)和会议SIGMOD、VLDB、ICDE、WWW、ACL、IJCAI、AAAI、USENIX ATC、MobiCom等)。获国际顶级数据库会议VLDB 2010 唯一最佳论文奖、数据挖掘知名会议ICDM 2019候选最佳论文、2017年中国电子学会科技进步特等奖等。


(通讯员:林隆龙)