LOGO LOGO
实验室研发的图学习模型在国际开放图基准数据集挑战赛中打破两项世界纪录
时间:2022-10-18 10:02:47

2022年10月16日,实验室张宇副教授领导的图计算团队在实验室研制的“亿图”图计算平台上研发的新型图学习模型GIDN,在2022年国际开放图基准数据集OGB (Open Graph Benchmark) 挑战赛的链接属性预测赛道中,在药物联合作用预测和作者合作关系预测两个领域的数据集上预测精度分别达到0.9542和0.7096,均打破世界记录,排名世界第一。

国际开放图基准数据集OGB由图学习领域的国际顶级学者建立,并用于目前公认最权威的国际顶级图学习基准评测榜单中,其以质量高、规模大、场景复杂、难度高著称,旨在评测国际上最新的图学习模型精度。OGB挑战赛包括图顶点属性预测、链接属性预测、图属性预测三个赛道,其应用都来自现实应用中的挑战性问题。

OGB挑战赛的ogbl-ddi数据集和ogbl-collab数据集分别来自于美国食品药品监督管理局批准的或实验性的药物数据库和微软学术图谱作者信息数据库。此次夺冠的图学习模型GIDN由实验室2022级博士生王梓骁和2022级博士生郭渝洛、2021级硕士生黄志颖、2020级博士生余辉、2022级硕士生吴奕洋共同完成。该模型能够高精度预测原本不相关的两个事物之间是否存在某种关联关系,可用于药物联合作用预测和作者合作关系预测等。例如,针对ogbl-ddi数据集,可以将药物相互作用的信息输入到图学习模型中,高精度预测具有联合作用的药物,能够极大地减少药物研发过程中临床验证时间和研发经费。针对ogbl-collab数据集,GIDN模型可以对未来作者之间的合作关系进行高精准预测,在分派科研项目评审专家和论文评审专家时精准识别潜在利益关系,并帮助科研人员快速、高质量地找到合适的合作者。


(通讯员:王梓骁)