LOGO LOGO
科研方向
大数据

大数据泛指在可容忍的时间内无法用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的巨量数据集合,其自身蕴含着巨大的社会、经济、科研价值。本研究方向围绕大数据技术与理论的热点问题,着重研究大数据基础理论、大数据处理、大数据管理与大数据分析等问题。主要包括:1)大数据的新型算法理论,主要研究设计严格亚线性复杂度分布式算法以及在并行分布式环境下对大数据处理问题难度的精细划分;2)大数据处理系统,侧重于新型软硬件架构上的系统优化,如内存计算、异构计算、流计算等;3)大数据管理系统,重点研究图计算与图数据库、知识管理、大数据管理查询等;4)大数据分析,主要针对大规模数据的有效机器学习算法的设计与实现,以及对海量数据的有效信息进行挖掘,并构建典型系统等。经过多年的研究积累,本方向研发了大规模图数据处理系统(包括大规模RDF图数据库TripleBit、图数据处理系统PathGraph)、流计算系统DStream、FastJoin等、内存计算数据处理系统Mammoth、内存计算GC优化系统Deca、高性能计算机数据密集型应用高速缓冲系统SSDUP等,相关成果获得Computer杂志亮点技术推荐、湖北省优秀自然科学论文一等奖等同行认可,相关技术在南方航空、神威太湖之光高性能计算机等领域上获得应用。

本研究方向得到了国家973计划、国家科技支撑计划、科技部国际合作专项、宽带移动业务关键技术开放式研究课题、国家863计划、国家自然科学基金重点项目、教育部-中移动科研基金、国家自然科学基金优秀青年科学基金、全国优博专项、湖北省科技条件平台等重要科研项目的资助。本方向的部分论文发表在VLDB、ICS、SC、IPDPS、WWW、ICNP、TOCS、CSUR、TPDS、TKDE、TC等重要学术会议和期刊上,获得国家发明专利40余项。

 

undefined

TripleBit

 

  undefined

FastJoin

 

undefined

内存计算GC优化系统Deca