实验室目前有四个研究方向:云计算与移动计算、系统软件与体系结构、网络空间安全、大数据,本年度实验室取得的重要研究成果与进展:
1、在云计算与移动计算方向,目前着重研究了:
1)针对现有虚拟机磁盘I/O优化方法主要从硬件特性支持、缩短I/O路径等角度开展研究,缺少对虚拟机磁盘I/O行为本身特征的分析,而对该特征的深入认识是指导I/O调度的重要基础。针对上述问题,从虚拟机磁盘I/O行为特征角度开展了一系列研究工作,发现了虚拟化环境下的磁盘I/O访问具有的特殊空间局部性,利用该发现设计了基于时态密度聚集算法的虚拟机I/O访问预测模型和启发式调度算法,在不破坏虚拟化透明性的前提下,可准确预测虚拟机I/O访问请求,动态调节I/O请求发送模式,减少磁头在虚拟机镜像文件之间和虚拟机镜像文件内的寻址开销。上述研究工作成果发表于TPDS,并开发了针对云计算环境的虚拟机磁盘调度系统,被腾讯云平台TLinux_Xen集成。
2)针对现有云计算平台在虚拟集群的管理调度方法上并没有充分考虑到并行应用的进程同步需求,以及云环境下资源竞争对并行应用的严重负面影响,这使得并行应用运行于云计算平台时,相比传统计算环境会有非常明显的性能下降。针对上述问题,提出了云计算环境下通信驱动的虚拟集群同步调度方法,将虚拟机之间的通信模式作为虚拟集群同步调度的重要依据,实现了结点自主的低开销虚拟集群同步方法,具有良好的同步性能和扩展性,解决了紧耦合并行应用在云计算平台高效运行的关键调度问题。上述研究工作成果发表于TPDS,并应用于针对并行应用优化的云计算平台CRANE系统。
3)针对现有云平台细粒度计费方法偏向于降低用户成本,但是增加了云服务提供商的开销,造成用户和云服务提供商利益的相互抵触,难以实现两者的双赢机制。针对上述问题,提出了一种针对IaaS云平台的细粒度价格机制,通过引入经济学领域的效用分析理论,在考虑虚拟机维护开销的基础上寻找到了虚拟机按需租用的最佳定价方法,通过真实数据集分析,验证了该方法可以使用户和云服务提供商实现IaaS服务的双赢价格机制,即节约用户租用成本的同时提高云服务提供商的收益。上述研究工作成果发表于TCC,并被SIGCOMM’15和多篇IEEE Transactions的文章引用。
2、在系统软件与体系结构研究方向,提出了在线缓存优化系统NightWatch、用于发现影响程序并行性的不必要锁同步代码段的调试框架PerfPlay、基于分段-分形多层采样的多核微体系结构模拟加速策略 THS等方法与技术,并开发了面向异构内存体系结构的模拟器系统。
1)现代CPU多采用共享缓存的架构,缓存污染问题非常严重------各运算核心共享最后一级缓存,任何造成缓存污染的核心都会引起缓存的整体性能下降。CPU缓存污染与内存资源的分配过程密不可分。针对上述问题,提出了在线缓存优化系统NightWatch,是对传统内存分配器的一个扩展。该技术将CPU缓存管理集成到内存分配的过程中,使CPU缓存具有更强的抗污染能力。NightWatch原型系统证明了在内存分配器中集成缓存管理的可行性,同时验证了基于数据访问相似性的弱局部性数据定位方法。此前的缓存管理技术在自动化、适用性等方面存在一些缺陷,或需要程序员手动分析程序行为,或需要额外的硬件支持。NightWatch的局部性分析过程对上层应用完全透明,所采用的技术均依赖于现有的系统功能,不需要在硬件上做出改动,兼顾缓存管理效率与技术可用性。该成果已经开源,并发表在USENIX ATC 2015上。
2)提出了一种用于发现那些影响程序并行性的不必要锁同步代码段的调试框架——PerfPlay。在程序动态执行过程中,锁互斥关系极容易影响程序并行性,进而带来性能上的下降。不必锁竞争对(Unnecessary Lock Contention Pair,ULCP)是指两个临界区由同一锁进行同步,且区内访问行为可并行化。PerfPlay基于trace重放技术,① 基于程序的二进制收集含有大量ULCP性能问题的原始程序执行trace (original trace);② 基于original trace,转化和修复其中的ULCP问题为无ULCP性能问题的程序执行trace (ULCP free trace);③ 将original trace和ULCP free trace进行重放,收集到original程序执行结果和ULCP free的程序执行结果;④ 对比两次重放的结果,针对其他的差异部分进行定量分析,进而发掘出潜在的ULCP代码段及其性能影响。实验表明,PerfPlay有着很好的重放性能保真度;检测出的ULCP代码段有着很高的潜在优化价值。该成果发表在IEEE/ACM CGO 2015上。
3)提出了基于分段-分形多层采样的多核微体系结构模拟加速策略 THS,确立了THS技术中的最优样本片段大小,提出了功能预热模拟优化机制W9,建立了全新的快速模拟预测算法 L-WMA,解决了多线程测试程序采样模拟过程中的同步问题。相比于全详细模拟,THS采样策略将模拟速度平均提高40倍,而模拟误差只有4%,在目前的同类采样加速策略中,模拟加速比最高,而模拟误差最低。该成果发表在ACM Transactions on Architecture and Code Optimization 2015和ICPP 2015上。
4)研发了异构内存模拟器系统。在异构内存服务器部署之前,建立全系统模拟是必由之路,迄今没有针对异构内存的全系统模拟器。其设计难点在于:将适配的异构内存管理机制纳入到全系统模拟器中,并提高模拟速度和灵活性。早在2014年,本实验室就设计发布了基于GEM5的异构内存模拟器,今年又发布了基于MARSSX86+NVMain的混合模拟器架构,模拟速度提高100X,支持NVMain、HybridSim和DRAMSim2内存模拟器功能,适用于异构内存结构下软件策略研究。成果已开源(https://github.com/cyjseagull/hybrid-memory-simulator)。
3、在网络空间安全研究方向,主要研究了:
1)云可信基构建及可信虚拟机:由于传统可信基构建技术无法适应云计算的高动态性,虚拟机的迁移特性给虚拟机或虚拟机组可信基的构建带来新的挑战. 首先提出针对单一虚拟机的可信基构建机制,保证虚拟机执行环境动态可信构建,然后提出基于虚拟机组的可信基构建机制,保证多虚拟机的可信启动、可信迁移、组内共享数据的安全,并构建全局可信状态视图。另外,虚拟机回滚给云平台带来了极大的便利,同时也造成了安全状态监控困难,虚拟机回滚导致安全状态与可信平台记录状态不一致,云平台应用因为虚拟机回滚丢失状态,提出虚拟机安全回滚策略,将安全相关的数据进行细粒度划分,不同类型数据采用不同策略进行处理。增加额外的平台状态寄存器记录虚拟机快照、回滚事件信息,保证状态一致性,云应用可以使用新增寄存器进行回滚后的状态恢复,相关成果发表在FGCS上,并申请获得两个国际专利“Trusted Virtual Computing System”和“Synchronized Virtual Trusted Platform Modules (VTPM) and Virtual Machine (VM) Rollbacks”。
2)云服务软件动态更新:由于传统的软件更新系统需要停止运行中的软件,应用补丁而后重启软件,这对于需要高可用性的关键服务系统来讲是不可接受的。针对上述问题,提出了云服务软件动态更新方法,一般动态软件升级系统(DSU)需要大量的人工协助,而对普通用户而言,完成正确的协助是比较困难的,因此需要对开发者和使用者进行职责分离,所提出的软件动态更新方法不需要开发者参与,在新旧源码的基础上自动产生更新补丁,提出了立即更新和适时更新两种机制,用户可以根据自身需求实施相应更新机制,其软件更新导致的连接延迟开销均在6%以下,这在实际使用中基本可以忽略不计。上述研究工作成果发表于TPDS。
3)面向对称加密和非对称加密的高效密文检索机制:由于对称加密体制下,缺乏支持物理删除且低信息泄漏的动态可搜索加密方法,通过构建可搜索密文间特定的隐藏结构,使得逻辑删除与物理删除可配合使用,并选择适当时机执行物理删除,以避免额外的信息泄漏。提出的可搜索加密算法具有功能最全、信息泄漏最少、检索效率最快、存储开销最低的特点。由于在非对称加密体制下,缺乏具有语义安全性和检索高效性的可搜索加密方法,构建可搜索密文间的隐藏“星”型结构,并且该结构可依据检索要求部分可见,从而加快检索。在实用性贡献方面,完成了第一个不降低安全性(即保证语义安全性)且提高检索效率的方案;在理论性贡献方面,完成了方案在标准模型下的可证明安全性。上述研究工作成果发表于 IEEE Transactions on Information Forensics & Security。
4、在大数据研究方向,提出了一种紧凑的图数据存储架构、大规模图数据的分布式处理方法与基于混合着色算法的GPU异步图计算系统,同时研究了大规模OSN系统分布式事件流处理以及深层网络数据发现及分类。
1)现实世界中,RDF图数据总是不停地在增长,而且数据量增长方式随领域不同而不同。因此,无论是从支持SPARQL1.1协议的角度还是从RDF数据管理的实际需求的角度来看,提出了一种具有更好的扩展性的RDF数据管理系统。相关成果发表在大数据重要会议ICDE上。
2)Pregel、GraphLab和GraphChi等都采用以顶点为中心的并行图计算模型并行处理图中的顶点。由于顶点之间存在依赖关系,顶点为中心的模型仅孤立地处理顶点,因此存在内存消耗大、通信开销大等问题。基于此提出了以路径为中心的大规模图数据处理系统PathGraph,在提高I/O效率的同时,优化了图处理时的并行度。相关成果发表被TPDS录用。
3)当前主流的GPU图计算系统,都是基于BSP同步编程模型,这类系统存在有同步通信开销大、算法收敛速度慢等问题,而且多数的系统根本无法处理大规模的图数据。因此,设计了基于混合着色算法的数据划分策略,并实现了基于异步编程模型的GPU图计算系统Frog。Frog系统结合创新的数据划分策略,在提高GPU资源利用率的同时,避免了同步通信的开销,并且能够加快图算法的收敛速度,获得良好的系统性能。相关成果发表在PPoPP国际学术会议上,系统代码已经开源发布。
4)大规模分布式OSN系统中对用户实时更新的事件流进行处理至关重要。但传统流处理技术缺乏对社交图结构特征的提取。通过挖掘大规模社交图中的社区结构特征,并提出一种基于密集子图挖掘的事件流捎带更新机制,有效消除社交网络中事件流处理的跨服务器通信瓶颈,提高了系统吞吐率。相关成果被TPDS以及TSC录用。
5)深层网络(Deep Web)占Web数据的96%,如有有效发现Deep Web的数据源具有重要意义。但传统爬虫技术只能获取表层网络数据,无法获取Deep Web背后隐藏的数据。提出了基于两阶段的深层网络数据源发现方法,并实现了系统(SmartCrawler,将数据源发现过程分为站点定位阶段和站内搜索阶段,并具有自适应、增量式和高效等特点。相关成果被TSC录用。
总之,本年度实验室针对国家战略需求、地方经济社会发展和行业产业科技发展,重点在4个研究领域:云计算与移动计算、系统软件与体系结构、网络空间安全和大数据,进行研究和创新,取得了不错的社会影响和效益。本年度,实验室获批“大数据技术与系统湖北省工程实验室”和“湖北省经济与信息化委员会大数据协同创新平台”; 获得国家科学技术进步奖二等奖1项;获得国家高层次人才特殊支持计划(中组部“万人计划”)青年拔尖人才1人、教育部“长江学者奖励计划”青年学者项目入选1人。实验室在国内外的刊物和会议上发表学术论文93篇,出版编著4本;在研科研项目56项,验收和结题项目9项;获得国家发明专利24项,已受理国家发明专利37项,获得软件著作版权12项。
|