LOGO LOGO
博士生黄航的论文被HPDC 2021录用
时间:2021-04-09 14:55:53

近日,第30届国际高性能并行与分布式计算会议 (The 30th ACM International Symposium on High-Performance Parallel and Distributed Computing, HPDC 2021)录用结果揭晓,实验室博士生黄航的论文 “Towards Exploiting CPU Elasticity via Efficient Thread Oversubscription”被录用。

CPU弹性是云计算的一项核心功能,它允许用户根据工作负载的变化动态添加或删除CPU资源。但是,构建真正能够利用云计算CPU弹性的应用程序并非易事,传统应用程序往往需要进行代码的修改才能有效利用可变的资源,这使得CPU弹性的可用性大打折扣。

因此,我们提出通过线程超配的方式,即提供比可用CPU核数更多的线程,以利用云中的CPU弹性。虽然保持足够的并发性可以让应用程序在有更多可用CPU时使用更多的CPU,但人们普遍认为,线程超配会导致上下文切换过多,本地性丢失和共享资源争用等问题,进而引入严重的开销。通过对线程超配开销的全面研究,我们发现上下文切换的直接成本其实不会对大多数应用程序造成明显的性能下降,但线程超配确实对CPU缓存和TLB的性能可能具有建设性和破坏性。在分析过程中,我们发现了两个先前未被充分研究的问题,这些问题导致线程超配下许多应用程序的性能急剧下降。首先,OS内核中的线程睡眠和唤醒过程在线程超配的状况下效率极低。其次,程序代码中普遍的自旋操作可能会浪费CPU并饿死关键线程。为此,我们最终设计了两种OS机制,即虚拟阻塞(VB)和自旋检测(BWD),以实现高效的线程超配,并且无需更改程序代码。实验结果表明,我们的方法保留了程序可以扩展到更多CPU的能力,同时也避免了线程超配的性能影响。与原始Linux相比,基于阻塞的应用程序的性能提升高达77%,基于自旋的应用程序的性能提升高达19倍。

ACM Symposium on High-Performance Parallel and Distributed Computing创办于1992年,是由美国计算机学会组织的并行与分布式计算领域重要学术会议,今录取率约为19%。

(通讯员:黄航)