LOGO
实验室博士后郑龙和博士生姚鹏程的论文被PACT 2018录用
时间:2018-06-25 09:01:21

实验室博士后郑龙和博士生姚鹏程的论文被PACT 2018录用

 

近日,国际学术会议The 27th International Conference on Parallel Architectures and Compilation Techniques (PACT 2018)录用结果揭晓,实验室有两篇论文被录用,分别是:博士后郑龙的论文“Towards Concurrency Race Debugging: An Integrated Approach for Constraint Solving and Dynamic Slicing”和博士生姚鹏程的论文“An Efficient Graph Accelerator with Parallel Data Conflict Management”。

       郑龙的论文“Towards Concurrency Race Debugging: An Integrated Approach for Constraint Solving and Dynamic Slicing”主要研究了多线程程序中数据竞争调试与诊断的问题。数据竞争是指多个线程同时对内存的同一地址空间中的数据进行操作,且至少有一个线程为写操作。相较单线程程序,数据竞争使得多线程程序的理解变得更为复杂,严重时会造成灾难性事故。现有研究对数据竞争大都停留在检测层面,具体集中在检测精度和检测开销两个方面,且取得了明显进展。但是,仅仅知道数据竞争产生的位置通常并不足以修复程序问题。针对上述问题,论文提出了面向数据竞争的并发调试系统RaceDebugger,主要创新点包括:1)构建竞争条件约束。通过数据竞争行为约束条件,利用约束求解器,过滤出数据竞争的程序调度集;2)根本原因隔离技术。结合动态程序切片技术,将数据竞争调度进行精简,找到数据竞争的核心子调度。对apachemysql等大型复杂多线程程序和PARSEC基准程序的测试结果表明,RaceDebugger 能调试检测出的376个数据竞争,覆盖率高达98.4%,同时,相比原始程序调度,根本原因子调度可减少99.7%的程序事件和99.3%的线程间切换,大幅提升了调试效率,而调试人员只需关注少量核心事件及其线程间切换。

       姚鹏程的论文“An Efficient Graph Accelerator with Parallel Data Conflict Management”主要研究了图计算中的数据冲突问题。在图计算的遍历过程中,每个节点往往需要同时接收和处理多个邻居节点的读写请求,从而引发了严重的数据冲突问题。为了保证计算结果的正确性,现有的图计算加速器通常在架构中引入相应的原子结构,通过停滞流水线的方式保证冲突操作间的顺序性。然而,这类原子结构会产生大量的同步开销,降低加速器约45%的整体性能。论文通过对图应用的计算特性进行观察和分析,发现经典图应用的原子操作往往遵循递增性和单一性。基于上述发现,论文提出了一个新的加速器架构,主要创新点包括:1)设计并行累加器。通过并行累加多个冲突操作的计算结果,优化冲突操作间的顺序性,避免节点数据在流水线间频繁同步;2)节点度数感知机制。通过运行时感知节点度数的动态维护调度与执行机制,保证高、低度数节点的高效执行。对BFSWCCPR等经典图应用和SNAP数据集的测试结果表明,提出的加速器架构的平均吞吐量可以达到2.36 GTEPS。相比于同类图计算加速器,加速比最高可以达到3.14x

       PACTACM SIGARCHIEEE CSIFIP共同承办的国际学术会议,主要关注并行体系架构与编译技术的研究,在国内外学术界有着很高的影响。该会议今年一共收到126篇论文投稿,录用36篇论文,录用率不到29%

通讯员:郑龙、姚鹏程

 更多 更多 更多 更多