LOGO LOGO
博士生靳晓忠的论文被系统领域权威期刊TPDS录用
时间:2023-06-21 11:22:38

近日,2019级博士生靳晓忠(导师刘海坤教授)的论文“Accelerating Content-Defined Chunking for Data Deduplication Based on Speculative Jump”被IEEE Transactions on Parallel and Distributed Systems (TPDS) 期刊录用。

在数据去重系统中,数据分块对于去重率和吞吐量具有重要影响。目前的内容定义分块(CDC,Content-Defined Chunking)方法利用滑动窗口逐字节计算输入数据流的滚动哈希,并根据哈希值是否满足给定的切割条件来确定数据分块切点。然而,以往的CDC方法对CPU资源消耗较大,往往会严重降低数据去重系统的吞吐量。论文提出了一种基于跳跃的分块方法(JC,Jump-based Chunking),旨在减少CDC的CPU开销。JC的关键思想是引入一个跳跃条件,当滚动哈希满足跳跃条件时,滑动窗口可以跳过输入数据流的特定长度。此外,文章还研究了切割条件和跳跃条件对分块大小的影响。文章通过理论和实验的方法证明了JC的有效性和高效性,且不会降低去重率。实验结果显示,与目前最先进的CDC方法相比,JC的平均吞吐量提高了约2倍,并保持了高的去重率。

IEEE Transactions on Parallel and Distributed Systems(TPDS)属于中国计算机学会CCF A类期刊,是计算机系统领域最权威的国际学术期刊之一,每月出版一期,每期录用论文20篇左右,影响因子为3.757,主要关注并行与分布式架构、并行与分布式算法、并行与分布式计算应用以及并行与分布式软件等方面的研究。

(通讯员:靳晓忠)