LOGO LOGO
美国德克萨斯大学阿灵顿分校江松副教授应邀作学术报告
时间:2019-07-17 08:31:51

2019715日上午,美国德克萨斯大学阿灵顿分校的江松副教授应邀在东五楼210学术报告厅作了题为“RapidCDCLeveraging Duplicate Locality to Accelerate Chunking in CDC-based Deduplication Systems”的学术报告。

I/O重复数据删除是提高存储系统空间和I/O效率的关键技术。在各种重复数据删除技术中,基于内容定义分块(CDC)的重复数据删除技术是提高重复数据删除率的最佳选择。但是,它的分块操作很慢,可能会成为性能瓶颈。目前,必须在高重复数据删除率和高速度之间做出选择。

在本次报告中,江松副教授展示了如何利用重复块中的局部性来消除基于CDC的重复数据删除系统中绝大部分的分块成本。提出的重复数据删除方法名为RapidCDC,它具有两个显著特征:一是它的效率与重复数据删除率正相关;二是数据块局部性与效率没有强正相关性。使用合成和真实数据集的实验结果表明,RapidCDC的分块速度可以比常规CDC提高多达33倍。同时,它保持了几乎相同的重复数据删除率。

江松副教授的报告内容丰富、层层渐进,详细介绍了CDC系统在删除率与高速率之间存在的冲突,并阐述了RapidCDC的设计理念。在提问环节,他和参会的老师、同学们围绕数据切块的方式展开了讨论,在场的老师和同学都受益匪浅。

江松副教授的研究兴趣包括大数据处理的系统基础设施,如文件和存储系统、数据管理系统、以及用于高性能计算的I/O系统。他在2009年获得美国国家科学基金会(NSFCareer Award,曾在许多顶级会议的程序委员会任职。他曾参与Facebook和百度的项目,作为合作伙伴,提供基于大数据的高质量互联网服务,在顶级会议上发布了许多重要的科研成果。他的研究已经在行业中产生了重要影响,他提出的几种内存和存储管理算法已被正式采用到主流系统中,包括Linux内核、NetBSD内核和MySQL的存储引擎等。

通讯员: 张信民