LOGO LOGO
博士生陈林的论文被数据库领域国际顶刊IEEE TKDE录用
时间:2024-03-07 09:06:57

近日,2018级博士生陈林(导师丁晓锋教授)的论文“Differentially Private Federated Learning on Non-iid Data: Convergence Analysis and Adaptive Optimization”被 IEEE Transactions on Knowledge and Data Engineering(IEEE TKDE)期刊录用。

联邦学习由于其数据隐私保护和对大规模用户场景的广泛适用性,近年来受到越来越多的关注。但联邦学习中大量客户端之间会产生非独立同分布数据,这给模型训练和收敛性分析带来巨大挑战。此外,由于非独立同分布数据,客户端间的采样数量会产生采样方差问题。更重要的是,虽然联邦学习可通过本地保留训练数据来保证隐私,但如果本地数据是机密和敏感的,联邦学习需要提供更强大的隐私保护能力,以抵抗云服务器或第三方从共享模型或中间梯度中推断出隐私信息。面对非独立同分布和隐私挑战,论文提出一种基于差分隐私的非独立同分布联邦学习算法DPNFL(Differential Privacy based Non-iid Federated Learning)来共同解决上述两个问题。具体而言,在差分隐私及其变体的推动下,论文在联邦学习场景下采用截断集中差分隐私技术,以更紧密地跟踪端到端隐私损失。为避免采样方差问题,令服务器对部分客户端进行无放回均匀采样,从而保证采样的无偏性。为进一步提高算法性能,论文还提出自适应算法AdDPNFL(Adaptive-DPNFL),其采用服务器端的自适应优化来同时减轻非独立同分布数据和差分隐私噪声对模型效用的影响。最后,论文进行大量的实验来验证算法的有效性。相较于最新的基线算法DP-SCAFFOLD(Differential Privacy-Stochastic Controlled Averaging algorithm),论文提出的AdDPNFL算法在异构数据集上可提高至少5%的测试准确度。

IEEE TKDE期刊主要关注知识发现和数据挖掘等最新的研究进展和技术,是中国计算机学会(CCF)推荐的A类期刊,影响因子8.9。


(通讯员:陈林)