
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
강건한 연합 학습을 위한 놈 기반 이상치 필터링 및 합의 기반 집계 기법
Federated Learning (FL) enables collaborative training of machine learning models across distributed clients without sharing private data, making it ideal for privacy-sensitive applications. However, FL is highly vulnerable to backdoor attacks, especially those designed to persist undetected over time. One of the most advanced of these is the Irreversible Backdoor Attack (IBA), which remains effective even after malicious clients are removed by aligning its updates with benign ones. In this paper, we propose a novel defense framework called Norm-Based Outlier Filtering and Consensus-Aware Aggregation (NOFCA) to effectively defend against such attacks. NOFCA combines norm-based outlier removal of client updates with a consensus-direction-based perturbation mechanism that disrupts the insertion of aligned adversarial updates. Unlike conventional aggregation rules or heuristic-based filtering, our method actively removes anomalous updates and performs adjusted aggregation based on the consensus direction of benign clients, thereby effectively obstructing backdoor attacks. Experimental results on MNIST and CIFAR-10 datasets demonstrate that NOFCA consistently achieves the lowest backdoor accuracy across all evaluated attack scenarios while maintaining competitive main accuracy. Furthermore, under fixed-frequency attack settings, where the attacker participates in every communication round, NOFCA shows robust and stable performance, maintaining strong defense even in highly persistent threat conditions. These findings confirm the effectiveness of NOFCA as a practical and resilient defense strategy for real-world FL systems. 연합학습(Federated Learning, FL)은 분산된 클라이언트 간에 개인 데이터를 공유하지 않고 머신러닝 모델을 공동 학습할 수 있도록 하여, 개인정보 보호가 중요한 응용 분야에 이상적인 접근 방식을 제공합니다. 그러나 FL은 특히 시간이 지나도 탐지되지 않고 지속되는 형태로 설계된 백도어 공격에 매우 취약합니다. 이러한 공격 중 가장 정교한 방식 중 하나는 비가역 백도어 공격(Irreversible Backdoor Attack, IBA) 으로, 이는 악성 클라이언트가 제거된 이후에도 정상 클라이언트의 업데이트 방향에 정렬됨으로써 효과를 지속할 수 있습니다. 본 논문에서는 이러한 공격에 효과적으로 대응하기 위해 Norm-Based Outlier Filtering and Consensus-Aware Aggregation (NOFCA) 이라는 새로운 방어 프레임워크를 제안합니다. NOFCA는 클라이언트 업데이트의 노름 기반 이상치 필터링(norm-based outlier filtering)과 합의 방향(consensus direction)에 기반한 섭동 기법(perturbation mechanism)을 결합하여, 정렬된 악성 업데이트의 삽입을 방해합니다. 기존의 단순 집계(aggregation) 규칙이나 휴리스틱 기반 필터링 방식과 달리, 제안하는 방법은 비정상적인 업데이트를 적극적으로 제거하고, 정상 클라이언트들의 합의 방향을 기준으로 조정된 집계를 수행하여 백도어 공격을 효과적으로 차단합니다. MNIST와 CIFAR-10 데이터셋을 대상으로 한 실험 결과, NOFCA는 모든 평가된 공격 시나리오에서 일관되게 가장 낮은 백도어 정확도(backdoor accuracy)를 달성함과 동시에, 주된 정확도(main accuracy) 역시 경쟁력 있게 유지함을 확인하였습니다. 또한, 매 통신 라운드마다 공격자가 참여하는 고정 주기 공격(fixed-frequency attack) 설정에서도, NOFCA는 높은 지속 공격 조건하에서도 강력하고 안정적인 방어 성능을 유지하는 것으로 나타났습니다. 이러한 결과는 NOFCA가 실제 연합학습 시스템 환경에서도 실질적이고 견고한 방어 전략이 될 수 있음을 입증합니다.