연합학습은 개인정보를 보호하면서 분산된 데이터를 효율적으로 학습할 수 있는 새로운 패러다임이다. 그러나 각 클라이언트가 보유한 데이터가 서로 독립적이지 않고 동일하지 않은 분포...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T17374054
성남 : 가천대학교 글로벌캠퍼스 일반대학원, 2026
학위논문(석사) -- 가천대학교 글로벌캠퍼스 일반대학원 , IT융합공학과 , 2026. 2
2026
한국어
연합학습 ; 클러스터링 연합학습 ; 하이퍼파라미터 최적화 ; 밀도 기반 클러스터링 ; 베이지안 최적화
경기도
; 26 cm
지도교수: 이강윤
I804:41005-200000939548
0
상세조회0
다운로드연합학습은 개인정보를 보호하면서 분산된 데이터를 효율적으로 학습할 수 있는 새로운 패러다임이다. 그러나 각 클라이언트가 보유한 데이터가 서로 독립적이지 않고 동일하지 않은 분포...
연합학습은 개인정보를 보호하면서 분산된 데이터를 효율적으로 학습할 수 있는 새로운 패러다임이다. 그러나 각 클라이언트가 보유한 데이터가 서로 독립적이지 않고 동일하지 않은 분포를 따를 경우, 전역 모델의 성능이 심각하게 저하되는 문제가 발생한다. 이러한 이질성 문제를 완화하기 위해, 유사한 특성을 가진 클라이언트를 그룹으로 묶는 클러스터링 기반 연합학습이 제안되었다.
하지만 기존의 클러스터링 기반 연합학습 연구들은 클라이언트를 구분하는 기준으로 주로 모델 가중치의 유사성을 활용하였다. 이 방식은 데이터 분포가 명확히 구분되는 단순한 환경에서는 효과적일 수 있으나, 여러 클래스가 서로 중첩되어 나타나는 실제적인 비독립·비동일 환경에서는 한계가 뚜렷하다.
예를 들어 한 클라이언트가 숫자 7 데이터를 80% 가지고 나머지 20%는 숫자 1 데이터를 포함하고, 또 다른 클라이언트가 동일하게 숫자 7 데이터를 80% 가지고 나머지 20%는 숫자 3 데이터를 포함한다고 가정할 수 있다. 이 경우 두 클라이언트의 학습 과정은 모두 숫자 7 데이터의 영향을 강하게 받기 때문에 모델 가중치의 변화 방향이 거의 동일하게 나타난다.
따라서 기존의 클러스터링 기법은 두 클라이언트가 가진 본질적인 차이, 즉 한쪽은 숫자 1 데이터에, 다른 한쪽은 숫자 3 데이터에 특화되어 있다는 점을 구분하지 못하고 동일한 그룹으로 잘못 분류한다. 그 결과 두 클라이언트 모두에게 최적화되지 못한 모델이 학습되는 문제가 발생한다.
본 연구에서는 이러한 한계를 극복하기 위해 Fed-CO, 즉 Federated Clustering and Optimization 프레임워크를 제안한다. Fed-CO는 모델 가중치 대신 각 클라이언트의 학습률, 배치 크기, 손실값과 같은 학습 과정의 행동 정보를 새로운 특징 벡터로 사용한다.
이를 통해 DBSCAN 클러스터링이 기존 방법들이 구분하지 못했던 미세한 분포 차이를 감지할 수 있도록 하였다. 또한 Fed-CO는 각 클러스터에 대해 Optuna 프레임워크 기반의 독립적인 하이퍼파라미터 최적화를 수행하여 클러스터별 데이터 특성에 맞춘 학습을 가능하게 한다. 특히 기존 방식처럼 통계적 이상치를 단순히 제거하거나 임의로 병합하지 않고, 노이즈 승격 메커니즘을 통해 이들을 독립적인 클러스터로 격리하여 정보 손실 없이 개별 최적화를 수행하도록 설계하였다. 제안한 프레임워크의 성능을 검증하기 위해 MNIST, CIFAR-10, CIFAR-100 등 다양한 데이터셋을 디리클레 분포로 분할하여 실험을 수행하였다.
첫째, Fed-CO는 FedAvg, FedProx, FedAdam 등 기존의 집계 알고리즘과 비교했을 때, 특히 복잡한 데이터셋인 CIFAR-100에서 알파 값이 0.05일 때 최대 3.7%포인트의 성능 향상을 보여 클러스터 단위 하이퍼파라미터 최적화의 필요성을 입증하였다.
둘째, IFCA, FeSEM, FedGroup 등 기존의 클러스터링 기반 연합학습 기법과 비교한 결과, Fed-CO는 Non-IID 환경인 MNIST 데이터셋에서 알파 값이 0.05일 때 98.36%의 높은 정확도를 달성하였다. 이는 동일한 환경에서 49%에서 84% 수준의 성능을 보인 기존 기법들과 뚜렷한 대비를 이룬다.
마지막으로, 네 가지 추가적인 분석 실험을 통해 동적 클러스터링, 클러스터 단위 하이퍼파라미터 최적화, 노이즈 승격 등 Fed-CO의 핵심 설계 요소가 성능 향상과 학습 안정성에 필수적으로 기여함을 체계적으로 검증하였다.
결론적으로, 본 연구는 Non-IID 환경에서 학습 과정의 행동 정보를 활용한 동적 클러스터링과 자율적인 하이퍼파라미터 최적화를 통합함으로써, 연합학습의 안정성과 성능을 동시에 향상시킬 수 있는 새로운 프레임워크를 제시하였다는 점에서 의의가 있다.
목차 (Table of Contents)