현대의 딥러닝 모델은 단일 모델 내에서 다양한 도메인과 데이터를 처리 하는 다중 작업 학습(Multi-Task Learning) 형태로 진화하고 있다. 기존 모델 들은 데이터의 특성과는 무관하게 하나의 거...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T17411283
용인 : 단국대학교 대학원, 2026
학위논문(석사) -- 단국대학교 대학원 , 인공지능융합학과 인공지능융합전공 , 2026. 2
2026
한국어
다중 작업 학습 ; 작업-적응형 게이팅 ; 작업 전문화 ; 부정적 전이 ; 효율적 추론
006.3 판사항(23)
경기도
Task-Adaptive Gating Network for Multi-Task Learning
v, 49 p. : 삽화 ; 30 cm.
단국대학교 논문은 저작권에 의해 보호받습니다.
지도교수: 김동재
참고문헌: p. 45-47
I804:11017-000000203169
0
상세조회0
다운로드현대의 딥러닝 모델은 단일 모델 내에서 다양한 도메인과 데이터를 처리 하는 다중 작업 학습(Multi-Task Learning) 형태로 진화하고 있다. 기존 모델 들은 데이터의 특성과는 무관하게 하나의 거...
현대의 딥러닝 모델은 단일 모델 내에서 다양한 도메인과 데이터를 처리 하는 다중 작업 학습(Multi-Task Learning) 형태로 진화하고 있다. 기존 모델 들은 데이터의 특성과는 무관하게 하나의 거대한 모델에 데이터를 입력함에 따라 모든 파라미터를 활성화하고 연산자원 낭비를 초래한다. 이러한 문제를 해결하기 위해 본 연구에서는 입력 데이터의 특성을 스스로 판단하고 필요 한 분류기만을 선택적으로 학습 및 활성화하는 ‘작업-적응형 게이팅 네트워 크(Task-Adaptive Gating Network, TagNet)’를 제안한다. TagNet은 공통된 특 징을 추출하는 특징추출기(Feature Extractor) 네트워크, 작업의 특성을 판단 하고 구분하여 적절한 분류기를 선택하는 게이팅 모듈(Gating Module), 그리 고 각각의 작업의 특징에 맞게 전문화된 분할된 분류기(Partitioned Classifiers) 로 구성된다. 본 연구의 핵심 방법론은 검벨-소프트맥스(Gumbel-Softmax)의 미분 가능한 라우팅 알고리즘이다. 검벨-소프트맥스는 검벨-트릭(Gumbel- Trick)을 통해 작업분류기의 그래디언트(Gradient)가 게이팅 모듈에도 흐르도 록 한다. 검벨-트릭은 학습 시 기존의 이산적 라우팅 방식이 갖는 미분 불가 능 문제를 해결한다. 또한 각각의 작업이 독립적인 파라미터 공간을 갖게 하 여 다중 작업 학습의 고질적 문제인 작업 간 간섭(Negative Transfer) 현상을 감소시킨다. 이러한 구조를 통해 학습 단계에서 파티션 된 분류기는 전문화 되고, 추론 과정에서는 게이팅 모듈이 선택한 하나의 전문화된 작업 분류기 를 활성화하여 불필요한 연산을 차단한다. 제안하는 모델을 검증하기 위해 본 연구에서는 두 단계의 실험을 수행하 였다. 먼저, 이미지 사이즈가 동일하고 서로 다른 특성을 지닌 숫자, 문자 및 패션 이미지에 해당하는 3 종의 MNIST(MNIST, KMNIST, Fashion-MNIST) 데이 터셋을 활용한 실험에서는 제안한 모델이 서로 다른 작업을 효과적으로 식 별하고 적절한 작업 경로로 라우팅할 수 있는지에 대한 기초 성능을 검증하 였다. 나아가 6 종의 도메인과 24 종의 슈퍼클래스(superclass)를 포함하는 DomainNet 데이터셋의 일부를 활용하여 실제 환경에서의 확장성과 정확도를 평가하였다. 비교군으로 동일한 백본 구조를 갖는 표준 SimpleCNN 및 AlexNet 기반의 모델과의 비교 실험 결과, TagNet은 두 데이터셋 환경 모두 에서 추론 시 연산량(FLOPs)과 활성화된 파라미터 수를 획기적으로 줄였고, 다중 작업 분류 정확도를 충분히 유지하는 것을 넘어 향상되는 것을 확인하 였다. 결과적으로 학습 시 데이터의 작업 특성에 따라 동적으로 연산 경로를 재구성하는 적응형 게이팅 메커니즘의 유효성을 입증하고, 추론성능과 연산 효율성을 극대화할 수 있는 새로운 형태의 경량화 딥러닝 아키텍처를 제시 한다.
목차 (Table of Contents)