RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      다중 작업 학습을 위한 작업-적응형 게이팅

      한글로보기

      https://www.riss.kr/link?id=T17411283

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      현대의 딥러닝 모델은 단일 모델 내에서 다양한 도메인과 데이터를 처리 하는 다중 작업 학습(Multi-Task Learning) 형태로 진화하고 있다. 기존 모델 들은 데이터의 특성과는 무관하게 하나의 거대한 모델에 데이터를 입력함에 따라 모든 파라미터를 활성화하고 연산자원 낭비를 초래한다. 이러한 문제를 해결하기 위해 본 연구에서는 입력 데이터의 특성을 스스로 판단하고 필요 한 분류기만을 선택적으로 학습 및 활성화하는 ‘작업-적응형 게이팅 네트워 크(Task-Adaptive Gating Network, TagNet)’를 제안한다. TagNet은 공통된 특 징을 추출하는 특징추출기(Feature Extractor) 네트워크, 작업의 특성을 판단 하고 구분하여 적절한 분류기를 선택하는 게이팅 모듈(Gating Module), 그리 고 각각의 작업의 특징에 맞게 전문화된 분할된 분류기(Partitioned Classifiers) 로 구성된다. 본 연구의 핵심 방법론은 검벨-소프트맥스(Gumbel-Softmax)의 미분 가능한 라우팅 알고리즘이다. 검벨-소프트맥스는 검벨-트릭(Gumbel- Trick)을 통해 작업분류기의 그래디언트(Gradient)가 게이팅 모듈에도 흐르도 록 한다. 검벨-트릭은 학습 시 기존의 이산적 라우팅 방식이 갖는 미분 불가 능 문제를 해결한다. 또한 각각의 작업이 독립적인 파라미터 공간을 갖게 하 여 다중 작업 학습의 고질적 문제인 작업 간 간섭(Negative Transfer) 현상을 감소시킨다. 이러한 구조를 통해 학습 단계에서 파티션 된 분류기는 전문화 되고, 추론 과정에서는 게이팅 모듈이 선택한 하나의 전문화된 작업 분류기 를 활성화하여 불필요한 연산을 차단한다. 제안하는 모델을 검증하기 위해 본 연구에서는 두 단계의 실험을 수행하 였다. 먼저, 이미지 사이즈가 동일하고 서로 다른 특성을 지닌 숫자, 문자 및 패션 이미지에 해당하는 3 종의 MNIST(MNIST, KMNIST, Fashion-MNIST) 데이 터셋을 활용한 실험에서는 제안한 모델이 서로 다른 작업을 효과적으로 식 별하고 적절한 작업 경로로 라우팅할 수 있는지에 대한 기초 성능을 검증하 였다. 나아가 6 종의 도메인과 24 종의 슈퍼클래스(superclass)를 포함하는 DomainNet 데이터셋의 일부를 활용하여 실제 환경에서의 확장성과 정확도를 평가하였다. 비교군으로 동일한 백본 구조를 갖는 표준 SimpleCNN 및 AlexNet 기반의 모델과의 비교 실험 결과, TagNet은 두 데이터셋 환경 모두 에서 추론 시 연산량(FLOPs)과 활성화된 파라미터 수를 획기적으로 줄였고, 다중 작업 분류 정확도를 충분히 유지하는 것을 넘어 향상되는 것을 확인하 였다. 결과적으로 학습 시 데이터의 작업 특성에 따라 동적으로 연산 경로를 재구성하는 적응형 게이팅 메커니즘의 유효성을 입증하고, 추론성능과 연산 효율성을 극대화할 수 있는 새로운 형태의 경량화 딥러닝 아키텍처를 제시 한다.
      번역하기

      현대의 딥러닝 모델은 단일 모델 내에서 다양한 도메인과 데이터를 처리 하는 다중 작업 학습(Multi-Task Learning) 형태로 진화하고 있다. 기존 모델 들은 데이터의 특성과는 무관하게 하나의 거...

      현대의 딥러닝 모델은 단일 모델 내에서 다양한 도메인과 데이터를 처리 하는 다중 작업 학습(Multi-Task Learning) 형태로 진화하고 있다. 기존 모델 들은 데이터의 특성과는 무관하게 하나의 거대한 모델에 데이터를 입력함에 따라 모든 파라미터를 활성화하고 연산자원 낭비를 초래한다. 이러한 문제를 해결하기 위해 본 연구에서는 입력 데이터의 특성을 스스로 판단하고 필요 한 분류기만을 선택적으로 학습 및 활성화하는 ‘작업-적응형 게이팅 네트워 크(Task-Adaptive Gating Network, TagNet)’를 제안한다. TagNet은 공통된 특 징을 추출하는 특징추출기(Feature Extractor) 네트워크, 작업의 특성을 판단 하고 구분하여 적절한 분류기를 선택하는 게이팅 모듈(Gating Module), 그리 고 각각의 작업의 특징에 맞게 전문화된 분할된 분류기(Partitioned Classifiers) 로 구성된다. 본 연구의 핵심 방법론은 검벨-소프트맥스(Gumbel-Softmax)의 미분 가능한 라우팅 알고리즘이다. 검벨-소프트맥스는 검벨-트릭(Gumbel- Trick)을 통해 작업분류기의 그래디언트(Gradient)가 게이팅 모듈에도 흐르도 록 한다. 검벨-트릭은 학습 시 기존의 이산적 라우팅 방식이 갖는 미분 불가 능 문제를 해결한다. 또한 각각의 작업이 독립적인 파라미터 공간을 갖게 하 여 다중 작업 학습의 고질적 문제인 작업 간 간섭(Negative Transfer) 현상을 감소시킨다. 이러한 구조를 통해 학습 단계에서 파티션 된 분류기는 전문화 되고, 추론 과정에서는 게이팅 모듈이 선택한 하나의 전문화된 작업 분류기 를 활성화하여 불필요한 연산을 차단한다. 제안하는 모델을 검증하기 위해 본 연구에서는 두 단계의 실험을 수행하 였다. 먼저, 이미지 사이즈가 동일하고 서로 다른 특성을 지닌 숫자, 문자 및 패션 이미지에 해당하는 3 종의 MNIST(MNIST, KMNIST, Fashion-MNIST) 데이 터셋을 활용한 실험에서는 제안한 모델이 서로 다른 작업을 효과적으로 식 별하고 적절한 작업 경로로 라우팅할 수 있는지에 대한 기초 성능을 검증하 였다. 나아가 6 종의 도메인과 24 종의 슈퍼클래스(superclass)를 포함하는 DomainNet 데이터셋의 일부를 활용하여 실제 환경에서의 확장성과 정확도를 평가하였다. 비교군으로 동일한 백본 구조를 갖는 표준 SimpleCNN 및 AlexNet 기반의 모델과의 비교 실험 결과, TagNet은 두 데이터셋 환경 모두 에서 추론 시 연산량(FLOPs)과 활성화된 파라미터 수를 획기적으로 줄였고, 다중 작업 분류 정확도를 충분히 유지하는 것을 넘어 향상되는 것을 확인하 였다. 결과적으로 학습 시 데이터의 작업 특성에 따라 동적으로 연산 경로를 재구성하는 적응형 게이팅 메커니즘의 유효성을 입증하고, 추론성능과 연산 효율성을 극대화할 수 있는 새로운 형태의 경량화 딥러닝 아키텍처를 제시 한다.

      더보기

      목차 (Table of Contents)

      • Ⅰ. 서론 1
      • 1.1 연구 배경 및 필요성 1
      • 1.2 연구 목적 및 기여 2
      • Ⅰ. 서론 1
      • 1.1 연구 배경 및 필요성 1
      • 1.2 연구 목적 및 기여 2
      • Ⅱ. 관련 연구 4
      • 2.1 다중 작업 학습 (Multi-Task Learning) 4
      • 2.1.1 파라미터 공유 기법 5
      • 2.1.2 부정적 전이 7
      • 2.1.3 도메인 적응과 적대적 학습 (DANN) 8
      • 2.2 조건부 연산과 동적 신경망 9
      • 2.2.1 조건부 연산의 개념 10
      • 2.2.2 전문가 혼합 모델 (MoE) 11
      • 2.2.3 이산적 라우팅의 한계 12
      • 2.3 미분 가능한 라우팅과 검벨-소프트맥스 13
      • 2.3.1 경사 하강법과 이산적 결정 13
      • 2.3.2 검벨-소프트맥스 재매개변수화 14
      • Ⅲ. 본론 16
      • 3.1 TagNet 개요 및 구조 16
      • 3.1.1 공유 특징 추출기 18
      • 3.1.2 작업 식별자 및 게이팅 모듈 19
      • 3.1.3 분할된 분류기 20
      • 3.2 미분 가능한 학습 전략 20
      • 3.2.1 검벨-소프트맥스 기반의 확률적 라우팅 21
      • 3.2.2 온도 파라미터 (τ) 스케줄링 22
      • 3.3 역전파 및 최적화 전략 23
      • 3.3.1 손실함수와 그래디언트 흐름 23
      • 3.3.2 이중 학습 스케줄링 24
      • 3.4 조건부 추론 및 효율화 26
      • 3.4.1 하드 게이팅을 통한 경로 선택 26
      • 3.4.2 연산 효율성 최적화 27
      • Ⅳ. 실험 및 결과 28
      • 4.1 실험 환경 및 설정 28
      • 4.1.1 데이터셋 구성 28
      • 4.1.2 비교 모델 및 구현 세부사항 29
      • 4.1.3 평가 지표 32
      • 4.2 MNIST 데이터셋 실험 결과 33
      • 4.3 DomainNet데이터셋 실험 결과 35
      • 4.4 절제 연구 (Ablation Study) 40
      • 4.4.1 이중 학습률 스케줄링의 영향 40
      • 4.4.2 온도 파라미터 스케줄링의 영향 41
      • Ⅴ. 결론 42
      • 참고문헌 44
      • Abstract 47
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼