대규모 DNN 모델을 대용량 데이터셋에서 빠르게 학습시키는 병렬화 훈련 방법들이 많이 연구되어 왔다. 특히, 모델 병렬화에서 유래된 파이프라인 병렬화가 주목을 받고 있다. 파이프라인 병...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T16956474
서울 : 고려대학교 대학원, 2024
학위논문(석사) -- 고려대학교 대학원 , 컴퓨터학과(정보대학) 소프트웨어전공 , 2024. 2
2024
한국어
서울
49 p ; 26 cm
지도교수: 육동석
I804:11009-000000278428
0
상세조회0
다운로드대규모 DNN 모델을 대용량 데이터셋에서 빠르게 학습시키는 병렬화 훈련 방법들이 많이 연구되어 왔다. 특히, 모델 병렬화에서 유래된 파이프라인 병렬화가 주목을 받고 있다. 파이프라인 병...
대규모 DNN 모델을 대용량 데이터셋에서 빠르게 학습시키는 병렬화 훈련 방법들이 많이 연구되어 왔다. 특히, 모델 병렬화에서 유래된 파이프라인 병렬화가 주목을 받고 있다. 파이프라인 병렬화 방법은 모델 파라미터를 여러 컴퓨팅 노드에 나누고 여러 미니 배치를 동시에 처리한다. 그러나 단순한 파이프라인 병렬화는 파라미터 불일치와 지연 기울기 문제로 인해 불안정한 학습과 성능 저하 문제를 겪는다. 본 연구에서는 파라미터 불일치 문제를 해결하기 위해 파이프라인 병렬화 안에서 여러 모델 사본을 유지하고, 지연 기울기 문제를 해결하기 위해 데이터 병렬화에서 연구된 최적화 기법들을 적용하는 것을 제안한다. 특히, 파이프라인 병렬화에 탄성력 기반 이동 평균 알고리즘을 결합한 EA-Pipe와 테일러 근사 기반 기울기 지연 보상 알고리 즘을 결합한 TaylorPipe를 제안한다. 제안된 방법들의 효과를 확인하기 위해 CIFAR과 ImageNet 데이터셋으로 성능을 검증했다.
목차 (Table of Contents)