확률적 경사 하강법의 파이프라인 병렬화에서 지연 기울기 완화 기법 연구 = Research of Delayed Gradient Mitigation Methods in Pipelined Stochastic Gradient Descent|RISS 상세보기

국문 초록 (Abstract)

대규모 DNN 모델을 대용량 데이터셋에서 빠르게 학습시키는 병렬화 훈련 방법들이 많이 연구되어 왔다. 특히, 모델 병렬화에서 유래된 파이프라인 병렬화가 주목을 받고 있다. 파이프라인 병렬화 방법은 모델 파라미터를 여러 컴퓨팅 노드에 나누고 여러 미니 배치를 동시에 처리한다. 그러나 단순한 파이프라인 병렬화는 파라미터 불일치와 지연 기울기 문제로 인해 불안정한 학습과 성능 저하 문제를 겪는다. 본 연구에서는 파라미터 불일치 문제를 해결하기 위해 파이프라인 병렬화 안에서 여러 모델 사본을 유지하고, 지연 기울기 문제를 해결하기 위해 데이터 병렬화에서 연구된 최적화 기법들을 적용하는 것을 제안한다. 특히, 파이프라인 병렬화에 탄성력 기반 이동 평균 알고리즘을 결합한 EA-Pipe와 테일러 근사 기반 기울기 지연 보상 알고리 즘을 결합한 TaylorPipe를 제안한다. 제안된 방법들의 효과를 확인하기 위해 CIFAR과 ImageNet 데이터셋으로 성능을 검증했다.

번역하기

대규모 DNN 모델을 대용량 데이터셋에서 빠르게 학습시키는 병렬화 훈련 방법들이 많이 연구되어 왔다. 특히, 모델 병렬화에서 유래된 파이프라인 병렬화가 주목을 받고 있다. 파이프라인 병...

목차 (Table of Contents)