http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
밀집된 통신기기의 무선접속 알고리즘에 적용할 수 있는 강화학습 알고리즘에 대한 비교 연구
이선우(Lee Seon Woo),김도원(Kim Do Won),윤희준(Yun Hee Jun),이지환(Lee Ji Hwan),황건하(Hwang Geon Ha),신경섭(Shin Kyung Seop) 한국통신학회 2021 한국통신학회 학술대회논문집 Vol.2021 No.11
본 논문은 기존 강화학습을 활용한 통신 프로토콜 연구에서 주로 다루어진 Q-learning 기반 알고리즘보다 더 기본적인 강화학습 알고리즘인 Temporal-Difference(TD)와 Monte-Carlo(MC)를 통신 알고리즘에 적용하여 강화학습 방식에 따른 네트워크 접속성능의 비교분석을 진행하였다. 실험을 위해 알고리즘은 대용량의 데이터를 작은 단위로 나누어 전송하는 다중 사용자 환경을 가정하였다. 본 논문에서는 TD 와 MC 알고리즘에 동일한 reward 를 주지만 ε-greedy 방식을 사용하는 경우에 ε 값을 다르게 설정하여 성능을 비교하는 실험과 ε 값을 고정하고 reward 를 다르게 하는 실험을 수행하였다. 실험 결과 TD 와 MC 를 활용한 노드 간 통신에 ε값이 작을수록 모두 성능이 향상되는 경향성을 확인하고, 최종 reward 의 차이에 따라 TD 의 성능이 변화가 더 크다는 것을 확인하였다.