http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
최요한,석영준,지창훈,김주봉,한연희 한국통신학회 2024 정보와 통신 Vol.41 No.4
최근 심층강화학습이 다양한 조합최적화 문제 해결에 크게 기여하고 있는 연구가 발표되고 있다. 심층강화학습은 환경과의 상호작용을 통해 보상을 기반으로 학습하며, 복잡한 문제에서도 탁월한 성능을 달성한다. 기존 알고리즘은 문제의 복잡성 증가 시 계산 시간이 급증하는 반면, 심층강화학습은 심층 신경망의 일반화(Generalization) 특성을 이용해 문제 조건이 변경되어도 추가적인 수정 없이 해결책을 찾을 수 있는 유연성을 제공한다. 본 고에서는 조합최적화 문제 해결을 위한 심층강화학습의 장점 및 접근 방법을 제시한다. 특히, 다차원 배낭 문제를 심층강화학습으로 해결하는 사례를 설명하면서 심층강화학습이 조합최적화 문제 해결을 위한 강력하고 유연한 방법으로 자리매김하고 있음을 제시한다.
강화학습 기반 다차원 배낭 문제 해결에 대한 일반화 성능 향상 접근법
최요한,석영준,김주봉,한연희 한국통신학회 2023 韓國通信學會論文誌 Vol.48 No.11
조합 최적화 문제 중 하나인 배낭 문제는 NP-hard 문제로서 다항 시간 내에 최적해를 구하는 방법이 알려지지않은 문제이다. 이러한 배낭 문제에 대한 해결책은 물류 및 창고 관리, 제조 및 생산 계획, 자원 할당 및 스케줄링 등 여러 분야에서 활용될 수 있다. 최근 배낭 문제를 강화학습을 통해 해결하려는 시도가 있다. 하지만 여러연구가 배낭 문제의 물건 개수에 종속적인 방법들을 제안하여 주어진 물건의 개수가 바뀔 때마다 개별적으로 모델을 학습해야 한다는 단점을 가졌다. 본 논문은 배낭 문제가 가지는 규모 불변 특성을 활용하여 물건의 개수와무관한 마르코프 결정 과정과 신경망 구조를 제안한다. 결과적으로 배낭 문제를 확장한 문제인 다차원 배낭 문제를 물건의 개수와 관련 없이 학습 및 사용 가능한 방법을 제안하고 실험을 통해 성능을 테스트한다. 추가적으로제안하는 방법의 강점인 일반화 성능을 테스트하여 해당 방법이 확장성, 재사용성, 일반성을 가지는 것을 보인다.
심층 강화학습 기반 조세 및 경제 활동 에이전트 정책 최적화 시뮬레이션 환경 분석 및 실험
허주성,최요한,석영준,유태완,이연희,한연희 한국통신학회 2023 韓國通信學會論文誌 Vol.48 No.6
4차 산업 혁명으로 AI가 사회 전반에 걸쳐 상용화되고 꾸준히 발전하고 있지만, 경제 분야는 여전히 데이터 부족, 다양한 환경, 변수 등으로 AI 적용이 어렵다. 실제 사회 경제적 문제를 해결하기 위해선 경제 주체 간 다양한 환경과상호작용 요인들을 확인하며 경제 활동 및 정책 수립 과정을 설계하고 테스트해야 하지만, 경제 관련 데이터가 부족하고, 실제 정책을 실험하기 위한 환경 구성이 어렵다. 본 논문에서는 Salesforce 팀의 AI 기반 경제 시뮬레이션 환경인 AI Economist를 활용하여 심층강화학습 기반 조세 및 경제 활동 에이전트 정책 최적화 실험 및 분석을 진행하였다.