http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
오성회(Songhwai Oh) 大韓電子工學會 2012 電子工學會論文誌-SC (System and control) Vol.49 No.3
데이터 연관은 지능시스템의 자율적인 작동에 매우 중요한 문제이다. 본 논문에서는 데이터 연관 문제를 Bayesian 방식으로 구성하고 이를 성공적으로 지능시스템에 응용한 예를 설명한다. 먼저 데이터 연관 문제가 어떻게 Bayesian 방식으로 구성하여 혼잡한 환경에서의 다 물체 추적 문제에 적용되는지 알아본다. 그리고 데이터 연관이 지능시스템에 어떻게 응용될 수 있는지 정체 관리를 이용한 항공 교통 관제, 카메라 네트워크 위치 및 관점 자동 보정, 멀티 센서 퓨젼의 세 가지 예를 이용해 살펴본다. Data association plays an important role in intelligent systems. This paper presents the Bayesian formulation of data association and its applications to intelligent systems. We first describe the Bayesian formulation of data association developed for solving multi-target tracking problems in a cluttered environment. Then we review applications of data association in intelligent systems, including surveillance using wireless sensor networks, identity management for air traffic control, camera network localization, and multi-sensor fusion.
GPU 기반 비선형 계획법 솔버를 사용한 모델 기반 강화학습
김도형(Dohyeong Kim),오성회(Songhwai Oh) 대한전기학회 2021 대한전기학회 학술대회 논문집 Vol.2021 No.10
모델 기반 강화학습은 샘플 효율성이 높은 강화학습 방식 중의 하나로 알려졌다. 실제 로봇에 적용하기 위해선 로봇과 환경의 상호작용을 줄여 손상을 최소화하는 방식이 중요하기 때문에, 샘플 효율이 높은 것은 중요한 이점이다. 다만, 기존 모델 기반 강화학습에서 많이 사용되는 표본 추출법 기반 행동 계획법은 표본 추출 횟수에 대한 상한이 없어 계산 시간이 많이 필요할 수 있다. 이를 해결하기 위해 우리는 최적화 기반 행동계획법을 사용하고, 병렬처리가 용이하게끔 문제를 재정의 및 GPU를 활용한 계획법 솔버를 사용하는 강화학습 방법을 제안한다.
Agent의 효율적이고 안전한 Exploration을 위한 Tsallis Entropy의 분포 기반 강화학습에의 적용
정재연(Jaeyeon Jeong),오성회(Songhwai Oh) 대한전기학회 2021 대한전기학회 학술대회 논문집 Vol.2021 No.10
본 논문에서는 통합된 maximum entropy regularization RL 프레임워크인 Distributional Tsallis Actor Critic (DTAC)를 제안한다. DTAC는 value function의 분포와 Tsallis Entropy maximization을 통해 value와 action의 다양성을 보장하고 현재의 value function을 정확하게 예측할 수 있도록 한다. DTAC에 CVaR 등의 risk sensitive network을 적용했을 경우 exploration을 더 안전하게, 혹은 더 적극적으로 할 수 있도록 조정이 가능하다. MuJoCo environment에서 Hopper-v2, HalfCheetah-v2, Humanoid-v2 등의 agent들에 실험하여 다양한 entropic index에 따른 학습된 behavior의 차이를 확인하였다.
q-Gaussian Mixture를 통한 자율주행 안정성 보장
이건민(Gunmin Lee),오성회(Songhwai Oh) 대한전기학회 2021 대한전기학회 학술대회 논문집 Vol.2021 No.10
자율주행의 안전성 문제는 얼마나 강조해도 부족하지 않을 만큼 매우 중요한 요소이다. 이런 문제를 해결하기 위해서 많은 노력이 존재 해왔는데, 그 방법중 하나는 Gaussian의 mixture를 통한 mixture density network에서 불확실성을 추정하여 일정 수준 이상으로 불확실성이 높아지면, 안전주행상태로 진입하는 방법을 사용한다. 하지만, 이 불확실성의 절댓값은 인공신경망 안에 들어가는 차원과 데이터 자체의 절댓값에 의해서 정해지곤 한다. 우리는 Gaussian의 확장이라고 볼 수 있는 분포인 q-Gaussian을 Gaussian 대신 대체하여 사용하였다. 이 q 값을 변화시키면서 우리가 원하는 크기의 불확실성 값을 사용할 수 있도록 할 수 있다. 이 값을 이용하여, 우리는 일정 수준 이하의 예측에 대한 신뢰도가 나타날 때에는 안전주행 모드로 변환시키고, 일정 수준 이상의 신뢰도가 나타날 때에는 딥러닝 기반 방법을 사용하여 안전하게 움직이는 것을 성공하였다.