http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
양동수(Dongsu Yang),임정동(Jungdong Lim),이원부(Wonbu Lee),박주영(Jooyoung Park) 한국지능시스템학회 2013 한국지능시스템학회 학술발표 논문집 Vol.23 No.2
최근 들어, 근사적 동적계획법(approximate dynamic programming)은 확률론적 최적제어(stochastic optimal control)와 기계학습(machine learning) 등의 분야에서 주요한 역할을 수행하고 있다. 최근에 등장한 근사적 동적계획법을 위한 주요 경향 중 하나로는 반복적 벨만 부등식(iterated Bellman inequalities), 선형행렬부등식(linear matrix inequalities), SDP(semi-definite programming) 등의 개념을 이용한 풀이를 들 수 있는데, 이러한 경향 중에서도 반복적 근사 가치함수(iterated approximate value funcitons)를 활용하는 방법은 그 범용성과 계산의 용이성 등으로 인하여 장차 다양한 분야에서 우수한 성과를 보여줄 것으로 기대된다. 본 논문에서는 반복적 근사 가치함수를 활용한 근사적 동적계획법에 대한 최신 이론을 간단한 응용 예제와 함께 소개하고, 이 이론을 로봇 주행분야에 적용하는 문제를 고려해본다
민대홍(Daehong Min),정근우(Keun-woo Jung),권기영(Ki-young Kwon),박주영(Jooyoung Park) 한국지능시스템학회 2011 한국지능시스템학회논문지 Vol.21 No.6
주행문제는 불확실한 외란의 영향을 받는 이동로봇 등의 시스템에 대하여 각종 제약조건들을 만족하도록 하는 제어 입력을 결정하는 과제를 포함한다. 이러한 과제는 제약조건을 갖는 확률 제어 문제로 모델링될 수 있다. 이러한 종류의 제어 문제를 풀기 위하여, 최적 가치함수 개념에 의존하는 동적 계획법의 활용을 시도해볼 수 있다. 하지만, 대부분의 실제 문제에서 이러한 시도는 많은 어려움, 예컨대, 시스템의 완벽한 모델이 알려지지 않거나, 최적 제어정책을 구하기 위한 계산이 불가능하거나, 수없이 많은 계산 자원을 필요로 하는 등의 문제점을 안겨줄 수 있다. 이러한 동적 계획법의 어려움을 극복하기 위한 전략으로, 근사적 가치함수에 의존하여 준최적 제어정책을 구하는 근사적 동적 계획법을 사용할 수 있다. 본 논문에서는 최근에 제시된 근사 동적 계획법들을 복잡한 제약조건을 갖는 주행 문제에 적용하여 보고 그 결과로 얻어지는 성능 특성을 관찰해 본다. Navigation problems include the task of determining the control input under various constraints for systems such as mobile robots subject to uncertain disturbance. Such tasks can be modeled as constrained stochastic control problems. In order to solve these control problems, one may try to utilize the dynamic programming(DP) methods which rely on the concept of optimal value function. However, in most real-world problems, this trial would give us many difficulties; for examples, the exact system model may not be known; the computation of the optimal control policy may be impossible; and/or a huge amount of computing resource may be in need. As a strategy to overcome the difficulties of DP, one can utilize ADP(approximate dynamic programming) methods, which find suboptimal control policies resorting to approximate value functions. In this paper, we apply recently proposed ADP methods to a class of navigation problems having complex constraints, and observe the resultant performance characteristics.
근사적 동적 계획법과 모델 예측 제어를 이용한 로봇 주행에 관한 고찰
권기영(Ki-young Kwon),양동수(Dong-su Yang),박주영(Jooyong Park) 한국지능시스템학회 2012 한국지능시스템학회 학술발표 논문집 Vol.22 No.2
이동로봇을 원하는 위치로 이동시키기 위해서는 로봇의 현재 위치와 주위환경에 관한 정보를 구하고 이를 처리하여 올바른 경로를 계획하는 과정이 중요하다. 이러한 주행과정은 예측 불가능한 외란(disturbance)의 유입과 복잡한 환경으로 인한 한계 때문에 제약조건이 있는 확률 제어 문제로 표현 될 수 있다. 이와 같은 확률 제어 문제의 최적 정책(optimal policy)을 구하기 위해 가치함수(value function)를 최적화하는 방법을 사용하는 동적 계획법(dynamic programming)을 적용해 최적의 결과를 얻을 수 있지만, 실제적인 문제에서는 연산이 불가능하거나 지나치게 많은 연산량을 필요로 하는 등 많은 난관에 부딪힐 가능성을 안게 된다. 본 논문에서는, 이러한 동적 계획법의 단점을 극복하기 위해 최근에 소개된 바 있는 근사적 동적 계획법과 모델 예측 제어를 이용하여 가치함수를 근사시켜 복잡한 제약 조건을 갖는 주행 문제에 적용시켜 보고자한다 .