최근 인구 증가 및 세계 경제가 발전함에 따라 해양 환경에 관해 관심이 높아지고 있다. 이에 따라, 자원 개발과 수중 환경 탐사를 위해 수중 로봇에 대한 연구와 개발도 자연스럽게 증가하...
최근 인구 증가 및 세계 경제가 발전함에 따라 해양 환경에 관해 관심이 높아지고 있다. 이에 따라, 자원 개발과 수중 환경 탐사를 위해 수중 로봇에 대한 연구와 개발도 자연스럽게 증가하고 있다. 그 중, 생체모방 유영로봇 (Bio-inspired autonomous underwater vehicles, BI-AUVs)은 자율 무인 잠수정 (Autonomous underwater vehicles, AUVs)과 달리 수중 생명체의 활동 메커니즘이나 신체 구조를 모방함으로써 민첩한 기동성과 추진 효율성을 가지기 때문에 점차 각광받고 있다. 그러나, 생체모방 유영로봇의 지느러미 관절 구조와 유선형 몸체 때문에 비선형적인 힘이 발생하고, 기존 모터 제어 방식으로는 어려움이 발생하게 된다. 이로 인한 유체-구조물 간 상호작용과 환경 외란에 의한 수학적 모델링을 통해 동역학 방정식을 구성하는 데 한계가 있다. 결과적으로, 모델 부정확성과 환경 불확실성에 민감한 기존의 전통적인 제어기는 강건한 제어 설계에 대해 어려움을 갖는다. 심층강화학습은 에이전트가 환경에서 직접 상호작용을 통해 최적의 제어 정책을 학습할 수 있으므로, 이러한 한계를 극복하기 위한 대안으로 제시된다. 그러나 심층강화학습은 모델을 학습하는 데 대규모 데이터가 필요하므로 시간 비용을 절약하고, 실험 수행 안정성을 높이기 위해 시뮬레이션에서 주로 학습된다. 시뮬레이션에서 학습된 모델은 불완전한 동역학, 센서 잡음, 액추에이터 지연 현상 등으로 인해 시뮬레이션과 실제 환경 사이의 간극이 발생하여 학습된 모델의 성능이 예상보다 저하되는 문제가 있다. 본 연구에서는 Sim2Real 문제를 해결하기 위해 두 가지 학습 요소가 반영된 심층강화학습 기반 경로 추종 제어기 설계를 수행하였다. 첫째, 모델 학습 과정에서 해류를 고려하였으며 둘째, 도메인 랜덤화 기법 적용을 통해 지느러미와 몸체에 대한 동역학 제원을 무작위화하고 커리큘럼 학습을 통해 강건한 경로 추종 제어기를 설계하고자 하였다. 도메인 랜덤화 기법을 통해 생체모방 유영로봇의 지느러미와 관절에 대한 계수, 유체력 미계수를 포함하여 매 학습 과정마다 일정 범위 내에서 무작위로 조절하는 방식으로 적용하였다. 그리고 커리큘럼 학습 과정을 통해 초기 단계에서는 경로 추종을 위한 안정적인 자세 학습을 배우고, 후기 학습 과정에서 복잡한 수중 환경에서도 어려운 경로 추종하는 방법을 학습할 수 있도록 유도하였다. 이를 통해 시뮬레이션에서 학습된 모델이 Zero-shot으로 전환할 수 있는 학습 방안 설계에 기여하고자 한다. 시뮬레이션 검증 결과는 조류가 있는 상황에서도 심층강화학습 기반 모델이 PID 모델에 비해 임무 수행 시간을 약 50.2초 단축하고 경로 이탈 오차 (Cross-track error, CTE)를 약 0.13 미터 만큼 감소한 결과를 통해 강건한 경로 추종 성능을 보여준다. 이를 통해 제안된 방법이 복잡한 실해역 환경에서도 목표 경로 추종을 달성하여 생체모방 유영로봇의 해양 탐사 등에 대해 실용적인 방안을 제시한다.