본 논문은 위협 지도를 기반으로 한 군집 드론 간 회피 및 교전 기동의 최적화를 위해, 강화학습 기반의 정책 보정과 제어 장벽 함수를 이용한 안전 보장 필터링 기법을 제안한다. 먼저, 위협...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A110108274
2025
Korean
KCI등재
학술저널
1873-1879(7쪽)
0
상세조회0
다운로드본 논문은 위협 지도를 기반으로 한 군집 드론 간 회피 및 교전 기동의 최적화를 위해, 강화학습 기반의 정책 보정과 제어 장벽 함수를 이용한 안전 보장 필터링 기법을 제안한다. 먼저, 위협...
본 논문은 위협 지도를 기반으로 한 군집 드론 간 회피 및 교전 기동의 최적화를 위해, 강화학습 기반의 정책 보정과 제어 장벽 함수를 이용한 안전 보장 필터링 기법을 제안한다. 먼저, 위협도 가중치가 반영된 공간 및 시간 보상함수를 설계하고 제어 장벽 함수를 이용해 개별 드론의 정책을 학습하였다. 이후 학습된 정책의 제어 명령은 안전 필터르 통해 충돌 및 제한 위반을 사전에 방지하도록 조정하였다. 제안하는 기법은 시뮬레이션을 통해 다수의 드론이 위협 밀집 지역을 회피하면서 효율적인 교전 궤적을 생성함을 확인하였다. 본 연구는 강화학습 기반의 최적 정책과 제어 안정성 필터링의 융합을 통해, 군집 드론의 자율 교전에서 안전성과 효율성을 동시에 확보할 수 있음을 보여준다.
다국어 초록 (Multilingual Abstract)
This paper presents a reinforcement-learning-based policy correction and safety-assured filtering method for optimizing evasion and engagement maneuvers among drone swarms using a threat map. A spatio-temporal reward function, weighted by local threat...
This paper presents a reinforcement-learning-based policy correction and safety-assured filtering method for optimizing evasion and engagement maneuvers among drone swarms using a threat map. A spatio-temporal reward function, weighted by local threat levels, is designed to guide the learning process, and individual drone policies are trained under safety constraints enforced by control barrier functions (CBFs). The control commands produced by the learned PPO policy are subsequently refined through a CBF-based safety filter to prevent collisions, constraint violations, and unsafe maneuvers during cooperative operations. Simulation results demonstrate that the proposed framework enables multiple drones to avoid high-threat regions while generating tactically efficient engagement trajectories under dynamic and uncertain conditions. The study shows that integrating RL-based optimal policy generation with CBF-based safety filtering offers both performance and formal safety guarantees, providing a practical and scalable approach for autonomous swarm-level evasion and engagement.
뇌종양 MRI 분류를 위한 딥러닝 모델 성능 비교와 Grad-CAM 기반 설명 가능성 분석
제어 흐름 그래프 기반 그래프 신경망을 이용한 비실행 경로 예측 기법
제주 관광에서의 도심항공교통(UAM) 수용: 통합 기술 수용 모델