산업 자동화와 센서 기술의 발전으로 다양한 산업 분야에서 대규모 시계열 데이터를 활용한 이상치 탐지의 중요성이 더욱 부각되고 있다. 그러나 시계열 데이터의 라벨링 (labeling)에는 높은 ...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T17184769
서울 : 고려대학교 대학원, 2025
2025
한국어
시계열 이상치 탐지 ; 시계열 분석 ; 능동학습
서울
56 p ; 26 cm
지도교수: 김성범
I804:11009-000000289805
0
상세조회0
다운로드산업 자동화와 센서 기술의 발전으로 다양한 산업 분야에서 대규모 시계열 데이터를 활용한 이상치 탐지의 중요성이 더욱 부각되고 있다. 그러나 시계열 데이터의 라벨링 (labeling)에는 높은 ...
산업 자동화와 센서 기술의 발전으로 다양한 산업 분야에서 대규모 시계열 데이터를 활용한 이상치 탐지의 중요성이 더욱 부각되고 있다. 그러나 시계열 데이터의 라벨링 (labeling)에는 높은 비용과 어려움이 따르기 때문에, 라벨을 사용하지 않는 비지도 학습 (unsupervised learning) 방법이 널리 채택되고 있다. 이러한 접근은 실용적이지만, 정상 데이터에 포함된 노이즈 (noise)와 정상과 유사한 패턴 (pattern)을 가지는 비정상 데이터로 인해 비지도 학습된 모델의 탐지 성능이 저하되는 문제가 빈번하게 발생한다. 본 연구는 능동 학습 (active learning)을 기반으로 한 프레임워크를 제안하여, 비지도 학습 모델이 탐지 성능이 낮은 샘플을 추가적으로 학습함으로써 모델의 성능을 향상시키고자 한다. 구체적으로는, 노이즈가 포함된 정상 데이터와 정상과 유사한 비정상 데이터의 시간적 패턴을 더 잘 포착하기 위해 두 가지 쿼리 샘플링 (query sampling) 전략을 사용한다: (1) 이상치 점수가 가장 높은 상위 k개의 샘플을 선택하는 방법과 (2) 다양한 점수 구간에서 무작위로 샘플을 추출하는 방법. 추가적인 지도 학습 과정에서는 마스킹된 시계열 재구축 피드백 전략 (masked time series reconstruction feedback strategy)을 도입하여, 비지도 학습 모델이 부분적으로 마스킹된 쿼리를 재구성함으로써 시간 상관성 (temporal dependency)에 대한 이해도를 증진시킨다. 그에 더해, 학습 과정에서 미니맥스 (minimax) 전략을 사용하여 정상과 비정상 샘플을 차별적으로 처리하여 모델은 시간적 의존성을 더 효과적으로 학습하고, 노이즈가 있는 정상 데이터와 정상과 유사한 비정상 데이터를 더욱 정확하게 탐지할 수 있게 된다. 본 연구에서 제안한 프레임워크는 기존의 비지도 학습 기반 재구성 모델에 쉽게 통합될 수 있으며, 이를 검증하기 위해 네 개의 다변량 시계열 데이터셋과 일곱 개의 비지도 학습 모델을 사용하여 총 28개의 테스트 케이스를 수행하였다. 실험 결과를 통해 기존 백본 (backbone) 모델 대비 12.39\%의 AUC 향상을 확인하였으며 제안 프레임워크가 비지도 학습 모델의 탐지 성능을 개선하는 데 효과적임을 입증하였다.
다국어 초록 (Multilingual Abstract)
Advancements in industrial automation and sensor technologies have underscored the importance of anomaly detection using large-scale time series data across industries. Due to the high costs and challenges of labeling, unsupervised learning, which ope...
Advancements in industrial automation and sensor technologies have underscored the importance of anomaly detection using large-scale time series data across industries. Due to the high costs and challenges of labeling, unsupervised learning, which operates without labeled data, is widely used. However, its performance often suffers from noise in normal data and abnormal data resembling normal patterns. To overcome these challenges, we present a framework that employs active learning to further train the unsupervised model. To more effectively capture temporal patterns of noisy normal and near-normal anomalies, we employ two query sampling strategies for selecting samples for additional supervised learning: (1) selecting the top k samples with the highest anomaly scores (2) randomly sampling from different score intervals. For further supervised learning, we introduce a masked time series reconstruction feedback strategy, where the unsupervised model reconstructs partially masked queries to improve its understanding on temporal dependencies. Additionally, a minimax strategy, which handles normal and abnormal samples differently, assists in learning complex patterns in noisy normal and near-normal anomalies. The effectiveness of proposed framework has been validated through 28 test cases involving four multivariate time-series datasets and seven unsupervised models. Experimental results demonstrate 12.39\% increase in AUC over the original backbone models, validating that the framework readily integrates with existing unsupervised reconstruction models to enhance detection performance.
목차 (Table of Contents)