산업 현장에서 회전기계의 이상 징후를 조기에 탐지하고 신뢰성 있는 유지보수 의사결정을 내리기 위한 상태기반 진단 기법의 중요성은 꾸준히 증가하고 있다. 특히 베어링과 같은 회전체 ...
산업 현장에서 회전기계의 이상 징후를 조기에 탐지하고 신뢰성 있는 유지보수 의사결정을 내리기 위한 상태기반 진단 기법의 중요성은 꾸준히 증가하고 있다. 특히 베어링과 같은 회전체 부품의 고장은 설비 가동 중단과 안전 사고로 이어지므로, 센서 신호를 활용한 고장 분류는 예지보전(Prognostics and Health Management; PHM)의 핵심 단계로 여겨진다. 최근 진동 신호와 같은 시계열 데이터로부터 심층신경망을 이용해 특징을 추출하는 방법들이 높은 분류 성능을 보여 왔으나, 이러한 기법은 다량의 레이블 정보가 있는 데이터를 필요로 하기 때문에 현실에 적용하기에 한계가 존재한다. 실제 산업 현장에서는 레이블 정보는 고장 발생의 희소성, 전문 인력의 판독 비용, 설비 정지에 따른 경제적 손실 등으로 인해 극히 제한적이다. 이로 인해 레이블 정보가 적은 상황에서 견고하게 작동하는 고장 진단 모델을 개발하는 것이 중요한 연구 과제로 대두되고 있다.
이러한 문제를 해결하기 위한 방향으로, 최근에는 준지도 학습(Semi-supervised learning, SSL)을 활용하여 소량의 레이블 데이터와 다량의 비레이블 데이터를 함께 사용하는 방법이 활발히 연구되고 있다. 전통적인 SSL 기법들은 주로 모델의 예측 신뢰도가 일정 임계값을 넘는 비레이블 데이터에 대해 임시 레이블(pseudo-label)을 부여하고, 이를 추가적인 지도 학습 데이터로 사용함으로써 성능을 향상시켰다. 그러나 이와 같은 임계값 기반 임시 레이블링 기법은 잘못된 임시 레이블이 반복적으로 강화되는 확증 편향(confirmation bias) 문제를 야기할 수 있으며, 학습 초기에 신뢰도가 낮은 비레이블 데이터는 대부분 학습에 활용되지 못한 채 버려지는 비효율성이 존재한다. 특히 산업용 지동 데이터는 잡음, 운전 조건 변화 등으로 인해 분포가 복잡하고 불확실성이 큰 경우가 많아, 단순 신뢰도 임계값에 기반한 SSL은 잠재 특징 공간 구조를 왜곡시키고 일반화 성능을 저해할 가능성이 크다.
본 논문에서는 이러한 한계를 극복하고 레이블 제약이 심한 환경에서 베어링 고장 분류 성능을 향상시키기 위하여, 소프트 트리플렛 손실(soft triplet loss)을 중심으로 하는 새로운 준지도 고장 진단 프레임워크인 SoMER(Soft Metric learning-based entropy regularization)를 제안한다. SoMER는 우선 1차원 진동 신호에 단시간 푸리에 변환(Short-Time Fourier Transform; STFT)을 적용하여 시간–주파수 영역의 스펙트로그램을 생성하고, 이를 2차원 합성곱신경망(convolutional neural network; CNN)에 입력함으로써 고장별 특성 주파수 대역과 시간적 패턴을 동시에 학습하도록 한다. 이 과정에서 시간·주파수 마스킹과 MixUp 증강을 함께 적용하여 제한된 레이블 데이터의 다양성을 확장하고, 보다 매끄러운 결정 경계를 갖는 잠재 특징 공간을 형성하도록 유도한다. 비지도 학습 단계에서는 비레이블 데이터의 예측 확률 분포에 대한 엔트로피 최소화(entropy minimization)를 통해 결정 경계가 데이터 분포의 저밀도 영역을 통과하도록 유도하고, 동시에 비레이블 데이터의 예측 확률에서 앵커 클래스 확률을 양성도(positive degree), 나머지 클래스 확률의 최댓값을 음성도(negative degree)로 정의하는 소프트 트리플렛 손실을 도입하여 레이블이 없는 데이터도 잠재 특징 공간 구조 학습에 지속적으로 기여하도록 설계하였다. 일정 수준 이상의 신뢰도를 갖는 비레이블 샘플에 대해서는 일시적으로 원-핫 인코딩된 임시 레이블을 부여함으로써, 학습 후반부에는 보다 명확한 클래스 경계가 형성되도록 하였다.
제안된 방법의 성능을 검증하기 위하여, 연구실에서 구축한 베어링 실험 장치에서 수집한 진동 데이터와 더불어 Case Western Reserve University(CWRU), Huazhong University of Science and Technology(HUST), Paderborn University(PU)의 세 가지 공개 베어링 진동 데이터셋을 대상으로 실험을 수행하였다. 정상 상태와 다양한 단일·복합 결함 클래스를 포함한 환경에서 클래스당 레이블 수를 25, 10, 5, 2개로 설정하고, 기존 방법론과의 비교를 통해 성능을 평가하였다. 그 결과 SoMER는 모든 데이터셋과 레이블 비율에서 우수한 성능을 보였으며, 특히 클래스당 5개 이하의 극단적인 환경에서 뚜렷한 성능 향상을 확인하였다. 또한 t-SNE를 활용한 잠재공간 시각화 결과, 제안 방법은 다른 기법에 비해 클래스 간 경계가 보다 명확하고 클래스 내 클러스터가 보다 밀집된 구조를 형성하는 것으로 나타났다.
종합하면, 본 논문은 (1) STFT 기반 스펙트로그램과 마스킹·MixUp 증강을 결합하여 모델의 일반화 성능을 향상시키고, (2) 비레이블 데이터의 예측 확률을 활용하여 연속적인 양·음성 기여도를 부여하는 소프트 트리플렛 손실을 도입한 준지도 고장 진단 프레임워크를 구축함으로써 기존 임시 레이블링 기반 SSL 기법의 확증 편향과 데이터 활용 비효율 문제를 완화하였으며, (3) 다양한 데이터셋을 통해 극단적인 환경에서도 우수한 분류 성능과 구조화된 잠재 특징 공간을 형성함을 보였다. 제안된 기법은 레이블 확보가 어려운 다양한 산업 설비 진단 문제에 폭넓게 적용 가능하며, 향후 도메인 적응 기법, 심각한 클래스 불균형 문제와의 연계를 통해 보다 현실적인 PHM 환경으로 확장될 수 있을 것으로 기대된다.