1. 서 론
이상 탐지(Anomaly Detection)는 발전, 제조, 운송 등 다 양한 산업 분야에서 기계 시스템의 안정성과 효율성을 보 장하는 데 중요한 역할을 한다. 산업 환경에서 기계 시스 템은 복잡한 운전 조건과 다양한 부하 하에서 작동하며, 이 과정에서 발생하는 이상은 성능 저하, 장비 손상, 심지 어 <Figure 1>과 같이 안전사고로 이어질 수 있다. 진동, 소음, 또는 열적 불균형과 같은 이상 징후는 시스템의 잠 재적 고장을 나타내며, 이러한 이상을 조기에 탐지하지 못 할 경우 고가의 장비 손상뿐만 아니라 생산 중단, 심각한 경우에는 화재나 인명 사고로 이어질 수 있다. 즉, 시험평 가 및 운용 과정에서 이상 상황을 효과적으로 모니터링하 고 진단하는 기술은 산업 응용에서 필수적이다.
따라서, 다양한 산업 분야에서 사용되고 있는 기계 시스 템에 대한 시험평가 진행 중에 발생할 수 있는 이상 상황 의 탐지가 중요하며, 시험평가 시스템을 효율적으로 진단 모니터링하기 위해 인공지능 기반의 방법론들이 활용되고 있다[5, 6, 7, 11, 15, 17, 22]. 그러나 이러한 방법론들은 주로 특정 운전 조건에 최적화된 모델을 제시하였으며, 다 른 데이터셋에 대한 일반화 검증이 부족하여 다양한 산업 환경에의 적용이 제한적이다.
이러한 한계들을 극복하기 위한 방법 중 하나로 전이 학습을 활용할 수 있다. 전이 학습은 사전 학습된 모델의 특징을 재사용하여 데이터 부족 문제를 완화할 수 있고, 다양한 고장 유형과 운전 조건에서 일반화 성능을 향상시 킬 수 있다. 이를 통해 다양한 센서 유형에 적용 가능한 모델의 개발에 기여하고 있다[25, 26]. 예를 들어, 사전 학 습된 신경망의 하위 레이어에서 추출된 일반화된 특징은 소량의 데이터로도 고장 진단 모델을 효과적으로 학습시 킬 수 있으며, 이는 산업 응용에서 특히 유용하다[26]. 그 러나 전이 학습을 활용한 연구들도 여전히 한계를 가지고 있다. Habbouche et al.[10], Sunal et al.[25], Seo[23], Kumar et al.[16]은 기계 설비 이상 진단을 위해 전이 학습 을 이용한 진단 방법을 제안하였으나, 이들 연구는 특정 운전 조건이나 고장 유형에 초점이 맞추어져 있어 다양한 산업 환경에서의 일반화에는 한계가 있다. Xiao et al.[26] 은 도메인 적응 기법을 적용해 진동 신호 기반 고장 진단 을 제시하였으나, Deep Neural Network(DNN)의 고비용의 컴퓨팅 자원 요구, 실험실 데이터와 산업 데이터 간 차이 로 인한 성능 저하를 우려하였다. Su et al.[24]은 심층 준 지도 전이 학습(Sa-DBA)을 제안하여 CWRU, PHM, DPS 데이터셋에서 높은 정확도를 달성했지만, 클래스 수 일치 와 소스 및 타겟 도메인 데이터의 균형 요구로 인해 적용 범위가 제약될 수 있으며, Bernico et al.[3]은 소스와 타겟 도메인 간의 도메인 유사성 부족은 전이 학습의 성능 저하 를 유발할 수 있고, 이를 해결하기 위해 보다 많은 타겟 데이터와 세밀한 미세조정이 필요하다고 주장하였다.
따라서, 본 연구에서는 전이 학습 기반 이상 탐지 모델 을 제안하고, Case Western Reserve University(CWRU) 베 어링 데이터셋[4]의 1750RPM, 1772RPM, 1797RPM 데이 터셋을 각각 소스와 타겟 데이터로 교차 적용하여 모델의 성능을 검증한다. 그리고, Hanoi University of Science and Technology(HUST) 베어링 데이터셋[12]과 Sumair–Umar Bearing Fault(SUBF) 데이터셋 v2.0[2], 모터 다이나모 시 험에서 수집한 마이크로폰 센서 데이터셋을 타겟으로 적 용하여 제안 방법의 도메인 유사성이 부족한 상황에서도 효과적인 이상 탐지가 될 수 있음을 보여준다.
전이 학습 모델 개발을 위해, 먼저 STFT를 통해 CWRU 시계열 데이터를 스펙트로그램으로 변환하여, 2D 행렬 형 태의 시간-주파수 특성을 추출한다. 변환된 데이터는 Convolutional Autoencoder(CAE)의 입력 데이터로 사용되 며, 데이터중 전반부 80%를 학습용으로 사용하여 CAE 모 델을 사전 훈련(pre-train)하고, 나머지 20%를 테스트용으 로 활용한다. 사전 학습된 CAE에서 인코더를 추출하여 새 로운 데이터셋에 대한 사전 학습 모델로 사용한다. 새로운 데이터셋은 STFT를 통해 스펙트로그램으로 변환된 후, 사 전 학습된 인코더에 입력되어 저차원 잠재 벡터를 생성한 다. 이 잠재 벡터는 DNN의 입력 데이터로 사용되며, DNN 의 출력층 직전 penultimate layer에서 생성된 특징은 이상 탐지를 위한 분류 모델의 입력으로 사용된다.
본 논문의 구성은 다음과 같다. 2장에서는 본 연구에서 사용한 데이터셋을 소개하고, 3장에서는 STFT를 활용한 시계열 데이터의 시간-주파수 영역 변환 및 데이터 전처리 과정을 다룬다. 4장에서는 전이 학습 기반 이상 탐지 모델 을 제시하고, 이 모델이 일반화 성능과 도메인간 유사성이 부족한 상황에서도 효과적으로 이상 탐지가 가능함을 보 여준다. 마지막으로, 5장에서는 제안된 방법의 한계와 향 후 연구 방향을 제시하며 결론을 도출한다.
2. 데이터셋 소개
본 연구에서는 시계열 데이터를 활용하여 이상 상황을 탐지하기 위해 CWRU 데이터셋을 이용하여 사전 학습 모 델 개발 및 일반화 능력을 검증하고, HUST, SUBF v2.0, 모터 다이나모 시험 데이터셋을 이용하여 개발된 모델의 도메인간 유사성 부족 문제를 검증하였다. CWRU 데이터 셋은 모터 베어링의 정상 및 결함 상태에서 수집된 진동 데이터를 제공하며, 기계적 결함 진단 연구에서 널리 사용 되는 표준 데이터셋으로 간주된다. 이 데이터셋은 결함 탐 지 및 분류 모델의 학습과 검증에 적합하며, <Table 1>과 같이 정상 상태(Normal)와 세 가지 결함 유형(내부 레이스 결함(Inner Race Fault), 외부 레이스 결함(Outer Race Fault), 볼 결함(Ball Fault))을 포함하고 있다. HUST 베어 링 데이터셋은 Hanoi University of Science and Technology 에서 진동 신호를 사용하여 개발된 데이터셋으로, <Table 2>와 같이 정상 상태와 세 가지 결함 유형(내부 레이스 결 함, 외부 레이스 결함, 볼 결함)을 포함하고 있다. 또한 SUBF 데이터셋 v2.0은 소음 신호 기반 베어링 고장 진단 연구를 위한 데이터셋을 포함하고 있으며, <Table 3>과 같 이 정상 상태, 내부 레이스 결함, 외부 레이스 결함으로 구성되어 있다.
또한 본 연구에서 제시하는 전이 학습 모델이 도메인간 유사성이 부족한 상황에서의 적용 가능성을 검증하기 위 해 <Figure 2>와 같이 다이나모 모터 시험에서 마이크로폰 센서를 이용한 소음 데이터를 수집하였다. 다이나모 시험 은 모터 고정용 볼트의 토크를 <Table 4>에 제시되어 있는 것과 같이 변경하면서 진행하였다. 체결 토크가 낮을 경우 (20kgf·㎝, Loosen 이상상태)에는 모터의 진동이 증가하고, 반대로, 체결 토크가 높은 경우(80kgf·㎝, Alignment 이상 상태)에는 모터축의 정렬 이상이 발생한다. 본 연구에서 사용된 다이나모와 모터의 기술 사양은 <Table 5>에 제시 하였으며, <Table 6>은 사용된 마이크로폰 센서의 기술 사 양을 보여주고 있다. <Figure 3>은 체결 토크 20, 60, 80kgf·㎝ 에서의 소음 시계열 그래프를 보여주고 있다.
3. 신호 처리 및 특징 추출
진동, 전류, 소음과 같은 아날로그 신호는 주파수 영역 으로 변환하여 시계열 데이터 분석을 통해 패턴을 분석하 는 접근법이 널리 사용되어 왔다[8, 20]. 푸리에 변환 (Fourier Transform)을 통해 신호를 주파수 영역으로 변환 하면 주파수 성분을 분석할 수 있지만, 시간에 따른 변화 정보는 손실되는 문제점이 있다. 반면, 시간-주파수 분석 은 신호의 주파수 성분과 시간적 변화를 동시에 포착할 수 있어 모터 고장 진단에 효과적[1]이며, 대표적으로 STFT를 이용한 방법이 있다[27]. STFT는 시간 영역 신호 를 시간-주파수 공간으로 변환할 수 있는 간단하고 적용하 기 쉬운 신호 변환 방법[19]이며, STFT 방법을 통해 얻은 신호의 시간-주파수 분포는 변조 특성, 즉 에너지 분포의 변화 특성을 보여준다. 따라서, 시간-주파수 영역에서 에 너지 분포 비교를 통해 이상 상태를 검출할 수 있다[21].
STFT는 시계열 신호를 일정한 시간 간격으로 분할하여 만들어지는 윈도우의 크기는 한 번에 처리하는 데이터의 시간 범위를 나타내며, 각 윈도우에 대해 푸리에 변환을 수행함으로써 시간-주파수 영역의 특성을 추출한다. 윈도 우 크기는 STFT의 시간 해상도와 주파수 해상도에 직접 적인 영향을 미치며, 시간과 주파수 간에는 상호 트레이드 오프 관계가 존재한다. 짧은 윈도우는 시간적 변화에 민감 하여 빠른 신호 변화를 포착하는 데 유리하지만, 데이터의 양이 적어 주파수 해상도가 낮아져 주파수 성분의 세부적 인 구분이 어려워질 수 있다. 예를 들어, 짧은 윈도우는 모터의 급격한 부하 변화를 탐지하는 목적에는 적합하지 만, 주파수 스펙트럼의 세밀한 구조를 분석하기에는 한계 가 있다. 반대로, 긴 윈도우는 더 많은 데이터를 포함하므 로 주파수 해상도가 높아져 주파수 성분을 정밀하게 분석 할 수 있지만, 시간 해상도가 낮아져 신호의 순간적인 변 화 탐지에 한계가 있을 수 있다. 분석을 위해 모든 데이터 셋의 신호는 <Figure 4>와 같이 윈도우 크기 1,024, 오버랩 비율(overlap) 0.5로 설정하였다. <Figure 5>는 CWRU 데 이터셋(1750RPM)의 시계열 데이터를 STFT를 통해 스펙 트로그램으로 변환한 2D 행렬 시각화를 보여주고 있다.
4. 이상 탐지 모델 개발 및 검증
본 연구에서는 <Figure 6>과 같이 CWRU 베어링 데이 터셋 기반의 전이 학습 이상 탐지 모델을 제시하였다. 그 림의 사전 학습(Pre-train) 단계에서는 CWRU 데이터셋의 시계열 데이터를 STFT를 통해 2D 행렬 형태의 스펙트 로그램을 생성한다. 이때, 계산 효율성과 메모리 사용량 을 고려하여 단일 채널 데이터로 변환하고, 정상 및 비정 상 상태에 대해 라벨링을 수행한 후, 스펙트로그램 특성 치를 0과 1 사이로 값으로 정규화한다. 정규화된 스펙트 로그램 데이터는 CAE의 입력으로 사용되며, 인코더-디 코더 구조를 통해 입력 데이터를 저차원 잠재벡터로 압 축 및 재구성하여 사전 학습을 수행한다. 사전 학습 시 인코더는 <Table 7>에 기술된 아키텍처와 같이 Conv2D 와 MaxPooling2D를 거치면서 차원을 축소하는 역할을 담당하고, 디코더는 UpSampling2D와 Conv2D를 통해 원 래 크기로 복원하는 역할을 담당한다. 각 층의 활성화 함 수로는 Gradient(기울기) 소실 문제를 해결할 수 있는 ‘ReLu’를 사용하였으며, 최적화 알고리즘(optimizer)은 Momentum과 RMSProp을 결합한 ‘adam’을 적용하였다. ‘adam’은 효율적인 학습으로 메모리 요구사항이 적으며, 대량의 데이터와 다차원의 파라미터를 갖는 문제에 적합 하다고 알려져 있다[14].
<Figure 6>에 표시된 미세조정(Fine-tuning) 단계에서는 사전 학습 모델에서 도출된 CAE 인코더를 추출하여 이상 탐지 모델을 구성하기 위한 layer로 삽입한다. 그리고, 타 겟 시계열 데이터는 STFT를 통해 스펙트로그램으로 변환 및 정규화하여 삽입된 인코더에 입력 데이터로 사용한다. 여기서 입력 데이터를 이용하여 인코더의 6개 레이어 중 후반 3개 레이어는 미세조정하며, 전반 3개 레이어는 고정 해서 사전 학습된 일반화된 특징을 유지하도록 한다. 입력 데이터를 통해 도출된 저차원 잠재벡터는 DNN의 입력으 로 사용되어 penultimate layer에서 특징을 추출한다.
마지막으로, <Figure 6>에 표시된 이상 탐지(Anomaly Detection) 단계에서는 DNN penultimate layer에서 추출된 특징을 Random Forest(RF)와 eXtreme Gradient Boosting (XGB) 등의 입력으로 사용하여 이상 여부를 판단한다. Grinsztajn et al.[9]에 따르면 DNN 대신에 Tree 기반의 RF와 XGB 분류기를 사용하는 이유는 트리 기반 모델이 데이터 특성의 불연속적 패턴을 효과적으로 포착하고, 축에 평행한 결정 경계를 생성하여 복잡한 비선형 변환 없이도 우수한 분류 성능을 제공하므로 본 연구에서는 이를 이상 탐지 분류 모델로 채택하였다.
일반화 능력을 검증하기 위해 기존 연구[13, 18]에서 수 행한 컨볼루셔널 분해와 도메인 적대적 전이 학습을 통한 교차 검증 결과 및 AdaBN(Adaptive Batch Normalization) 기반 전이 학습 방법과 비교하면, 본 연구에서 제시한 모 델을 이용한 CWRU 데이터셋에 대한 이상 탐지 모델의 교차 검증 결과는 <Table 8>에 나타난 바와 같이, 모든 시 나리오에서 기존 연구에 비교하여 탁월함을 알 수 있다.
도메인간 유사성 부족 문제를 검증하기 위해 본 연구에 서 제시하는 모델을 이용하여 CWRU 1750RPM 데이터셋 을 소스 데이터로 사전 학습한 후 HUST, SUBF, 소음 등 의 데이터셋을 타겟으로 하여 분류 성능 검증을 수행하였 다. <Figure 7>, <Figure 8>. <Figure 9>에서는 클래스 수, 샘플링 주파수, 센서 유형, 결함 유형 등 다양한 도메인 특성을 가지는 타겟 데이터셋에 대한 분류 모형의 성능을 나타내는 Confusion matrix를 보여주고 있다.
<Table 9>는 소스 데이터와 타겟 데이터 사이에 클래스 수, 샘플링 주파수, 센서 유형, 그리고 결함 유형 특성에 차이가 있음을 보여주고 있다. 즉, 표에서 ‘→’의 양측 값 은 각각 소스 데이터와 타겟 데이터의 특성치 값을 보여주 고 있다. 또한, <Table 10>에는 3개의 타겟 데이터를 전이 학습 기반 분류모형에 적용하여 얻은 Accuracy, F1-Score, Precision, Recall, ROC-AUC 등의 성능지표를 보여주고 있 다. 대부분의 성능지표값이 0.96을 초과하고 있으며, 더욱 이 타겟 도메인이 상이한 SUBF v2.0, Motor Sound에 대해 서도 강건한 분류 성능을 보여주고 있다.
제안된 방법의 성능을 더욱 검증하기 위해, CWRU 1750 RPM → CWRU 1772 RPM으로의 전이 작업을 예로 들어, t-SNE와 UMAP을 활용하여 소스 데이터와 타겟 데 이터의 추출된 특징을 2차원으로 축소하여 <Figure 10>과 같이 시각화하였다. 그림에서 빨간색 마커와 파란색 마커 는 각각 소스 도메인 특징과 타겟 도메인 특징을 나타내 며, 시각화 결과에서 알 수 있듯이 제안된 방법으로 추출 된 특징들은 높은 수준의 중첩을 보이고 있으며, 이를 통 해 우수한 전이 학습 능력을 보여주고 있음을 알 수 있다.
5. 결 론
본 연구는 시계열 데이터를 활용한 전이 학습 기반 이상 탐지 모델을 제안하여 다양한 운전 조건에서 이상 상황을 효과적으로 진단할 수 있는 방안을 제시하였다. 본 연구에서 는 제시한 이상 탐지 모델의 사전 학습을 위해 CWRU 데이터 셋을 소스 데이터로 사용함으로써, 데이터 부족 문제를 극복 할 수 있고, 또한 다양한 도메인 특성을 가지는 데이터셋을 이용한 검증을 통해 강건한 일반화 성능과 도메인 간 유사성 부족 문제를 극복할 수 있음을 보여주었다.
실제 산업 현장에는 진동, 전류, 음향, 소음 등 다양한 소스의 분석 데이터 도메인이 존재하며, 해당 도메인의 고 장 데이터가 부족한 실정에서 인공지능을 이용한 고장 진 단 시스템 개발 시 본 연구 결과인 전이 학습 기반 이상 탐지 방법론은 유용하게 활용될 수 있다. 향후 연구에서는 고급 노이즈 제거 기법을 도입하여 데이터의 성능을 개선 하고, 다양한 고장 유형을 포함한 데이터셋을 확보하여 전 이 학습 모델을 더욱 최적화할 필요가 있다.




















