Journal Search Engine

ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)

Journal of Society of Korea Industrial and Systems Engineering Vol.48 No.4 pp.25-33
DOI : https://doi.org/10.11627/jksie.2025.48.4.025

A Study on Transfer Learning-Based Anomaly Detection Method for Time-Series Data

Jaehun Kim

, Chulsoon Park†

Department of Industrial and Systems Engineering, Changwon National University

^†Corresponding Author : cspark@changwon.ac.kr

Received 28/09/2025 Finally Revised 21/10/2025 Accepted 22/10/2025

Abstract

Anomaly detection is crucial for ensuring the reliability and safety of mechanical systems across industries such as power generation, manufacturing, and transportation. In these mechanical systems, data is usually collected in time-series form using sensors such like vibration, current or sound for anomaly detection. Time-series anomaly detection methods often face limitations due to insufficient training data and poor generalization across complex operating conditions and varying loads. To address these challenges, this study proposes a transfer learning-based anomaly detection model, leveraging pre-trained knowledge to deliver robust performance and adaptability in data-scarce scenarios and diverse industrial environments. To this end, time-series signals are transformed into spectrograms through Short-Time Fourier Transform(STFT), followed by feature extraction through a Convolutional Autoencoder to obtain low-dimensional latent features. These features are used to detect anomalies using classification such as Random Forest and eXtreme Gradient Boosting. Building on this approach, this research validates the model's performance through migration tasks using the Case Western Reserve University(CWRU) Bearings dataset. Furthermore, to show cross-condition generalization, the proposed model was validated on the Hanoi University of Science and Technology(HUST), Sumair–Umar Bearing Fault(SUBF) dataset v2.0, and a dataset collected using microphone sensor in motor dynamo tests. Consequently, unlike other studies limited by specific operating conditions, the proposed model exhibits strong generalization performance across benchmark datasets. Experimental results highlight the effectiveness of combining STFT, CAE, and tree-based classifiers in addressing data scarcity and enhancing generalization, making it highly suitable for real-world industrial applications. Future work will focus on noise-robust techniques and broader fault types to further improve performance.

Key Words : Time-Series , Anomaly Detection , Transfer Learning , Convolutional Autoencoder , Short-Time Fourier Transform Spectrogram

시계열 데이터에 대한 전이 학습 기반 이상 탐지 방법 연구

김재훈, 박철순†

국립창원대학교 산업시스템공학과

초록

키워드 :

This article has been cited by 0 article in crossref

Cited-By

Funding:

1. 서 론

이상 탐지(Anomaly Detection)는 발전, 제조, 운송 등 다양한 산업 분야에서 기계 시스템의 안정성과 효율성을 보장하는 데 중요한 역할을 한다. 산업 환경에서 기계 시스템은 복잡한 운전 조건과 다양한 부하 하에서 작동하며, 이 과정에서 발생하는 이상은 성능 저하, 장비 손상, 심지어 <Figure 1>과 같이 안전사고로 이어질 수 있다. 진동, 소음, 또는 열적 불균형과 같은 이상 징후는 시스템의 잠재적 고장을 나타내며, 이러한 이상을 조기에 탐지하지 못할 경우 고가의 장비 손상뿐만 아니라 생산 중단, 심각한 경우에는 화재나 인명 사고로 이어질 수 있다. 즉, 시험평가 및 운용 과정에서 이상 상황을 효과적으로 모니터링하고 진단하는 기술은 산업 응용에서 필수적이다.

따라서, 다양한 산업 분야에서 사용되고 있는 기계 시스템에 대한 시험평가 진행 중에 발생할 수 있는 이상 상황의 탐지가 중요하며, 시험평가 시스템을 효율적으로 진단 모니터링하기 위해 인공지능 기반의 방법론들이 활용되고 있다[5, 6, 7, 11, 15, 17, 22]. 그러나 이러한 방법론들은 주로 특정 운전 조건에 최적화된 모델을 제시하였으며, 다른 데이터셋에 대한 일반화 검증이 부족하여 다양한 산업 환경에의 적용이 제한적이다.

이러한 한계들을 극복하기 위한 방법 중 하나로 전이 학습을 활용할 수 있다. 전이 학습은 사전 학습된 모델의 특징을 재사용하여 데이터 부족 문제를 완화할 수 있고, 다양한 고장 유형과 운전 조건에서 일반화 성능을 향상시킬 수 있다. 이를 통해 다양한 센서 유형에 적용 가능한 모델의 개발에 기여하고 있다[25, 26]. 예를 들어, 사전 학습된 신경망의 하위 레이어에서 추출된 일반화된 특징은 소량의 데이터로도 고장 진단 모델을 효과적으로 학습시킬 수 있으며, 이는 산업 응용에서 특히 유용하다[26]. 그러나 전이 학습을 활용한 연구들도 여전히 한계를 가지고 있다. Habbouche et al.[10], Sunal et al.[25], Seo[23], Kumar et al.[16]은 기계 설비 이상 진단을 위해 전이 학습을 이용한 진단 방법을 제안하였으나, 이들 연구는 특정 운전 조건이나 고장 유형에 초점이 맞추어져 있어 다양한 산업 환경에서의 일반화에는 한계가 있다. Xiao et al.[26] 은 도메인 적응 기법을 적용해 진동 신호 기반 고장 진단을 제시하였으나, Deep Neural Network(DNN)의 고비용의 컴퓨팅 자원 요구, 실험실 데이터와 산업 데이터 간 차이로 인한 성능 저하를 우려하였다. Su et al.[24]은 심층 준 지도 전이 학습(Sa-DBA)을 제안하여 CWRU, PHM, DPS 데이터셋에서 높은 정확도를 달성했지만, 클래스 수 일치와 소스 및 타겟 도메인 데이터의 균형 요구로 인해 적용 범위가 제약될 수 있으며, Bernico et al.[3]은 소스와 타겟 도메인 간의 도메인 유사성 부족은 전이 학습의 성능 저하를 유발할 수 있고, 이를 해결하기 위해 보다 많은 타겟 데이터와 세밀한 미세조정이 필요하다고 주장하였다.

따라서, 본 연구에서는 전이 학습 기반 이상 탐지 모델을 제안하고, Case Western Reserve University(CWRU) 베어링 데이터셋[4]의 1750RPM, 1772RPM, 1797RPM 데이 터셋을 각각 소스와 타겟 데이터로 교차 적용하여 모델의 성능을 검증한다. 그리고, Hanoi University of Science and Technology(HUST) 베어링 데이터셋[12]과 Sumair–Umar Bearing Fault(SUBF) 데이터셋 v2.0[2], 모터 다이나모 시험에서 수집한 마이크로폰 센서 데이터셋을 타겟으로 적용하여 제안 방법의 도메인 유사성이 부족한 상황에서도 효과적인 이상 탐지가 될 수 있음을 보여준다.

전이 학습 모델 개발을 위해, 먼저 STFT를 통해 CWRU 시계열 데이터를 스펙트로그램으로 변환하여, 2D 행렬 형태의 시간-주파수 특성을 추출한다. 변환된 데이터는 Convolutional Autoencoder(CAE)의 입력 데이터로 사용되며, 데이터중 전반부 80%를 학습용으로 사용하여 CAE 모 델을 사전 훈련(pre-train)하고, 나머지 20%를 테스트용으로 활용한다. 사전 학습된 CAE에서 인코더를 추출하여 새로운 데이터셋에 대한 사전 학습 모델로 사용한다. 새로운 데이터셋은 STFT를 통해 스펙트로그램으로 변환된 후, 사전 학습된 인코더에 입력되어 저차원 잠재 벡터를 생성한다. 이 잠재 벡터는 DNN의 입력 데이터로 사용되며, DNN의 출력층 직전 penultimate layer에서 생성된 특징은 이상 탐지를 위한 분류 모델의 입력으로 사용된다.

본 논문의 구성은 다음과 같다. 2장에서는 본 연구에서 사용한 데이터셋을 소개하고, 3장에서는 STFT를 활용한 시계열 데이터의 시간-주파수 영역 변환 및 데이터 전처리 과정을 다룬다. 4장에서는 전이 학습 기반 이상 탐지 모델을 제시하고, 이 모델이 일반화 성능과 도메인간 유사성이 부족한 상황에서도 효과적으로 이상 탐지가 가능함을 보여준다. 마지막으로, 5장에서는 제안된 방법의 한계와 향후 연구 방향을 제시하며 결론을 도출한다.

2. 데이터셋 소개

본 연구에서는 시계열 데이터를 활용하여 이상 상황을 탐지하기 위해 CWRU 데이터셋을 이용하여 사전 학습 모델 개발 및 일반화 능력을 검증하고, HUST, SUBF v2.0, 모터 다이나모 시험 데이터셋을 이용하여 개발된 모델의 도메인간 유사성 부족 문제를 검증하였다. CWRU 데이터셋은 모터 베어링의 정상 및 결함 상태에서 수집된 진동 데이터를 제공하며, 기계적 결함 진단 연구에서 널리 사용되는 표준 데이터셋으로 간주된다. 이 데이터셋은 결함 탐지 및 분류 모델의 학습과 검증에 적합하며, <Table 1>과 같이 정상 상태(Normal)와 세 가지 결함 유형(내부 레이스 결함(Inner Race Fault), 외부 레이스 결함(Outer Race Fault), 볼 결함(Ball Fault))을 포함하고 있다. HUST 베어링 데이터셋은 Hanoi University of Science and Technology에서 진동 신호를 사용하여 개발된 데이터셋으로, <Table 2>와 같이 정상 상태와 세 가지 결함 유형(내부 레이스 결함, 외부 레이스 결함, 볼 결함)을 포함하고 있다. 또한 SUBF 데이터셋 v2.0은 소음 신호 기반 베어링 고장 진단 연구를 위한 데이터셋을 포함하고 있으며, <Table 3>과 같이 정상 상태, 내부 레이스 결함, 외부 레이스 결함으로 구성되어 있다.

또한 본 연구에서 제시하는 전이 학습 모델이 도메인간 유사성이 부족한 상황에서의 적용 가능성을 검증하기 위해 <Figure 2>와 같이 다이나모 모터 시험에서 마이크로폰 센서를 이용한 소음 데이터를 수집하였다. 다이나모 시험은 모터 고정용 볼트의 토크를 <Table 4>에 제시되어 있는 것과 같이 변경하면서 진행하였다. 체결 토크가 낮을 경우(20kgf·㎝, Loosen 이상상태)에는 모터의 진동이 증가하고, 반대로, 체결 토크가 높은 경우(80kgf·㎝, Alignment 이상 상태)에는 모터축의 정렬 이상이 발생한다. 본 연구에서 사용된 다이나모와 모터의 기술 사양은 <Table 5>에 제시하였으며, <Table 6>은 사용된 마이크로폰 센서의 기술 사양을 보여주고 있다. <Figure 3>은 체결 토크 20, 60, 80kgf·㎝ 에서의 소음 시계열 그래프를 보여주고 있다.

3. 신호 처리 및 특징 추출

진동, 전류, 소음과 같은 아날로그 신호는 주파수 영역으로 변환하여 시계열 데이터 분석을 통해 패턴을 분석하는 접근법이 널리 사용되어 왔다[8, 20]. 푸리에 변환(Fourier Transform)을 통해 신호를 주파수 영역으로 변환하면 주파수 성분을 분석할 수 있지만, 시간에 따른 변화 정보는 손실되는 문제점이 있다. 반면, 시간-주파수 분석은 신호의 주파수 성분과 시간적 변화를 동시에 포착할 수 있어 모터 고장 진단에 효과적[1]이며, 대표적으로 STFT를 이용한 방법이 있다[27]. STFT는 시간 영역 신호를 시간-주파수 공간으로 변환할 수 있는 간단하고 적용하기 쉬운 신호 변환 방법[19]이며, STFT 방법을 통해 얻은 신호의 시간-주파수 분포는 변조 특성, 즉 에너지 분포의 변화 특성을 보여준다. 따라서, 시간-주파수 영역에서 에너지 분포 비교를 통해 이상 상태를 검출할 수 있다[21].

STFT는 시계열 신호를 일정한 시간 간격으로 분할하여 만들어지는 윈도우의 크기는 한 번에 처리하는 데이터의 시간 범위를 나타내며, 각 윈도우에 대해 푸리에 변환을 수행함으로써 시간-주파수 영역의 특성을 추출한다. 윈도우 크기는 STFT의 시간 해상도와 주파수 해상도에 직접적인 영향을 미치며, 시간과 주파수 간에는 상호 트레이드 오프 관계가 존재한다. 짧은 윈도우는 시간적 변화에 민감하여 빠른 신호 변화를 포착하는 데 유리하지만, 데이터의 양이 적어 주파수 해상도가 낮아져 주파수 성분의 세부적인 구분이 어려워질 수 있다. 예를 들어, 짧은 윈도우는 모터의 급격한 부하 변화를 탐지하는 목적에는 적합하지만, 주파수 스펙트럼의 세밀한 구조를 분석하기에는 한계가 있다. 반대로, 긴 윈도우는 더 많은 데이터를 포함하므로 주파수 해상도가 높아져 주파수 성분을 정밀하게 분석할 수 있지만, 시간 해상도가 낮아져 신호의 순간적인 변화 탐지에 한계가 있을 수 있다. 분석을 위해 모든 데이터셋의 신호는 <Figure 4>와 같이 윈도우 크기 1,024, 오버랩 비율(overlap) 0.5로 설정하였다. <Figure 5>는 CWRU 데이터셋(1750RPM)의 시계열 데이터를 STFT를 통해 스펙트로그램으로 변환한 2D 행렬 시각화를 보여주고 있다.

4. 이상 탐지 모델 개발 및 검증

본 연구에서는 <Figure 6>과 같이 CWRU 베어링 데이터셋 기반의 전이 학습 이상 탐지 모델을 제시하였다. 그림의 사전 학습(Pre-train) 단계에서는 CWRU 데이터셋의 시계열 데이터를 STFT를 통해 2D 행렬 형태의 스펙트로그램을 생성한다. 이때, 계산 효율성과 메모리 사용량을 고려하여 단일 채널 데이터로 변환하고, 정상 및 비정상 상태에 대해 라벨링을 수행한 후, 스펙트로그램 특성치를 0과 1 사이로 값으로 정규화한다. 정규화된 스펙트로그램 데이터는 CAE의 입력으로 사용되며, 인코더-디코더 구조를 통해 입력 데이터를 저차원 잠재벡터로 압축 및 재구성하여 사전 학습을 수행한다. 사전 학습 시 인코더는 <Table 7>에 기술된 아키텍처와 같이 Conv2D 와 MaxPooling2D를 거치면서 차원을 축소하는 역할을 담당하고, 디코더는 UpSampling2D와 Conv2D를 통해 원래 크기로 복원하는 역할을 담당한다. 각 층의 활성화 함수로는 Gradient(기울기) 소실 문제를 해결할 수 있는 ‘ReLu’를 사용하였으며, 최적화 알고리즘(optimizer)은 Momentum과 RMSProp을 결합한 ‘adam’을 적용하였다. ‘adam’은 효율적인 학습으로 메모리 요구사항이 적으며, 대량의 데이터와 다차원의 파라미터를 갖는 문제에 적합하다고 알려져 있다[14].

<Figure 6>에 표시된 미세조정(Fine-tuning) 단계에서는 사전 학습 모델에서 도출된 CAE 인코더를 추출하여 이상 탐지 모델을 구성하기 위한 layer로 삽입한다. 그리고, 타겟 시계열 데이터는 STFT를 통해 스펙트로그램으로 변환 및 정규화하여 삽입된 인코더에 입력 데이터로 사용한다. 여기서 입력 데이터를 이용하여 인코더의 6개 레이어 중 후반 3개 레이어는 미세조정하며, 전반 3개 레이어는 고정해서 사전 학습된 일반화된 특징을 유지하도록 한다. 입력 데이터를 통해 도출된 저차원 잠재벡터는 DNN의 입력으로 사용되어 penultimate layer에서 특징을 추출한다.

마지막으로, <Figure 6>에 표시된 이상 탐지(Anomaly Detection) 단계에서는 DNN penultimate layer에서 추출된 특징을 Random Forest(RF)와 eXtreme Gradient Boosting (XGB) 등의 입력으로 사용하여 이상 여부를 판단한다. Grinsztajn et al.[9]에 따르면 DNN 대신에 Tree 기반의 RF와 XGB 분류기를 사용하는 이유는 트리 기반 모델이 데이터 특성의 불연속적 패턴을 효과적으로 포착하고, 축에 평행한 결정 경계를 생성하여 복잡한 비선형 변환 없이도 우수한 분류 성능을 제공하므로 본 연구에서는 이를 이상 탐지 분류 모델로 채택하였다.

일반화 능력을 검증하기 위해 기존 연구[13, 18]에서 수행한 컨볼루셔널 분해와 도메인 적대적 전이 학습을 통한 교차 검증 결과 및 AdaBN(Adaptive Batch Normalization) 기반 전이 학습 방법과 비교하면, 본 연구에서 제시한 모델을 이용한 CWRU 데이터셋에 대한 이상 탐지 모델의 교차 검증 결과는 <Table 8>에 나타난 바와 같이, 모든 시나리오에서 기존 연구에 비교하여 탁월함을 알 수 있다.

도메인간 유사성 부족 문제를 검증하기 위해 본 연구에서 제시하는 모델을 이용하여 CWRU 1750RPM 데이터셋을 소스 데이터로 사전 학습한 후 HUST, SUBF, 소음 등의 데이터셋을 타겟으로 하여 분류 성능 검증을 수행하였다. <Figure 7>, <Figure 8>. <Figure 9>에서는 클래스 수, 샘플링 주파수, 센서 유형, 결함 유형 등 다양한 도메인 특성을 가지는 타겟 데이터셋에 대한 분류 모형의 성능을 나타내는 Confusion matrix를 보여주고 있다.

<Table 9>는 소스 데이터와 타겟 데이터 사이에 클래스 수, 샘플링 주파수, 센서 유형, 그리고 결함 유형 특성에 차이가 있음을 보여주고 있다. 즉, 표에서 ‘→’의 양측 값은 각각 소스 데이터와 타겟 데이터의 특성치 값을 보여주고 있다. 또한, <Table 10>에는 3개의 타겟 데이터를 전이 학습 기반 분류모형에 적용하여 얻은 Accuracy, F1-Score, Precision, Recall, ROC-AUC 등의 성능지표를 보여주고 있다. 대부분의 성능지표값이 0.96을 초과하고 있으며, 더욱이 타겟 도메인이 상이한 SUBF v2.0, Motor Sound에 대해 서도 강건한 분류 성능을 보여주고 있다.

제안된 방법의 성능을 더욱 검증하기 위해, CWRU 1750 RPM → CWRU 1772 RPM으로의 전이 작업을 예로 들어, t-SNE와 UMAP을 활용하여 소스 데이터와 타겟 데이터의 추출된 특징을 2차원으로 축소하여 <Figure 10>과 같이 시각화하였다. 그림에서 빨간색 마커와 파란색 마커는 각각 소스 도메인 특징과 타겟 도메인 특징을 나타내며, 시각화 결과에서 알 수 있듯이 제안된 방법으로 추출된 특징들은 높은 수준의 중첩을 보이고 있으며, 이를 통해 우수한 전이 학습 능력을 보여주고 있음을 알 수 있다.

5. 결 론

본 연구는 시계열 데이터를 활용한 전이 학습 기반 이상 탐지 모델을 제안하여 다양한 운전 조건에서 이상 상황을 효과적으로 진단할 수 있는 방안을 제시하였다. 본 연구에서는 제시한 이상 탐지 모델의 사전 학습을 위해 CWRU 데이터셋을 소스 데이터로 사용함으로써, 데이터 부족 문제를 극복할 수 있고, 또한 다양한 도메인 특성을 가지는 데이터셋을 이용한 검증을 통해 강건한 일반화 성능과 도메인 간 유사성 부족 문제를 극복할 수 있음을 보여주었다.

실제 산업 현장에는 진동, 전류, 음향, 소음 등 다양한 소스의 분석 데이터 도메인이 존재하며, 해당 도메인의 고장 데이터가 부족한 실정에서 인공지능을 이용한 고장 진단 시스템 개발 시 본 연구 결과인 전이 학습 기반 이상 탐지 방법론은 유용하게 활용될 수 있다. 향후 연구에서는 고급 노이즈 제거 기법을 도입하여 데이터의 성능을 개선하고, 다양한 고장 유형을 포함한 데이터셋을 확보하여 전이 학습 모델을 더욱 최적화할 필요가 있다.

Acknowledgement

This research was supported by Changwon National University in 2025∼2026.

Figure

<Figure 1>.

Fault in Electric Motor

<Figure 2>.

Motor Sound Measuring Equipment

<Figure 3>.

Motor Sound Time-Series Data (20, 60, 80kgf·㎝)

<Figure 4>.

Overlapping Window

<Figure 5>.

STFT Spectrogram(CWRU dataset)

<Figure 6>.

Proposed Transfer Learning-based Anomaly Detection Model Architecture

<Figure 7>.

Confusion matrix of HUST dataset using CWRU dataset

<Figure 8>.

Confusion matrix of SUBF v2.0 dataset using CWRU dataset

<Figure 9>.

Confusion matrix of Motor Sound dataset using CWRU dataset

<Figure 10>.

t-SNE and UMAP of Transfer Learning on the CWRU dataset

Table

<Table 1>.

CWRU experimental dataset

Class	Category	Fault diameter[in]
0	Normal	0
1	Ball fault	0.007
2	Ball fault	0.014
3	Ball fault	0.021
4	Inner race fault	0.007
5	Inner race fault	0.014
6	Inner race fault	0.021
7	Outer race fault	0.007
8	Outer race fault	0.014
9	Outer race fault	0.021

<Table 2>.

HUST bearing experimental dataset

Class	Category
0	Normal
1	Ball fault
2	Inner race fault
3	Outer race fault

<Table 3>.

SUBF v2.0 experimental dataset

Class	Category
0	Normal
1	Inner race fault
2	Outer race fault

<Table 4>.

Motor experimental dataset

Class	Category	Fastening Torque
0	Normal	60kgf·㎝
1	Loosen	20kgf·㎝
2	Alignment	80kgf·㎝
Sampling Rate 1,650Hz, Motor speed 3,500RPM

<Table 5>.

Equipment Specifications

Specification	SIMOTICS M Compact Motor	INDUCTION Motor
Output Power	7 ∼ 9.9 kW	3.7 kW (5HP)
Number of Poles	6 Poles	2 Poles
Voltage	348 ∼ 485 V	220/380 V
Frequency	60 Hz	60 Hz
Current	17 ∼ 17.5 A	13.3 A / 7.7 A

<Table 6>.

Microphone Sensor Technical data

Specification	RG-50
Transducer type	Electrete pressure transducer
Class 1	WS3F according to IEC 61094-5
Frequency range	5 Hz – 30 kHz
Sensitivity @ 1 kHz	50 mV/Pa ± 0.5 dB
Temperature range	- 20℃ to + 80℃
Max. SPL for 1% THD at 1 kHz	130 dB Peak

<Table 7>.

The architecture of the CAE

Layer (type)	Output Shape	Param #
Input	(None, 128, 128, 1)	0
Conv2D	(None, 128, 128, 32)	320
MaxPooling2D	(None, 64, 64, 32)	0
Conv2D	(None, 64, 64, 64)	18496
MaxPooling2D	(None, 32, 32, 64)	0
Conv2D	(None, 32, 32, 128)	73856
MaxPooling2D	(None, 16, 16, 128)	0
Conv2D	(None, 16, 16, 128)	147584
UpSampling2D	(None, 32, 32, 128)	0
Conv2D	(None, 32, 32, 64)	73792
UpSampling2D	(None, 64, 64, 64)	0
Conv2D	(None, 64, 64, 32)	18464
UpSampling2D	(None, 128, 128, 32)	0
Conv2D	(None, 128, 128, 1)	289
Output	(None, 128, 128, 1)	0

<Table 8>.

Comparison of the Accuracy of Migration Experiments On the CWRU Dataset

Source → Target (Motor speed) [RPM]	RF	XGB	Hu et al.[13]	Li et al.[18]
1750 → 1772	1.0000	1.0000	0.9898	0.9753
1750 → 1797	1.0000	1.0000	0.9838	0.9928
1772 → 1750	1.0000	1.0000	1.0000	0.9999
1772 → 1797	1.0000	1.0000	0.9985	0.9526
1797 → 1750	1.0000	1.0000	0.9913	0.9619
1797 → 1772	1.0000	1.0000	0.9975	0.9784

<Table 9>.

Summary of Transfer Learning Conditions across Different Datasets

Source → Target	Class	Sampling rate	Sensor	Fault Type
CWRU → HUST	10 → 4	48,500 Hz → 51,200 Hz	Acc. → Acc.	Bearing → Bearing
CWRU → SUBF v2.0	10 → 3	48,500 Hz → 10,000 Hz	Acc. → Microphone	Bearing → Bearing
CWRU → Motor Sound	10 → 3	48,500 Hz → 1,650 Hz	Acc. → Microphone	Bearing → Bolt fastening

<Table 10>.

Transfer Learning Performance

Specification	RF	XGB
CWRU → HUST	0.9975	0.9975	0.9975	0.9975	1.0000	0.9975	0.9975	0.9975	0.9975	1.0000
CWRU → SUBF v2.0	0.9633	0.9649	0.9633	0.9634	0.9898	0.9700	0.9703	0.9700	0.9700	0.9947
CWRU → Motor Sound	0.9657	0.9658	0.9657	0.9657	0.9947	0.9652	0.9652	0.9652	0.9652	0.9962

Reference

Ashouri, M., Silva, F.F.D., and Bak, C.L., Application of short‐time Fourier transform for harmonic‐based protection of meshed VSC‐MTDC grids. The Journal of Engineering, The 14^th IET International Conference on AC and DC Power, 2019, pp. 1439-1443.
Aziz, S., Khan M.U. Usman A., Faraz M., Ghadi Y.Y. and Montes G.A., Bearing faults classification using novel log energy-based empirical mode decomposition and machine Mel-frequency cepstral coefficients, Digital Signal Processing, 2025, Vol. 156, Part A, p. 104776,
Bernico, M., Li, Y., and Zhang, D., Investigating the impact of data volume and domain similarity on transfer learning applications. In Proceedings of the Future Technologies Conference, 2018, Cham: Springer International Publishing, pp. 53-62.
Case Western Reserve University (CWRU) Bearing Data Center. Apparatus and procedures. Retrieved from https://engineering.case.edu/bearingdatacenter, Accessed 14 May 2025
Choi, G.Y., Chang, I.S., Lee, Y.H., Kang, H.S., and Park, G.M., Fault Detection of Motor Gear Box Using Two Stage Sound Classification Network, Transaction of the Korean Society of Automotive Engineers, 2022, Vol. 30, No. 2, pp. 161-169.
Reséndiz-Ochoa, E., Morales-Hernández, L.A., Cruz-Albarran, I.A., and Álvarez-Junco, S., Induction Motor Failure Analysis using Machine Learning and Infrared Thermography, IEEE International Autumn Meeting on Power, Electronics and Computing (ROPEC), Ixtapa, Mexico, 2022, pp. 1-6.
Egaji, O.A., Ekwevugbe, T., and Griffiths, M., A Data Mining based Approach for Electric Motor Anomaly Detection Applied on Vibration Data, Fourth World Conference on Smart Trends in Systems, Security and Sustainability (WorldS4), London, UK, 2020, pp. 330-334.
Goyal, D. and Pabla, B.S., The vibration monitoring methods and signal processing techniques for structural health monitoring: a review, Archives of Computational Methods in Engineering, 2016, Vol. 23, pp. 585-594.
Grinsztajn, L., Oyallon, E., and Varoquaux, G., Why do tree-based models still outperform deep learning on typical tabular data?, Advances in Neural Information Processing Systems, 2022, Vol. 35, pp. 507-520.
Habbouche, H., Benkedjouh, T., Amirat, Y., and Benbouzid, M., A Wavelet Transform-Based Transfer Learning Approach for Enhanced Shaft Misalignment Diagnosis in Rotating Machinery, Electronics, 2025, Vol. 14, No. 2, p. 341.
Hiruta, T., Maki, K., Kato, T., and Umeda, Y., Unsupervised learning based dianosis model for anomaly detection of motor bearing with current data, Procedia CIRP, 2021, Vol. 98, pp. 336–341.
Hong, H.S. and Thuan, N., HUST bearing: a practical dataset for ball bearing fault diagnosis. Mendeley Data, Version 3 (2023).
Hu, X. and Tang, Y., A Fault Diagnosis Method Based on Convolutional Decomposition and Domain Adversarial Transfer Learning for Rolling Bearing under Variable Operating Conditions, 2024 8^th International Conference on Electrical, Mechanical and Computer Engineering (ICEMCE), Xi'an, China, 2024, pp. 1452-1459.
Kingma, D.P.. Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980, 2014.
Kirchgässner, W., Wallscheid, O., and Böcker, J., Estimating electric motor temperatures with deep residual machine learning, IEEE Trans. Power Electron, 2020, Vol. 36, Iss. 7, pp. 7480-7488.
Kumar, P., Raouf, I., and Kim, H.S., Transfer learning for servomotor bearing fault detection in the industrial robot, Advances in Engineering Software, 2024, Vol. 194, p. 103672.
Lee, D.H., Lee, J.H., Park, J.H., Choi, J.I., and Choe. T.Y., Anomaly Detection in Rotating Motor using Two-level LSTM, Proceedings of KIIT Conference, 2021, pp. 425-428.
Li, X., Su, K., Li, D., He, Q., Xie, Z., and Kong, X., Transfer learning for bearing fault diagnosis: adaptive batch normalization and combined optimization method, Measurement Science and Technology, 2024, Vol. 35, No. 4, p. 046106.
Liu, H., Li, L., and Ma, J., Rolling bearing fault diagnosis based on STFT‐deep learning and sound signals, Shock and Vibration, 2016, 6127479.
Majid, A. and Mehrdad, S.B., Leak detection in water-filled plastic pipes through the application of tuned wavelet transforms to Acoustic Emission signals, Applied Acoustics, 2010, Vol. 71, Issue 7, pp. 634-639.
Mohammed, S. A., Ghazaly, N. M., and Abdo, J., Gearbox Vibration Analysis Using a Spectrogram and Power Spectrum Approach, ASME International Mechanical Engineering Congress and Exposition, 2022, Vol. 86670.
Park, S.Y., Chang, T.U., and Im, T.H., A study on machine learning-based anomaly detection algorithm using current data of fish-farm pump motor, Korean Society For Internet Information, 2023, Vol. 24, No. 2, pp. 37-45.
Seo, Y.J., An Input Transformation with MFCCs and CNN Learning Based Robust Bearing Fault Diagnosis Method for Various Working Conditions, KIPS Transactions on Software and Data Engineering, 2022, Vol. 11, No. 4, pp. 179-188.
Su, Z., Zhang, J., Xu, H., Zou, J., and Fan, S., Deep semi-supervised transfer learning method on few source data with sensitivity-aware decision boundary adaptation for intelligent fault diagnosis, Expert Systems with Applications, 2024, Vol. 249, p. 123714.
Sunal, C.E., Velisavljevic, V., Dyo, V., Newton, B., and Newton, J., Centrifugal pump fault detection with convolutional neural network transfer learning, Sensors, 2024, Vol. 24, No. 8, p. 2442.
Xiao, D., Huang, Y., Zhao, L., Qin, C., Shi, H., and Liu, C., Domain adaptive motor fault diagnosis using deep transfer learning, IEEE Access, 2019, Vol. 7, pp. 80937-80949.
Zhao, W.L., Wang, Z.L., Ma, J., and Li, L.F., Fault, Diagnosis of a Hydraulic Pump Based on the CEEMD-STFT Time-Frequency Entropy Method and Multiclass SVM Classifier, Shock and Vibration, 2016, pp. 1-8.

Specification	RF					XGB
Specification	Accuracy	Precision	Recall	F1-Score	ROC-AUC	Accuracy	Precision	Recall	F1-Score	ROC-AUC
CWRU → HUST	0.9975	0.9975	0.9975	0.9975	1.0000	0.9975	0.9975	0.9975	0.9975	1.0000
CWRU → SUBF v2.0	0.9633	0.9649	0.9633	0.9634	0.9898	0.9700	0.9703	0.9700	0.9700	0.9947
CWRU → Motor Sound	0.9657	0.9658	0.9657	0.9657	0.9947	0.9652	0.9652	0.9652	0.9652	0.9962