:: Journal of Society of Korea Industrial and Systems Engineering ::
Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)
Journal of Society of Korea Industrial and Systems Engineering Vol.41 No.2 pp.84-94
DOI : https://doi.org/10.11627/jkise.2018.41.2.084

Failure Analysis to Derive the Causes of Abnormal Condition of Electric Locomotive Subsystem

Min-Seop So*, Hong-Bae Jun**, 종호 신*
*Department of Industrial Engineering, Chosun University
**Department of Industrial Engineering, Hongik University
Corresponding Author : jhshin@chosun.ac.kr
13/03/2018 08/06/2018 11/06/2018

Abstract


In recent years, the diminishing of operation and maintenance cost using advanced maintenance technology is attracting many companies’ attention. Especially, the heavy machinery industry regards it as a crucial problem since a failure of heavy machinery requires high cost and long downtime. To improve the current maintenance process, the heavy machinery industry tries to develop a methodology to predict failure in advance and to find its causes using usage data. A better analysis of failure causes requires more data so that various kinds of sensor are attached to machines and abundant amount of product usage data is collected through the sensor network. However, the systemic analysis of the collected product usage data is still in its infant stage. Many previous works have focused on failure occurrence as statistical data for reliability analysis. There have been less works to apply product usage data into root cause analysis of product failure. The product usage data collected while failures occur should be considered failure cause analysis. To do this, this study proposes a methodology to apply product usage data into failure cause analysis. The proposed methodology in this study is composed of several steps to transform product usage into failure causes. Various statistical analysis combined with product usage data such as multinomial logistic regression, T-test, and so on are used for the root cause analysis. The proposed methodology is applied to field data coming from operated locomotive and the analysis result shows its effectiveness.



센서 데이터를 이용한 전기 기관차의 이상 상태 요인분석

소 민섭*, 전 홍배**, Shin Jong-Ho*
*조선대학교 산업공학과
**홍익대학교 산업공학과

초록


    Ministry of Education
    National Research Foundation of Korea

    1 서 론

    4차 산업혁명의 핵심 구성요소 중 하나인 센서 네트워 크 기술 개발은 현장에서 운용 중인 제품에서 실시간으 로 다양한 데이터를 원격으로 수집하는 것을 가능하게 하였다. 실시간으로 수집된 대용량의 데이터(빅데이터) 는 사용 목적과 분석 방법에 따라 다양하게 활용이 가능 하다. 특히, 제품 운용 시 수집된 빅데이터를 활용하여 이상 상태 원인을 규명하고 유지 보수에 활용하는 것은 제품의 신뢰성 향상과 새로운 비즈니스 모델 창출이라는 측면에서 많은 기업들의 주목과 관심을 받고 있다[5].

    현재까지 산업현장에서 주로 사용되는 이상 상태 요인 분석방법은 제품에 가해지는 물리적인 힘을 실험으로 분 석하여 제품의 한계치를 파악하여 평가하는 방법(Limit Checking)[12]이나 제품의 고장을 실시간으로 탐지하는 장 비를 설치하여 이상치를 탐지하는 방법(Real Time Analytics)[ 9] 등이 주로 사용되었다. 최근에는 센서 네트워크 를 통해 수집된 제품 운용의 실시간 데이터를 기반으로 제품의 이상 상태를 분석하는 기업들이 등장하기 시작하 였고, 이를 통한 이익 창출도 상당히 증가하고 있는 추세 이다. 국내의 한 기업은 현장에 설치된 백만 개의 장비가 만들어내는 대용량의 데이터를 분석하여 상태 감시와 고 장 분석에 활용하는 지능형 전력망을 구축하여 많은 액 수의 비용을 절감하는 효과를 내기도 하였다.

    대용량 센서 데이터 기반 이상 상태 분석은 특히 중장 비와 같은 고가의 장비에 적용될 때 더욱 진가를 발휘한 다. 중장비와 같은 고가의 제품들은 고장으로 인해 운용 이 중단될 때 발생하는 손실 비용이 크기 때문에 고장의 원인을 파악하여 이를 미연에 방지하는 것이 매우 중요 하기 때문이다.

    제품의 고장분석에서 제품 운영의 실시간 빅데이터 활용이 주는 이점에도 불구하고 이를 고장 원인 분석에 적용하는 체계적인 방법의 개발이 아직 미흡하기 때문에 이를 위한 시스템 구축과 적절한 분석 방법 개발이 필요 하다. 따라서, 본 연구는 센서 네트워크를 통해 수집된 대용량의 제품 운용 데이터를 활용하여 제품의 이상 상 태에 영향을 미치는 주요 요인을 분석하는 방법을 제안 하여 제품 운용의 빅데이터를 고장 분석에 활용하고자 한다. 본 연구에서 제안된 방법은 전기기관차에서 수집 된 실제 데이터 적용하여 그 유용성과 활용 가능성을 증 명하였다.

    제 2장에서는 이상 상태 요인 분석의 기존 접근 방법 에 대해서 소개한다. 제 3장에서 본 연구에서 제안한 주 요 요인 분석 절차를 실제 데이터 적용을 통해 설명한다. 마지막 장은 본 연구의 성과를 요약하고 향후 연구 방향 에 대해서 논의한다.

    2 이상 상태 요인 분석에 대한 기존 연구

    고장이나 상태의 저하에 영향을 미치는 원인을 찾고자 하는 기술 개발은 의료/산업 등 수많은 분야에서 시도되 고 있다. 특히 산업분야는 다양한 제품을 대상으로 관련 된 많은 연구가 진행되고 있다. Bonnet[1]은 AC Motor의 고장 원인 분석을 위하여 실패 모드, 실패 유형, 외관, 유 지 보수 이력 등을 수집하여 RCA(Root Cause Analysis)를 통해 고장 원인을 찾는 방법론을 제시하였고, Scherbovskyk 와 Stefanovych[15]은 고장상태 기반을 다이어그램으로 시 각화하여 Markov Model을 기반으로 하는 방법론을 제안 하였다. He et al.[6]은 제품 초기 고장 메커니즘과 관련된 설계, 제조 및 초기 사용으로부터 수집된 빅데이터를 활 용한 PCA(Principal Component Analysis)와 SVM (Support Vector Machine) 기반으로 초기 고장의 원인을 규명하는 방법론을 제시하였다. 한편 국내의 연구동향으로 Park et al. [14]이 FMEA(Failure Modes and Effect Analysis)기법을 활용하여 설계에 내재되어 있는 열차 고장 요인을 찾아 내고 고장 등급을 나열하는 방법론에 대하여 제시하였으 며, 추가적으로 Mun et al.[13]은 열차의 궤간가변대차의 축소 모형을 제작하여 FTA(Failures Tree Analysis)기법을 기반으로 고장 유형을 분석하여 고장의 중요한 항목을 도출하는 방법론을 제시하였다. Jung et al.[8]은 농기계 부품의 고장 메커니즘 분석을 위해 QFD(Quality Function Deployment)와 FMEA 기법을 활용하였다. Cho et al.[3]은 FTA에 대한 문제점을 보완하기 위해 Lee[11]의해 소개되 고 1986년 수립된 Bryant(Carnegie Mellon University)[2]의 BDD(Binary Decision Diagram)기법을 활용하여 고장 분석 연구를 진행하였다. 앞서 소개한 연구의 대부분은 확률적 이론 및 제한된 제품 고장 이력 데이터를 활용하여 통계 적 기법을 기반으로 고장의 원인을 분석한 연구들이 대부 분이다. 최근 많은 관심을 받고 있는 기계학습(Machine Learning) 기법도 고장 분석에 대한 새로운 접근법으로 활용되고 있다[7]. 이러한 노력에도 불구하고 많은 연구 들이 고장의 발생과 이에 미치는 영향을 고려하는 부분이 미흡하여 고장의 근원적인 원인을 파악하고 예방 계획을 수립하는 부분이 부족한 상태이다.

    본 연구의 대상인 전기기관차의 고장 원인 분석에 국 한해 보았을 때, 실제 기업들의 현장은 유지 보수 담당자 의 주관적인 경험을 활용하여 고장에 대한 원인들을 수 집하고 고장 원인을 확인하는 방법을 주로 사용하고 있 다. 이러한 방법은 경험이 많고 노련한 담당자에 의해서 는 어느 정도 효과를 거두게 될지 모르지만 엔지니어 개 인의 역량에 좌우되는 문제가 있다. 또한 개인의 경험과 지식에 의존하다 보니, 고장 원인의 분석 기술이 기업의 고유 기술로 편입되기 어려운 문제가 있다.

    이러한 단점들을 극복하기 위해서 제품이 운용될 때 생성되는 다양한 데이터를 기반으로 제품의 고장 원인을 분석하는 방법을 체계화하는 것이 필요하다.

    3 이상 상태 주요요인 분석 절차

    3.1 연구대상 : 전기기관차

    본 연구에서 제안된 방법론은 스위스에서 생산 및 운 용된 전기기관차(<Figure 1> 참조)의 운용 데이터를 기반 으로 개발되었다. 연구 대상인 전기기관차는 각종 센서가 부착되어 있으며, 운용하는 동안 실시간으로 전기기관차 의 다양한 서브시스템이나 부품의 상태를 모니터링 하고 필요시 그 데이터를 기록하고 있다. 전기기관차의 특정 서브시스템이나 부품에 이상 상태가 발생하면, 전기기관 차에 설치된 모든 센서의 관측 데이터가 원격에 위치한 운용 회사의 유지 보수 시스템으로 전송되어 데이터베이 스에 저장되고 이는 이상 상태 원인 분석에 활용된다. 운 용중인 전기기관차에서 수집되는 연간 데이터는 텍스트 형식으로 200GB(Giga Bytes) 이상의 방대한 양이지만, 현재 이를 활용한 분석은 이상 상태 유형의 발생 빈도율 계산 정도에 머물고 있다. 일정 주기마다 전문가 그룹 회 의를 통해 각 이상 상태 유형의 발생 빈도율에 따라서 유지 보수를 수행할 서브시스템이나 부품의 점검 우선순 위를 결정하고, 이상 상태 발생원인 분석은 주로 담당 전 문가의 경험에 의해서 수행되고 있는 상황이다. 제 2장 에서 언급된 바와 같이 본 연구의 대상이 되고 있는 전 기기관차 역시 대용량의 운용 데이터 수집에도 불구하고 이를 이상 상태 분석에 활용하는 시스템적인 방법의 개 발이 미흡한 상태이다.

    3.2 이상 상태 주요 요인 분석 절차

    제품의 이상 상태에 영향을 미치는 주요 요인을 분석 하기 위해서 본 연구에서 제안된 방법은 아래의 과정으 로 구성되어 있다(<Figure 2> 참조). 제품의 이상 상태 주요 요인 분석은 크게 세 단계로 구성되어 있으며, 첫 번째 단계에서 분석에 필요한 센서 데이터 수집과 수집 된 데이터의 전처리가 이루어지고, 두 번째 단계에서 수 집된 데이터로 설명이 가능한 이상 상태 유형을 찾아내 고, 세 번째 단계에서 찾아낸 이상 상태 유형 발생에 주 요한 영향을 미치는 센서 데이터의 종류를 추출하고 검 증하는 과정으로 이루어져 있다.

    3.2.1 Part I-데이터 수집 및 전처리

    전기기관차는 고가의 장비로 고장의 발생이 높은 유 지 보수 및 다운타임 비용으로 이어지기 때문에 고장을 미연에 방지하고 빠른 시간 내에 유지 보수를 끝내는 것 이 필요하다. 이를 지원하기 위해 각 서브시스템이나 부 품에 다양한 센서를 부착하여 상태와 운행에 관련된 데 이터를 실시간으로 모니터링한다. 이렇게 모니터링 되는 데이터는 서브시스템이나 부품의 이상 상태가 발생이 될 때마다 유지 보수 시스템의 데이터베이스에 저장이 되 며, 이상 상태 발생 시점에 전기기관차에 설치된 모든 센 서에서 측정된 데이터 값이 동시에 기록이 되기 때문에 유지 보수 시스템의 데이터베이스는 이상 상태 발생 시 점에서의 센서로 측정된 데이터들의 스냅샷(Snapshot)들 이 저장된 것이라고 할 수 있다. <Figure 3>은 유지 보수 시스템의 데이터베이스에 저장되어 있는 센서 데이터들 의 구조를 보여주고 있다.

    데이터베이스의 첫 번째 열은 이상 상태가 발생한 시 점이 기록되고, 센서가 장착되어 있는 전기기관차의 모 델명이 두 번째 열에 기록된다. 이상 상태가 감지된 서브 시스템이나 부품의 이름이 세 번째 열에 기록되어 있다. 네 번째 열은 발생한 이상 상태 유형을 나타내고 있으며, 각 유형별로 ‘Failure code’가 부여되어 이를 통해 어떤 종류의 이상 상태가 발생하였는지 확인할 수 있다. 이후 의 열들은 전기기관차에 장착된 각 센서에서 이상 상태 발생시 모니터링된 센서 데이터 값들이 기록되어 있다.

    이상 상태 발생 시 저장되는 센서 데이터들은 크게 전기 기관차 운행 설정에 관련된 데이터와 환경 및 운용 관련 데이터로 나눌 수 있다. 운행 설정 데이터는 전기기관차 운용을 위해 기관사나 시스템이 설정한 값들을 말하며, 외부 환경 온도나 GPS(Global Positioning System) 위치 같은 것들은 환경 데이터가 된다. 전기기관차가 운용되 면서 부품에 공급되는 전류나 전압 등은 운용 관련 데이 터에 포함된다.

    각 서브시스템이나 부품의 이상 상태가 발생할 때마 다 새로운 행이 데이터베이스에 추가가 되며, 수만 행의 이상 상태 발생 기록이 데이터베이스에 저장되어 있다. 유지 보수 시스템의 데이터베이스에 축적된 데이터는 이 상 상태 발생 시에만 기록되기 때문에 비정기적인 특성 을 가지고 있다. 이러한 기록 특성에 따라 전기기관차 유 지 보수 시스템에 저장된 데이터가 가지는 가장 큰 문제 점은 이상 상태가 발생한 비정상 상태에서만 수집된 데 이터이기 때문에 이를 비교 분석하기 위한 정상 운영 상 태의 데이터가 없다는 점이다.

    연구 대상인 전기기관차는 수만 개 이상의 서브시스템 과 부품으로 이루어져 있지만, 본 연구에서는 연구의 편 의성을 위해 구동부에서 수집되는 이상 상태 유형과 이에 관련된 데이터로 분석을 제한하였다(<Figure 4> 참조).

    <Table 1>은 구동부와 관련된 센서에서 수집되어 저장 되는 데이터의 종류를 설명하고 있으며, 총 18종류의 센 서 데이터가 구동부 부품의 이상 상태 발생 시 저장된다.

    분석에 사용된 데이터는 약 1년간의 이상 상태 발생 기 록과 이와 관련된 각종 측정 센서 데이터이며, 세 종류의 기관차에서 수집되었다. 1년간 총 이상 상태 발생건수는 약 3,400여 건이며, 이 기간 동안 발생한 이상 상태 유형은 약 210여 종이다. 발생 빈도는 각 이상 상태 유형에 따라 최저 두 번에서 최대 260여 번까지 다양한 회수로 발생하 였다. <Figure 5>는 이상 상태 유형에 따른 고장 발생 횟수 를 적은 것부터 많은 순으로 나열한 것이다. <Figure 5>를 통해 이상 상태 유형 발생의 분포를 확인할 수 있다.

    분석을 위해 각 센서(x1, …, x18)에서 수집된 데이터는 표준화(Normalization) 과정을 통해 전처리 한다. 이는 다 양한 센서에서 수집된 데이터들의 단위 차이에 따른 편 차가 분석에 주는 영향을 줄이기 위함이다. 표준화는 일 정한 분포적 특성을 갖도록 수치형 변수를 변환하는 방 법으로, 가장 많이 사용되는 최대값과 최소값을 사용한 표준화를 사용한다. 표준화를 통해 두 개 이상의 서로 다 른 단위의 데이터를 같은 기준으로 볼 수 있게 된다. 표 준화 수행 이후 모든 센서 데이터는 종류별로 0에서 1 사이의 값을 가지게 되며 표준화에 사용된 식은 아래와 같다.

    x i = x i , o r i g i n a l min ( x i , o r i g i n a l ) max ( x i , o r i g i n a l ) min ( x i , o r i g i n a l )

    3.2.2 Part Ⅱ-Multinomial logistic regression

    유지 보수 시스템의 데이터베이스에 저장된 이상 상 태는 구동부에 관련된 것들만 유형별로 200여 종 이상이 된다. 모든 이상 상태 유형에 대해서 센서 데이터를 기반 으로 주요 요인을 찾는 분석을 수행하는 것은 비효율적 이다. 모든 이상 상태 유형이 센서 데이터로 설명되는 것 이 아니기 때문이다. 특정 이상 상태 유형의 발생과 직접 적으로 연관되어 있는 센서 데이터가 존재해서 높은 상 관 관계가 나타날 수도 있고, 아닌 경우도 발생하기 때문 이다. 또한 이상 상태 유형별로 영향을 미치는 데이터 종 류가 다를 수가 있기 때문에, 각 이상 상태 유형에 따른 관련 센서 데이터들을 분석하고 정의하는 것을 많은 시 간과 노력이 필요하다. 이러한 문제로 인해 현장에서 모 든 이상 상태 유형을 센서 데이터로 분석하는 것은 문제 가 된다. 따라서, 센서 데이터와 밀접한 상관관계가 있어 특정 이상 상태 유형의 발생을 구별할 수 있는 것과 그 렇지 못한 이상 상태 유형을 확인하여 분석에 집중할 이 상 상태 유형의 종류를 줄이는 것이 필요하다. 즉, 이상 상태 유형이 센서 데이터 값의 특성에 의해서 구별되는 지 확인하기 위한 방법이 적용되어야 한다. 이를 위해 본 연구에서는 Multinomial logistic regression 기법을 적용한 다. Multinomial logistic regression은 범주형 종속변수를 독립변수의 선형결합으로 설명하는 방법으로, 센서 데이 터의 값들의 특성과 높은 상관관계를 가지는 특정 이상 상태 유형의 발생을 확인하고 찾기 위해 사용한다. 200 여 개의 이상 상태 유형(failure code)을 미리 테스트한 뒤에, 유의미한 결과를 보이는 세 개의 이상 상태 유형에 Multinomial logistic regression 방법을 적용하였다.

    <Table 2>의 첫 번째 열은 이상 상태 유형인 Failure code를 기록하고 있으며, 두 번째 열은 각 Failure code의 발생 회수를 나타내고 세 번째 열은 기록된 모든 유형의 이상 상태 발생 회수에 대한 각 Failure code별 발생 회 수 백분율을 계산한 것이다. 예를 들어 이상 상태 유형 ‘18180’은 총 262번 발생하였으며, 전체 이상 상태 발생 회수에서 7.67%를 차지하고 있다.

    아래 세 개의 이상 상태 유형이 발생한 경우에 기록된 센서데이터를 가지고 이상 상태 유형을 어느 정도 구분 해 낼 수 있는지를 Multinomial logistic regression으로 테 스트 하였으며, 그 결과는 <Table 3>과 같다.

    <Table 3>에 따르면 이상 상태 유형 ‘18180’이 발생한 경우의 센서 데이터로 이상 상태 유형 ‘18180’을 올바르 게 분류해 주는 경우가 9번이고, 이상 상태 유형 ‘14084’ 로 잘못 분류해 주는 경우가 1번, 이상 상태 ‘16378’로 잘 못 분류 하는 경우는 없는 것을 알 수 있다. 이상 상태 유 형 ‘18180’ 발생 시점의 센서 데이터에 따른 이상 상태 유 형 구분 정확도는 90%를 보이고 있으며, 전체적으로 각 센서 데이터의 이상 상태 유형 구분 정확도는 70% 정도 를 보여주고 있다. <Table 3>의 결과를 통해 센서 데이터의 측정값들의 특성에 의해서 이상 상태 유형을 구별하여 특 정할 수 있다는 것을 확인할 수 있다. Multinomial logistic regression을 사용하여 많은 종류의 이상 상태 유형에서 센서 데이터로 설명이 가능한 것들만 추출한다면, 다음 단계의 분석 대상을 적용하는 이상상태 유형 개수를 줄일 수 있다. 본 연구에서는 분류 정확도가 90%로 가장 높은 이상 상태 유형 ‘18180’에 대해서 이후 단계의 분석을 진 행한다.

    3.2.3 Part Ⅲ-이상 상태 주요 요인 추출

    앞 장의 Multinomial logistic regression 결과에 따르면 이상 상태 유형 ‘18180’이 발생할 때 기록된 센서 데이 터 값들의 특성은 다른 이상 상태 유형이 발생할 때 기 록된 데이터 값들의 특성과 다르기 때문에 분류가 잘 된 다는 것이다. 즉 이상 상태 유형 ‘18180’이 발생할 때 기 록된 센서 데이터 값들의 특성은 다른 이상 상태 발생 시점과 다른 특성을 보이고 있다. 따라서 이상 상태에서 센서 데이터 특성을 정상 상태에서 기록된 데이터들과 어떻게 다른지 확인하면, 어떤 센서에서 수집된 데이터 가 문제인지 찾을 수 있으며, 이와 관련된 부품을 찾으면 필요한 유지 보수를 수행할 수 있다는 것이다. 3.1장에서 언급하였던 것과 같이 현재 구축된 유지 보수 시스템의 데이터베이스에는 이상 상태가 발생한 시점에서의 데이 터들만 존재하기 때문에 이상 상태가 발생하지 않는 경 우, 즉 정상 상태의 데이터가 존재하지 않는다. 이상 상 태 유형 ‘18180’이 발생한 시점의 센서 데이터와 비교할 정상 상태에서 센서 데이터 값들이 존재하지 않기 때문 에, 이상 상태 유형 ‘18180’이 발생하지 않은 시간 동안에 수집된 데이터의 평균 값들과 이상 상태 ‘18180’이 발생 한 시점의 센서 데이터 값들의 평균을 비교하여 특이점 을 갖는 센서를 찾도록 한다. 설명의 편의를 위해 이상 상태 유형 ‘18180’이 발생하지 않은 경우에 기록된 센서 데이터의 평균값들을 ‘정상 상태’로 명명하고 이를 이상 상태에서의 센서 데이터 특징과 비교 분석에 이용한다. 다음의 세부 과정은 이상 상태와 정상 상태의 데이터를 비교하여 고장의 주요 요인을 찾는 방법을 설명하고 있다.

    Step 1. Factor analysis 기법을 사용하여 이상 상태 유형 발생의 주요 요인을 추출

    요인분석(Factor analysis)은 많은 변수들이 가지고 있 는 정보를 소수의 인자들로 구성하는 잠재적 구조 모형 이다. 요인 분석을 통해 변인들 간의 상호 관계를 분석하 여 이를 상관이 높은 변수들로 묶어 몇 개의 주요 요인 으로 축소할 수 있다. 많은 종류의 데이터를 주요한 소수 의 데이터로 축소할 수 있다는 점에서 분석의 복잡성을 줄여주기 때문에 다양한 자연적, 사회적 현상을 설명하 는 통계기법으로 사용되고 있다. 본 연구에서는 요인분 석을 사용하여 정상 상태일 경우와 이상 상태일 경우의 센서 데이터 값들을 주요한 요인에 대한 인자들로 구성 하고 이를 상호 비교함으로써 두 상태에서의 서로 다른 특성을 찾아내고자 한다.

    이상 상태 유형 ‘18180’의 발생이 없는 경우(정상 상 태)에 수집된 센서 데이터에 대해서 요인분석을 하여 도 출된 주요인은 znormal,1znormal,2 두 개로 나타났으며, 각각 의 센서 데이터가 주요인에 미치는 영향의 기여도는 아 래의 수식으로 표시된다.(1)

    Z n o r m a l , 1 = 0.716 x 1 + 0.830 x 3 + 0.977 x 4 + 0.976 x 5 + 0.877 x 7 + 0.595 x 10 + 0.569 x 16
    (1)

    Z n o r m a l , 2 = 0.863 x 14 + 0.957 x 15 + 0.734 x 16
    (2)

    동일한 분석을 이상 상태 유형 ‘18180’이 발생한 경우 의 센서 데이터에 적용하였을 때 도출된 이상 상태의 주 요인과 기여도는 아래와 같이 계산된다.(4)(5)(6)(7)

    Z a b n o r m a l , 1 = 0.9276 x 14 + 0.977 x 15 + 0.921 x 16
    (3)

    Z a b n o r m a l , 2 = 0.815 x 2 + 0.748 x 3 + 0.953 x 7
    (4)

    Z a b n o r m a l , 3 = 0.948 x 8 + 0.638 x 9 + 0.782 x 11
    (5)

    Z a b n o r m a l , 4 = 0.814 x 4 + 0.990 x 5
    (6)

    Z a b n o r m a l , 5 = 0.894 x 10 + 0.583 x 11
    (7)

    정상 상태에서의 주요인은 znormal,1znormal,2로 나타나는 데 반해 이상 상태의 주요인은 zabnormal,1에서 zabnornal,5로 표 현되고 있다. 이는 정상 상태와 이상 상태의 데이터가 서 로 다른 특성을 가지고 있다는 것을 의미한다. 여기서 정 상 상태의 주요인 znormal,2(식 (2) 참조)와 이상 상태의 주 요인 zabnormal,1(식 (3) 참조)은 같은 센서 데이터들로 구성 되어 있어 정상 상태와 이상 상태 모두에서 동일한 특성 을 가지고 있는 것으로 판명되어 다음 단계의 분석에서 제외하였다. 이후 단계에서는 남아있는 주요인들에 포함 된 센서 데이터에 대한 분석을 진행한다.

    Step 2. 정상 상태와 이상 상태의 주요인에 속한 센서 데 이터들 간의 상관관계 분석

    전 단계에서 서로 다른 특징을 보이는 주요인들에 속 한 센서 데이터들 사이의 상호 관련성 차이를 알아보기 위하여 상관관계 분석을 실시한다. 상관관계는 두 변수 가 서로 관련성이 있는지 확인하기 위해 사용하는 기법 이며 상관관계의 정도를 나타내는 수치를 상관계수(r)라 한다. 상관관계는 한 변수의 값이 증가할 때 다른 변수의 값이 같이 증가하는 경우에는 양의 상관관계라고 하고, 한 변수의 값이 증가할 때 다른 변수의 값이 감소하는 경우에는 음의 상관관계라고 한다. 두 변수 사이 어떠한 관계도 없는 경우에는 무상관이라고 한다. 상관계수는 항상 -1 ≤ r ≤ 1을 만족시키며, 양의 상관관계는 r > 0, 음의 상관관계가 있을 때는 r < 0이다. 무상관일 경우는 r = 0 근처에 가까운 값이 되며, 0.6 이상이거나 -0.6 이 하인 경우 두 변수 사이에 강한 상관관계를 가지고 있다 고 말하고 있다. Step 1의 요인분석을 통해 서로 상관이 높은 변수를 묶어서 주요인을 결정하였고, 상관관계 분 석은 주요인에 속한 센서 데이터들 사이의 상관관계가 정상 상태와 이상 상태일 경우 어떻게 달라졌는지 확인 하기 위하여 사용한다. 아래 <Table 4>는 정상 상태인 경우 주요인(znormal,1)에 포함된 센서 데이터 사이의 상관 계수를 계산하고 이를 이상 상태인 경우의 동일 센서 데 이터 사이의 상관계수와 비교한 것이다.

    <Table 4>의 상관관계 분석 결과에 따르면, x1(열차 속 도)과 x3(브레이크 힘)의 경우 정상 상태일 때 상관계수 가 0.596으로 통계적으로 의미 있는 값을 가지고 있는 것에 반하여 이상 상태일 경우 동일한 센서 데이터들(x1x3) 사이의 상관계수는 0.202라는 통계적으로 유의하 지 않는 값을 가지고 있다. 이는 정상 상태에서의 x1(열 차 속도)과 x3(브레이크 힘) 사이의 상관관계가 이상 상 태에서의 x1(열차 속도)과 x3(브레이크 힘)의 관계와 다르 게 나타나고 있다는 것을 의미한다. 예를 들어 운행자가 전기기관차를 멈추려고 브레이크에 힘을 가할 경우에 x1(열차 속도)가 높아짐에 따라 브레이크에 걸리는 x3(브 레이크 힘)의 크기도 함께 증가하는 것이 정상 상태의 상관관계라고 하면, 이상 상태 ‘18180’이 발생한 경우에 서는 이러한 경향이 나타나지 않는다는 것이다. x1(열차 속도)과 x4(참조 토크)의 상관관계는 정상 상태일 때 상 관계수가 0.695이고 이상 상태일 때는 -0.027을 보여주고 있다. 이는 정상 상태일 경우 운행자가 전기기관차의 x1 (열차 속도)을 증가하려고 할 때 x4(참조 토크)에 걸리는 부하 또한 함께 증가하는 것이 정상 상태의 관계이지만, 이상 상태가 발생한 경우는 x1(열차 속도)을 증가하려고 할 때 x4(참조 토크)에 걸리는 부하가 제대로 작용하지 않는다는 것을 알 수 있다. 추가적으로 x3(브레이크 힘) 과 x4(참조 토크)의 관계의 경우 정상 상태일 때 상관계 수는 0.802로 높은 양의 상관관계를 보이고, 이상 상태 일 경우 0.055로 무상관에 가깝다. 이는 정상 상태일 경 우 높은 속도로 달리고 있는 경우 x4(참조 토크)의 부하 량이 크기 때문에 운행자가 전기기관차를 정지하려고 할 경우에 x3(브레이크 힘)에도 더 높은 힘이 가해진다 는 것이다. 이에 반해 이상 상태일 경우 이러한 관계가 나타나지 않는다는 것을 알 수 있다. 전체적으로 상관관 계분석을 통해 주목할 만한 특성을 가진 센서 데이터들 은 정상 상태에서 강한 상관관계를 가지고 있지만 이상 상태에서 무상관 관계를 가지는 특성을 보이는 센서 데 이터들이다. 모든 센서 데이터 사이의 상관관계 중에서 큰 차이점을 보이는 것들은 <Table 4>에서 별표(*)로 표 시하였다. <Table 4>에 의하면 이상 상태와 정상 상태에 서 서로 다른 상관관계 특성을 보이는 조합은 10개 쌍으 로 확인된다.

    <Table 5>는 이상 상태의 주요인에 포함된 센서 데이 터들 사이의 상관관계를 계산하고, 이를 정상 상태인 경우 의 동일 센서 데이터 사이의 상관관계와 비교한 것이다. <Table 5>에서 이상 상태와 정상 상태에서 서로 다른 상 관관계를 보이는 센서 데이터 조합은 다섯 쌍이 있으며, <Table 5>에서 별표로 표시되어 있다. <Table 5>에 따르 면 이상 상태에서 열차의 구동계 x2(입력 전류)와 x3(브레 이크 힘)의 경우는 0.692로 높은 상관관계를 보이고 있지 만, 정상 상태에서는 -0.010으로 상관관계가 높지 않음을 알 수 있다. 이는 정상 상태에서는 상호 연관성이 없는 센서 데이터들이 이상 상태에서 상호 연관성이 발생하는 것으로 생각된다.

    Step 2의 <Table 4>에서 정상 상태일 경우 양의 상관 관계를 가지고 있으나 이상 상태일 경우에는 무상관 관 계를 가지는 변수 조합들을 확인할 수 있으며, <Table 5>에서는 정상 상태에서 무상관 관계에 있는 센서 데이 터들이 이상 상태가 되면서 양의 상관관계를 가지는 변 수 조합들이 발생함을 알 수 있다. 따라서, 다음 단계에 서 고장에 영향을 미칠 수 있다고 의심할 수 있는 변수 들 간의 조합은 총 15개로 전체 고려해야 할 변수 조합 ((18×18)-18/2 = 153 조합)보다 훨씬 줄어들었다. 이는 분 석 범위의 정량적 조사의 범위를 축소하여 분석의 노력 을 감소시키고 정확도를 높이는 역할을 한다.

    Step 3. 산점도를 사용한 센서 데이터들의 상관관계 변화 원인에 대한 특이점 확인

    산점도란 두 개 이상 변수의 동시 분포에서 각 개체의 데이터를 점으로 표시한 그림이다. 두 변수의 관계를 시 각적으로 검토할 때 사용하며, 변수들 사이의 관계를 왜 곡시키는 특이점을 확인하는데 유용하다. 본 연구에서는 Step 2에서 정상 상태일 때와 이상 상태일 때 상호 연관 성이 급격히 바뀐 변수 조합들을 시각적으로 검토하기 위해 사용한다.

    <Figure 6>의 산점도는 Step 2에서 발견된 15개의 센서 중 x3(브레이크 힘)과 x5(측정 토크)의 조합에 대해 정상 상태와 이상 상태를 그린 산점도이다. <Figure 6(a)>의 정상 상태일 경우이며, <Figure 6(b)>는 이상 상태일 경우이다.

    <Figure 7>은 브레이크에 걸리는 힘(x3)과 토크(x4) 사 이의 관계를 나타낸 산점도이다. 산점도의 비교를 통해 데이터 값들의 특이점이 존재하는 지를 확인 할 수 있다.

    <Figure 6>과 <Figure 7>의 두 센서 데이터 조합들은 모두 Step 2에서 상관계수가 정상 상태일 경우와 이상 상태일 때가 큰 차이를 보이고 있다. 이는 <Figure 6>과 <Figure 7>의 산점도 그래프 비교에서 서로 다른 특징으 로 나타남을 확인할 수 있다. <Figure 6>의 x3(브레이크 힘)과 x5(측정 토크)의 산점도는 모든 데이터들이 선형직 선에 존재하여 어느정도 뚜렷한 상관관계를 보이고 있 다. 이와 달리 산점도 x3(브레이크 힘)와 x4(참조 토크)의 경우 정상 상태일 경우와 이상 상태일 경우의 산점도 모 두 선형 직선에서 벗어나고 있다. 이는 x3(브레이크 힘) 의 크기가 변화할 때 x5(측정 토크)의 힘이 일정하게 비 례하는 관계를 보여주는 반면 x3(브레이크 힘)의 크기가 변할 때 x4(참조 토크)가 비례적으로 같은 값을 가지지 못하고 있는 것을 알 수 있다.

    Step 3을 통하여 x3(브레이크 힘)과 x4(참조 토크)의 사 이에 관계가 선형 직선에서 벗어나는 데이터가 이상 상 태에서 존재함을 알 수 있다.

    Step 4. 상대도수밀도분포를 통한 데이터 분포 확인

    Step 3의 x3(브레이크 힘)와 x4(참조 토크)의 관계에서 비례적으로 변하지 않는 특이 데이터들이 존재하는 것을 확인하였다. 이 두 변수 중에 어떤 변수가 더 비례적인 선형 관계를 나타내지 못하게 하는 영향을 미쳤는지 확 인하기 위하여 먼저 상대도수밀도분포를 이용하여 데이 터 분포를 확인한다. 다음의 <Figure 8>~<Figure 9>는 x3(브레이크 힘)과 x4(참조 토크)의 상대도수밀도분포를 작성한 결과이다.

    <Figure 8>은 정상 상태인 경우에 수집된 x3(브레이크 힘)의 데이터 값들과 이상 상태에서 수집된 x3(브레이크 힘)의 데이터 값들을 밀도에 따라 나타낸 상대도수밀도 분포도이다. 실선이 표시된 부분은 정상 상태의 경우이 며 점선이 표시된 부분은 이상 상태의 데이터이다. 정상 상태의 데이터에서 우측으로 밀집된 큰 수치를 가진 데 이터들이 존재하고 있다. 실선의 데이터는 이번 분석에 서 정상 상태로 설정한 데이터이지만 다른 고장의 유형 들을 여러 가지 섞어 놓은 데이터 집합체이다. 따라서 다 른 이상 상태 유형이 과하게 데이터 값을 영향을 미치는 부분이 있어 우측에 밀집되어 있는 과특성 데이터들을 제거하여 보다 평균적인 데이터 분포를 가지도록 한다. 과특성 데이터를 제거한 후의 상대도수밀도분포는 아래 <Figure 9>와 같다.

    <Figure 9>를 통해서 정상 상태와 이상 상태의 x3(브레 이크 힘)의 데이터 분포가 유사함을 알 수 있다.

    x4(참조 토크)의 데이터 또한 x3(브레이크 힘)과 동일한 과특성 데이터가 존재하여 분석에 잘못된 영향을 가할 수 있는 데이터를 제거하여 분포를 비교하였다.

    Step 4를 통해서 비교하려는 두 집단의 분포를 확인하 고 원인 진단에 방해요소가 되는 데이터들을 제거하여 동일한 분포로 정리하였다.

    Step 5. F-test를 통한 검정과 추정

    Step 5~Step 6에서는 Step 3에서 찾아낸 x3(브레이크 힘) 과 x4(참조 토크) 두 변수 중 어떠한 데이터 때문에 비례 적인 관계에서 벗어난 데이터들이 발생하였는지 파악하 기 위하여 각 변수의 정상 상태와 이상 상태의 데이터 값들에 대한 통계적인 검정을 수행한다. 예를 들어 이 상 상태의 x3(브레이크 힘)과 정상 상태의 x3(브레이크 힘)의 평균이 통계적으로 동일할 때 이상 상태의 x4(참 조 토크)와 정상 상태의 x4(참조 토크)의 평균이 통계적 으로 유의하지 않다면 이 데이터 때문에 비례적인 관계 를 보이지 않는다고 확인할 수 있다. 이를 위해 먼저 F-test를 수행하며, F-test는 T-test를 시행하기에 앞서서 x3(브레이크 힘)과 x4(참조 토크)인 각 변수의 이상 상태 일 경우와 정상 상태일 경우의 분산에 차이를 검증하는 데 사용한다. F- test의 유의수준은 엄격한 검정을 위해 0.01로 한다.

    F-test의 귀무가설은 H0: σ n o r m a l 2 = σ a b n o r m a l 2 으로 정상 상 태와 이상 상태의 분산이 차이가 없다는 것이고, 대립가 설은 H 1 : σ n o r m a l 2 σ a b n o r m a l 2 로 정상 상태와 이상 상태의 데 이터 분산의 차이가 있다는 것이다.

    x3(브레이크 힘)과 x4(참조 토크)의 F-Test 검정 결과 유의수준 0.01에서 이상 데이터와 정상 데이터의 동일 센 서 데이터들 간의 분산이 같다는 결과가 도출되었다.

    Step 5를 통해 각 변수의 이상 상태와 정상 상태의 경 우 등분산성을 만족하였음으로 다음 단계에서 등분산을 가정한 T-test를 실행한다.

    Step 6. T-test를 통한 검정과 추정

    T-test란 모집단의 분산을 모르는 경우 두 모집단의 평균의 차이가 통계적으로 유의한지 판단할 때 사용하 는 통계적 기법으로 본 연구에서는 정상 상태의 데이 터 평균과 이상 상태의 데이터 평균이 서로 다른지 검증 하여 이상 상태 요인이 맞는지 확인하기 위해 사용한 다. T-test에서 설정한 가정에서 귀무가설은 H 0 : μ n o r m a l 2 = μ a b n o r m a l 으로 정상 상태와 이상 상태의 평균의 차이가 없 다는 것이고, 대립가설은 H 1 : μ n o r m a l μ a b n o r m a l 로 정상 상 태와 이상 상태의 평균의 차이가 있다는 것이다. 즉, 정 상 상태의 데이터 평균과 이상 상태의 데이터 평균이 서 로 동일하여 데이터의 특성에서 차이점이 없다는 것이 귀무가설이고 차이가 있다는 것이 대립가설이다. T-test 를 위한 유의수준은 0.01로 설정하였으며, 결과는 아래 <Table 7>과 같다. <Table 6>

    <Table 7>에 따르면 x3(브레이크 힘)의 T-test 검정 결 과는 유의수준 0.01에서 정상 상태와 이상 상태의 데이 터 평균이 서로 다르다는 점을 알 수 있다. x4(참조 토크) 의 경우에는 정상 상태와 이상 상태의 데이터 평균이 같 아서 서로 다른 특성을 보이지 않는다는 결과가 나타났 다. 즉, 이상 상태 ‘18180’이 발생한 경우에 기록된 x3(브 레이크 힘)의 값은 정상 상태일 때 기록된 값과 다른 특 징을 가지고 있다는 것을 확인할 수 있다. 이는 x4(참조 토크)의 값이 변할 때 x3(브레이크 힘)의 값이 비례하여 변하지 않는 데이터가 존재함을 알 수 있다.

    이번 단계에서 수행하는 T-test를 통해 정상 상태와 다 른 특성을 보이는 센서 데이터를 선별하여 특정 이상 상 태 유형의 발생에 영향을 미치는 주요 센서 데이터를 알 수 있다.

    Step 1-6을 통해서 이상 상태 ‘18180’에서는 x3(브레이 크 힘)의 영향이 가장 큰 것을 확인할 수 있다. x3은 브레 이크에서 측정된 제동력으로 이에 수반되는 속력과 브레 이크 등 여러 요인과의 상관성이 있을 것으로 추정되며, 정상 상태의 경우보다 신뢰수준 99%로 최대 -20.25에서 최소 -1.756 가량 차이를 보인다. 실제의 정상 상태에 수 집된 데이터와 특정 이상 상태의 데이터 분포가 일정하 게 나타날 경우 더욱 정확한 분석이 가능할 것이며, 충분 한 데이터가 수집된다면 앞으로 발생할 이상 상태를 미 리 예측하여 적절한 유지 보수(보전예방, 예방보전 등)를 할 경우 높은 신뢰도를 제고할 것이다.

    4 결 론

    본 논문에서 제안된 방법론은 운용 중인 전기기관차 에서 수집된 센서 데이터를 사용하여 특정 이상 상태가 발생하는 주요 요인을 분석하는 것이다. 제안된 방법론 을 통해 다양하게 발생된 이상 상태에서 분석 가능한 특 정 이상 상태를 한정하고 이 이상 상태를 발생하게 한 주요 원인이 되는 센서 데이터를 찾을 수 있다. 이를 위 해 사용된 분석 방법은 Multinomial logistic regression과 Factor analysis 등의 다양한 통계적 기법을 사용하고 있 다. 본 연구에서 분석 대상이 된 전기기관차에 제안된 방 법론을 적용하여 특정 이상 상태(Failure code ‘18180’)의 발생한 주요 요인으로 브레이크 관련 부품을 확인할 수 있었으며, 이를 통해 제안된 방법론의 유용성을 증명하 였다. 본 연구에 제안된 방법을 통해 대용량 운용 데이터 의 분석 범위를 좁히고 정확도를 높여 고장의 주요 요인 을 체계적으로 찾을 수 있다.

    또한, 본 연구에서 제안된 방법론은 이상 상태가 발생 하는 경우에 수집된 데이터만 사용하여 분석을 진행하였 다는 점에서 정상 상태와 비교 데이터가 없는 경우에 적용 할 수 있다는 점에서 활용 범위가 더 넓다고 할 수 있다. 이에 반하여 비교 대상이 되는 정상 상태 데이터가 존재 할 경우 더 정확한 결과를 도출할 수 있다는 점에서 확장 가능성을 앞으로 더 연구해야 하는 부분이 필요하다.

    향후 연구에서는 근본원인 분석을 통해 고장 유형에 영향을 가하는 센서 데이터들을 활용하여 활발하게 연구 중인 PHM(Prognostics and Health Management)을 적용하 여 고장 유형이 다양한 형태를 가지는 복잡한 정비에 알 맞은 상태 기반 정비[4, 10]를 통해 언제 고장 수준에 도 달할지 알려주는 모델을 개발과 본 연구와 통합을 통해 유지 보수의 효율성을 증가시키도록 할 예정이다.

    Acknowledgement

    Following are results of a study on the “Leaders in Industry- university Cooperation+” Project, supported by the Ministry of Education and National Research Foundation of Korea.

    Figure

    JKISE-41-84_F1.gif

    Electric locomotive(Source : www.hfkern.de)

    JKISE-41-84_F2.gif

    Analysis Procedure

    JKISE-41-84_F3.gif

    Database Structure of Maintenance System

    JKISE-41-84_F4.gif

    System Architecture of Driving Part and Related Sensors

    JKISE-41-84_F5.gif

    Distribution of Failure Code Occurrence

    JKISE-41-84_F6.gif

    Scatter Plot of x3 and x5

    JKISE-41-84_F7.gif

    Scatter Plot of x3 and x4

    JKISE-41-84_F8.gif

    Relative Frequency Distribution Comparison between Normal x3 Data and Abnormal x4 Data

    JKISE-41-84_F9.gif

    Relative Frequency Distribution of Normal x3 Data and Abnormal x4 Data After Elimination of Outliners

    Table

    Sensor Data of Driving Part

    Tested Failure Codes for Multinomial Logistic Regression

    Results of Multinomial Logistic Regression

    Comparison Correlation of Abnormal Status Factor with Respect to Normal Status Factors

    *High difference between normal state and abnormal state.

    Comparison Correlation of Normal Status Factor with Respect to Abnormal Status Factors

    *High difference between normal state and abnormal state.

    Results of F-test

    Results of T-test

    Reference

    1. A.H. Bonnett (2000) Root cause AC motor failure analysis with a focus on shaft failures., Journal of IEEE Transactions on Industry Applications, Vol.36 (5) ; pp.1435-1448
    2. R. Bryant (1986) Graph-based algorithms for boolean function manipulation., Journal of IEEE Transaction on Computers, Vol.35 (8) ; pp.677-691
    3. B.H. Cho , B.S. Yum , S.A. Kim (2016) Calculation of Top Event Probability of Fault Tree using BDD., Journal of the Korea Institute of Information and Communication Engineering, Vol.20 (3) ; pp.654-662
    4. S.J. Cho , H.B. Jun , J.H. Shin , H.J. Hwang (2014) A Study on Estimating the Next Failure Time of a Compressor in LNG EPSO., Journal of Society Korea Industrialand Systems Engineering, Vol.37 (4) ; pp.12-23
    5. H. Efendic , L. Del Re (2005) Iterative Multilayer Fault Diagnosis Approach for Complex System, Proceedings of the International Conference on Electronics, ; pp.138-143
    6. Z. He , Y. He , Y. Wei (2016) Big data oriented root cause identification approach based on PCA and SVM for product infant failure, Proceeding of Prognostics and System Health Management Conference, ; pp.1-5
    7. H. Jung , J.W. Kim (2017) A Machine Learning Approach for Mechanical Motor Fault Diagnosis., Journal of Society of Korea Industrial and Systems Engineering, Vol.40 (1) ; pp.57-64
    8. W. Jung (2010) Reliability Estimation of Agricultural Machinery Components Based on QFD and Failure Mechanism Analysis., Journal of Society of Korea Industrial and Systems Engineering, Vol.33 (4) ; pp.209-217
    9. H.J. Kim , D.P. Hong , W.T. Kim (2013) A Study on Real-Time Fault Monitoring Detection Method of Bearing Using the Infrared Thermography., Journal of The Korean Society For Nondestructive Testing, Vol.33 (4) ; pp.330-335
    10. I.S. Kim , Y. Jang , W. Jeong (2015) Recent Failure Types of Air Equipment and Changes in Prevention maintenance Policy, Proceedings of the Korea Reliability Society, Suwon, Korea, pp. 339-344.,
    11. C.Y. Lee (1959) Representation of Switching Circuits by Binary-Decision Programs., Journal of the Bell System Technical, Vol.38 (4) ; pp.985-999
    12. R. Lsermann (2006) Fault-Diagnosis Systems : An Introduction from Fault Detection to Fault Tolerance., Springer Science & Business Media,
    13. H.S. Mun , S.L. Seo , H.S. Na (2014) Failure Mode Analysis of Variable Gauge Bogie of Scale model by using Fail Tree Analysis, Proceedings of The Korean Society of Railway Spring Conference, ; pp.334-344
    14. B.N. Park , H.J. Joo , C.H. Lee , S.S. Lim (2009) A Study on FMEA for Railway Vehicle, Proceedings of The Korean Society of Railway Spring Conference, ; pp.162-168
    15. S. Shcherbovskykh , T. Stefanovych (2015) Failure cause analysis of pressure vessel protective fittings with loadsharing effect between valves, International Conference on CAD Systems in Microelectronics (CADSM), ; pp.385-387