Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)
Journal of Society of Korea Industrial and Systems Engineering Vol.38 No.4 pp.117-131
DOI : https://doi.org/10.11627/jkise.2015.38.4.117

Data Envelopment Analysis with Imprecise Data Based on Robust Optimization

Sungmook Lim†
Dongguk Business School, Dongguk University, Seoul
Corresponding Author : sungmook@dongguk.edu
October 1, 2015 November 11, 2015 December 3, 2015

Abstract

Conventional data envelopment analysis (DEA) models require that inputs and outputs are given as crisp values. Very often, however, some of inputs and outputs are given as imprecise data where they are only known to lie within bounded intervals. While a typical approach to addressing this situation for optimization models such as DEA is to conduct sensitivity analysis, it provides only a limited ex-post measure against the data imprecision. Robust optimization provides a more effective ex-ante measure where the data imprecision is directly incorporated into the model. This study aims to apply robust optimization approach to DEA models with imprecise data. Based upon a recently developed robust optimization framework which allows a flexible adjustment of the level of conservatism, we propose two robust optimization DEA model formulations with imprecise data; multiplier and envelopment models. We demonstrate that the two models consider different risks regarding imprecise efficiency scores, and that the existing DEA models with imprecise data are special cases of the proposed models. We show that the robust optimization for the multiplier DEA model considers the risk that estimated efficiency scores exceed true values, while the one for the envelopment DEA model deals with the risk that estimated efficiency scores fall short of true values. We also show that efficiency scores stratified in terms of probabilistic bounds of constraint violations can be obtained from the proposed models. We finally illustrate the proposed approach using a sample data set and show how the results can be used for ranking DMUs.


부정확한 데이터를 가지는 자료포락분석을 위한 로버스트 최적화 모형의 적용

임 성 묵†
동국대학교 서울캠퍼스 경영대학

초록


    Dongguk University

    1.서 론

    자료포락분석(Data Envelopment Analysis, DEA)은 다 수의 투입요소와 산출요소를 가지는 의사결정단위(Decision Making Unit, DMU)들의 상대적 효율성을 측정하기 위한 선형최적화 기반의 방법으로서, Charnes et al.[4]에 의해 개발된 이후로 수많은 이론적 연구 및 실무적 활용이 이 루어져 왔다[5, 9].

    DEA 모형이 가지는 특징 중의 하나는 DMU들에 관한 관찰 데이터에 기반하여 실증적으로 생산가능집합을 추 정한다는 점이다[8]. DEA가 가지는 데이터 기반 실증적 모형이라는 특징은 생산함수에 대한 가정을 요구하지 않 는다는 장점으로 작용하는 동시에 데이터의 불확실성, 측 정오류 등에 의해 생기는 변동에 큰 영향을 받는다는 단 점으로 나타나기도 한다[18]. DEA가 데이터의 경향성을 추정하는 회귀 모형과는 달리 효율적 경계선에 기반하여 효율성을 추정하는 모형이라는 점에서 데이터 변동에 따 른 영향은 더욱 크게 나타난다.

    기본적인 DEA 모형에서는 투입요소 및 산출요소의 정 확한 값이 주어지는 것을 가정한다. 하지만 앞서 언급한 대로 DEA 모형의 효율성 계산결과는 데이터의 변동에 크게 영향을 받게 되므로, 투입요소 및 산출요소 값이 부 정확한 경우 이에 따른 변동성을 고려하는 것이 모형의 실무적 활용도를 높이기 위해 필요하다. DEA와 같은 최 적화 수리 모형에서 데이터의 부정확성을 고려하기 위해 일반적으로 취하는 방법은 민감도 분석(sensitivity analysis) 을 수행하는 것이다[10, 15]). 즉, 고정적인 투입요소 및 산출요소의 값을 가정하여 DEA 모형을 풀어 효율성 점 수를 계산한 후, 투입요소 및 산출요소의 변화에 따른 효 율성 점수의 영향관계를 분석하는 방식으로 데이터의 부 정확성을 감안하는 방법이다. 그러나 민감도 분석은 사후 적인 분석 방법이라는 점에서 한계가 존재하며, 보다 직 접적으로 사전적인 수단으로 데이터의 부정확성을 DEA 모형 내에 도입하여 분석하는 방법이 필요하다.

    데이터의 부정확성을 직접적으로 DEA 모형 내에 포함 시켜 분석하는 방법으로 가장 대표적인 것이 Cooper et al. [6]의 IDEA(Imprecise DEA) 모형이다. IDEA 모형에서는 투입요소 및 산출요소의 값이 상하한 값을 가지는 구간 (interval)의 형태로 표현되거나 요소들 간 순위 관계의 형 태로 표현되는 경우를 가정한다. 데이터 값들을 변수의 형태로 표현함으로써 IDEA 모형은 비선형 최적화 모형 이 되고, Cooper et al.[6]는 척도변환(scale transformation) 과 변수치환(variable alternation)을 통해 이를 선형최적화 모형으로 변환한다.

    Despotis and Smirlis[7]는 복잡한 척도변환과 변수치환 대신에 간단한 변수치환만으로도 IDEA 모형을 선형화할 수 있음을 보였고, 이와 더불어 주어진 데이터 부정확성 하에서 효율성 점수의 상하한을 도출할 수 있음도 보였 다. Zhu[19, 20]도 이와 유사하게 비선형 최적화 모형인 IDEA 모형이 사실상 간단한 변수치환을 통해 선형최적 화 모형으로 변환할 수 있다는 사실을 보인 바 있다.

    한편, 일반적인 최적화 문제에서 데이터의 부정확성 (불확실성)을 처리하는 방법 중 하나로 최근 들어 많은 연구가 이루어지고 있는 분야는 로버스트 최적화이다. 로버스트 최적화는 주어진 문제를 구성하는 데이터의 불 확실성이 최악의 경우로 발현되는 경우에 대해 가장 최 선의 해를 찾는 방법으로서, 데이터 불확실성 내의 어떠 한 경우에라도 제약조건을 만족시킬 수 있는 해 중에서 가장 목적함수의 값을 최적으로 만드는 해를 찾는 것을 기본 개념으로 한다. 선형최적화에서의 로버스트 최적화 모형을 처음 제안한 연구는 Soyster[17]인데, 제약식 각 열벡터의 불확실성이 상호 독립적인 볼록집합의 형태로 주어지는 경우를 고려하였으며 선형최적화의 형태로 모 형화할 수 있음을 보였다. 그러나 이러한 로버스트 최적 화 접근법은 지나친 보수성(conservatism)을 가진다는 단 점이 있는데, 도출되는 해가 어떠한 경우에라도 가능해 가 되는 강건성(robustness)은 가지지만 데이터의 명목값 (nominal values)에 대한 해당 해의 최적성은 심각하게 저해되는 경향이 있다. 해의 강건성이 높은 수준으로 요 구되는 제어시스템 등의 응용에서는 로버스트 최적화가 유용하지만, 대부분의 경영과학 관련 의사결정문제에서 는 그렇지 않기 때문에 로버스트 최적화의 활용이 제한 적이었다.

    Ben-Tal and Nemirovski[2]는 상기와 같은 로버스트 최 적화의 과도한 보수성을 일정 부분 완화하기 위해 선형 최적화 문제에서의 데이터 불확실성을 타원체의 형태로 모형화하는 로버스트 최적화 모형을 제안하였고, 볼록최 적화 문제의 일종인 원추 이차계획법 문제로 변환되어 효율적인 내부점 해법의 적용이 가능해 짐을 보인 바 있 다. 이 모형에서는 데이터 불확실성을 나타내는 타원체 의 크기를 조절함으로써 해의 강건성과 최적성 간의 균 형을 탄력적으로 조정할 수 있도록 하였다.

    Bertsimas and Sim[3]은 선형최적화 문제에 대한 새로 운 형태의 로버스트 최적화 접근법을 제안하였는데, 데 이터의 불확실성은 구간의 형태로 가정한 후 각 제약식 내에서 명목 값으로부터의 변동이 허용되는 계수의 개수 를 제한하는 방식을 취함으로써 해의 강건성과 최적성 간의 균형을 조정하도록 하였다. 또한 변동 허용 계수의 개수에 따른 제약조건 위반 확률에 대한 상한을 제시하 였다. 이들 모형의 장점은 Ben-Tal and Nemirovski[2]의 모형과는 달리 선형최적화의 형태로 로버스트 최적화 문 제를 변환할 수 있다는 점이다.

    본 연구에서는 Bertsimas and Sim[3]의 로버스트 최적 화 접근법을 적용하여 부정확한 데이터를 가지는 DEA 모형에 대한 해법을 개발하고자 한다. DEA 모형은 어떤 관점에서 효율성을 측정하는지에 따라 승수모형(multiplier model)과 포락모형(envelopment model)으로 구분될 수 있 으며, 그들 간에는 쌍대관계가 성립한다. 승수모형은 일 정 제약조건 하에서 평가대상 DMU의 효율성 점수를 최 대로 만드는 투입요소 및 산출요소 가중치를 결정하는 최 대화 문제인 반면, 포락모형은 평가대상 DMU와 효율적 경계선 간의 거리를 측정하여 효율성 점수를 결정하는 최 소화 문제의 형태를 가진다. 정확한 값의 데이터를 가지 는 DEA 모형에서는 승수모형과 포락모형의 풀이 결과가 동일하지만, 부정확한 데이터를 가지는 경우에 대해 로버 스트 최적화를 적용하면 전혀 다른 결과가 도출된다. 이 에, 본 연구에서는 두 가지 모형 각각에 대한 로버스트 최 적화 접근법 적용 결과를 제시하고, 각각의 모형에서 서로 다른 유형의 위험이 고려되고 있다는 점을 밝히고자 한 다. 또한, 두 가지 모형을 통해 확률적 척도로 계층화되는 효율성 점수의 범위를 도출할 수 있음을 보이고자 한다. 이러한 효율성 점수의 범위는 DMU들 간의 순위를 결정 하는 등의 용도로 유용하게 활용될 수 있다.

    로버스트 최적화 접근법을 DEA 모형에 적용한 최근의 연구로는 Sadjadi and Omrani[12, 13], Sadjadi et al.[14], Shokouhi et al.[16]이 있다. Sadjadi and Omrani[13]는 로 버스트 최적화 방법을 DEA에 적용한 최초의 연구로 볼 수 있고, Sadjadi and Omrani[12]는 이 연구에 부트스트 래핑 기법을 추가적으로 적용하였다. 그들의 연구는 산 출요소에서의 부정확성만을 반영한 모형을 제시함으로써 그 응용범위가 상당히 제한적이었다. 또한 승수모형에 대 한 결과만을 제시하고 있어 데이터 부정확성이 DEA 모형에 서 가지는 위험들 중 하나의 측면만을 고려한다는 한계 가 있었다. 반면 본 연구에서는 포락모형에서의 데이터 부 정확성도 동시에 고려할 필요가 있다는 점을 논의하도록 한다(제 4.3절). 이러한 문제점을 인식하여, Sadjadi et al. [14]은 투입요소 및 산출요소의 부정확성을 동시에 고려 하면서 Ben-Tal and Nemirovski[2]의 로버스트 최적화 접 근법을 포락모형에 적용한 결과를 제시한 바 있다. 그러 나 그들의 모형은 선형계획법이 아닌 원추 이차계획법 모형으로 정형화되어 해법 측면의 실용성이 다소 떨어지며, 또한 포락모형만을 고려하고 있어 Sadjadi and Omrani [13]의 문제점과 유사하게 데이터 부정확성이 DEA 모형 에서 가지는 위험들 중 다른 하나의 측면만을 고려한다 는 한계점이 있다. 한편, Shokouhi et al.[16]은 구간 데이 터를 가지는 DEA를 위한 Despotis and Smirlis[7]의 두 가지 모형 중 낙관적 모형에 대해 Bertsimas and Sim[3] 의 로버스트 최적화 접근법을 적용하였고, 주어진 데이 터 부정확성 하에서 효율성 점수 최대값부터 최소값까지 특정 파라미터의 조정을 통해 계산해 낼 수 있음을 보였 다. 그러나 그들의 연구는 Bertsimas and Sim[3]가 제시 한 로버스트 최적화의 기본적인 개념을 엄밀하게 적용했 다고 볼 수 없다. 원칙적으로 로버스트 최적화는 명목값 을 중심으로 데이터의 변동성을 고려하여야 하나, 그들의 모형에서는 데이터 구간의 한 극단값을 시작점으로 하여 변동성을 고려하고 있다. 이 경우 Bertsimas and Sim[3] 가 제시하고 있는 제약식 위반 확률에 대한 논의가 어렵 게 되고, 실제 그들의 연구에서 그러한 논의가 누락되어 있다. 또한, 승수모형 측면에서의 로버스트 최적화만을 제시하고 있어 데이터 부정확성이 DEA 모형에서 가지 는 두 가지 측면의 위험을 포괄적으로 논의할 수 없게 된다.

    본 연구는 상기와 같은 기존 연구의 한계를 극복하려 고 하며, 다음과 같은 구성으로 논의를 진행한다. 제 2장 에서는 데이터 불확실성이 구간의 형태로 주어지는 경우 에 대한 기존의 IDEA 모형을 제시하고, 제 3장에서는 일 반적인 선형최적화에 대한 Bertsimas and Sim[3]의 로버 스트 최적화 접근법에 대해 논의한다. 이어서 제 4장에 서는 투입지향 BCC 모형[1]의 승수모형 및 포락모형을 대상으로 투입요소 및 산출요소 데이터가 구간의 형태로 주어지는 경우에 대한 로버스트 최적화 접근법의 적용 결과를 제시하고, 도출되는 효율성 점수 및 고려되는 위 험의 특성에 대해 논의한다. 제 5장에서는 수치 예제를 대상으로 개발한 모형에 대한 실증 분석을 수행하고, 제 6장에서는 본 연구의 결론을 제시하도록 한다.

    2.구간 데이터를 가지는 DEA 모형

    본 장에서는 데이터의 불확실성이 구간의 형태로 주어 지는 경우 기존 IDEA 모형에 대해 설명한다. 원래 IDEA 모형에서는 구간 데이터와 함께 순위 데이터도 함께 고 려하고 있으나 본 연구에서는 구간 데이터에 한정하여 살펴보도록 한다.

    효율성 평가의 대상이 되는 n개의 DMU가 있고 각각 의 DMU는 m개의 투입요소와 s개의 산출요소를 가진다 고 하자. 그리고 DMU k(k = 1, 2, …, n)의 투입요소 벡터 를 x k = x 1 k , ..., x mk T R + m , 산출요소 벡터를 y k = y 1 k , ..., y sk T R + s 라고 하자. 고정규모수익성(constant returns to scale, CRS)을 가정할 때 DMU k의 투입지향 효율성은 다음을 풀어 측정한다.

    max r = 1 s u r y rk s . t .   r = 1 s u r y rj i = 1 m υ i x ij j , i = 1 m υ i x ik = 1 , u r 0 ,   υ i r , i x i . = x ij D i i , y r . = y rj D r +   r .
    (1)

    여기서 xijyrj의 값은 상하한을 가지는 구간에 속하는 것으로 가정하고, 해당 구간 데이터 값들의 집합을 각각 D i R n D r + R n R n라고 표시한다.

    투입요소 및 산출요소의 값이 정확하게 주어진다면, 상기 모형은 표준적인 투입지향 BCC 모형이 되고 선형 최적화 문제가 된다. 하지만 xijyrj의 값이 D i D r + 로 속하는 부정확한 값이라고 하고, 이를 Cooper et al.[6]와 같이 변수로 취급한다면 상기 모형은 비선형 최적화 문제 가 된다. Cooper et al.[6]은 척도변환 및 변수치환을 통해 이 비선형 최적화 문제를 다음과 같은 선형 최적화 문제 로 변환이 가능함을 보였다.

    max   r = 1 s Y rk s.t .   r = 1 s Y rj i = 1 m X ij j , i = 1 m X ik = 1 , Y rj 0 0 ,   X ij 0 r , i X i . = X ij B i −  i . Y r . = Y rj B r +   r .

    여기서 X ij = x ¯ ij υ ¯ i , Y rj = y ¯ rj u ¯ r , υ ¯ i = υ i ma x j x ij , u ¯ r = u r max j y rj , x ¯ ij = x ij / max j x rj , y ¯ rj = y rj / max j y rj , X ij 0 = x ¯ ij 0 υ ¯ i , Y rj 0 = y ¯ rj 0 u ¯ r , x ¯ ij 0 = max j x ¯ ij , y ¯ rj 0 = max j y ¯ rj 이고, B i B r + D i D r + 를 변환 한 것이다.

    Despotis and Smirlis[7]와 Zhu[19, 20]는 상기 IDEA 모 형에서 변수로 취급했던 부정확한 투입요소 및 산출요소 의 값을 특정 상수 값으로 고정한 후 표준적인 DEA 모 형을 풀면 IDEA 모형에서 도출되는 효율성 점수를 동일 하게 계산할 수 있음을 보였다. 구체적으로, 평가대상인 DMU k의 투입요소 및 산출요소의 값은 각각 하한 및 상한으로 고정하고, 다른 DMU들의 투입요소 및 산출요 소의 값은 각각 상한 및 하한으로 고정한 후 표준적인 DEA 모형을 풀면 IDEA 모형에 의한 DMU k의 효율성 점수를 얻을 수 있다. 즉, 다음의 선형최적화 문제를 풀 어 효율성 점수를 계산한다.

    max  r = 1 s u r y rk U s . t r = 1 s u r y rj L i = 1 m υ i x ij U 0  ∀ j k , r = 1 s u r y rk U i = 1 m υ i x ik L 0 , i = 1 m υ i x ik L = 1 , u r 0 , υ i 0   r , i
    (2)

    여기서 y rj L y rj U D i D r + 에 나타난 yrj의 하한과 상 한을 각각 나타내고, x ij L , x ij U xij의 하한과 상한을 각각 나타낸다.

    사실상 모형 (1) 또는 모형 (2)로 정형화되는 IDEA 모 형은 주어진 데이터 부정확성 하에서 평가대상 DMU가 가질 수 있는 최대의 효율성 점수를 계산한다. 즉, 평가 대상 DMU에게 가장 유리한 방식으로 데이터의 부정확 성이 발현되고 그와 동시에 가장 유리한 방식으로 가중 치를 선택할 수 있도록 하였을 때 얻을 수 있는 최선의 효율성 점수를 계산한다. 이러한 점에서 IDEA 모형은 데이터 부정확성을 지나치게 낙관적으로 반영하고 있다 고 볼 수 있다. 한편, Despotis and Smirlis[7]는 모형 (2) 와 더불어 데이터의 부정확성이 평가대상 DMU에게 가 장 불리한 방식으로 발현되는 경우에 대한 효율성 점수 를 계산하는 모형도 제시하였는데 다음과 같다.

    max   r = 1 s u r y rk L s.t. r = 1 s u r y rj U i = 1 m v i x ij L 0 j k , r = 1 s u r y rk U i = 1 m v i x ik L 0 , i = 1 m v i x ik U = 1 , u r 0 , v i 0 r , i
    (3)

    로버스트 최적화가 주어진 문제를 구성하는 데이터의 불확실성이 최악의 경우로 발현되는 경우에 대해 가장 최선의 해를 찾는 방법이라는 점에서, 상기 모형 (3)은 로버스트 최적화의 개념을 가장 기본적인 방식으로 구현 한 것이라고 볼 수 있다. 다만, 로버스트 최적화의 지나 친 보수성을 그대로 함께 가지게 된다는 점을 한계점으 로 볼 수 있다.

    3.로버스트 선형최적화

    본 장에서는 로버스트 선형최적화 방법에 대해 살펴 본다. 우선 다음의 일반적인 선형계획법 문제를 생각해 보자.

    max   j c j x j s . t j a ij x j b i  ∀ i , l j x j u j   j .
    (4)

    상기 모형에서 데이터의 불확실성은 제약식 행렬 A = (aij)에서만 발생한다고 가정한다. 행렬 A의 행 i에서 불 확실성을 가지는 계수의 열 지수 집합을 J i라고 할 때, 행 i에 속하는 계수 aij (jJ i)는 확률변수 ãij(jJ i) (jJ i)로 모형 화 된다. 여기서 확률변수 ãij의 정확한 확률분포는 알지 못하지만 명목 값(nominal value)인 aij을 평균으로 하는 대칭분포를 따르며 유한한 상한 및 하한을 가진다는 것, 즉 그 값의 범위가 [aij-âij, aij + âij]이라는 것만 알려져 있다고 가정한다. 새로운 확률변수 nij=(ãij-aij)/âij를 정의하면, nij는 [-1, 1]의 값을 취하는 대칭인 확률분포 를 따른다고 할 수 있다.

    로버스트 최적화의 기본 개념은 데이터 불확실성이 최 악의 상태로 발현될 때에도 모든 제약식을 만족시킬 수 있는 해들 중에서 목적함수를 가장 최대로 만드는 해를 찾는 것이다. 이러한 개념에 따라 Soyster[17]에 의해 제 시된 로버스트 선형최적화 모형은 다음과 같다.

    max  j c j x j s . t j a ij x j + j J i a ˆ ij y j b i  ∀ i , y j x j y j  ∀ j , l j x j u j  ∀ j , y j 0  ∀ j .

    이러한 Soyster[17]의 모형은 지나치게 보수적인 해가 도 출된다는 단점이 있다. 주어진 데이터 불확실성 하에서 어떠한 경우에도 모든 제약식을 만족하는 해가 도출되어 해의 강건성은 극대화되지만, 그에 반해 목적함수 값으 로 표현되는 해의 성능은 크게 저하되는 경향이 있다. 이 러한 단점은 특히 경영과학 분야에서의 로버스트 최적화 응용을 어렵게 만든다.

    Bertsimas and Sim[3]은 이러한 로버스트 최적화의 지 나친 보수성을 완화하기 하기 위해 각 행 내의 변동 가능 한 계수의 개수를 제한하는 방식을 제안하였다. 즉, Soyster [17]의 모형에서는 각 행 내 변동 가능한 계수는 모두 변 동할 수 있다고 가정하여 최악의 경우를 대비하는 방식인 반면, Bertsimas and Sim[3]은 변동 가능한 계수의 개수를 제한한 상황 하에서 최악의 경우를 대비하는 방식을 취한 다. 그 방식은 구체적으로 다음과 같다.

    i에 대해 폐구간 [0, |Ji| 내의 값을 취하는 매개변 수 Γi를 정의하여 J i 에 속하는 행 i의 계수들 중 최대 Γi 개의 값만 명목 값으로부터의 변화가 허용되도록 한다. 만일 Γi가 정수가 아니라면 최대 |Γi|개의 계수는 최대 폭만큼 변화가 허용되고 그 이외 하나의 계수 ait(tJ i)에 대해서는 (Γi-|Γi|)âit만큼의 변화가 허용된다. 이러한 Γi 의 역할은 로버스트 최적화가 가지는 보수성으로 인한 해 의 성능 저하와 해의 강건성 간의 상충관계를 조절하는 것이다. 즉, Γi를 |Ji|로 두면 전통적인 Soyster[17]의 로버 스트 최적화와 같이 최대의 보수성, 최대의 강건성을 가 지게 되는 반면 해의 성능은 가장 나빠지게 된다. 한편 Γi의 값을 줄일수록 보수성을 줄여 해의 강건성은 저하 되지만 해의 성능은 반대급부로 개선된다. 이러한 Γi의 도입은 행 i의 |Ji|개 계수 모두가 동시에 해의 성능에 나 쁜 방향으로 변화할 확률은 대단히 작고, 실제로는 단지 몇 개의 계수만이 그러한 방향으로 변화할 개연성이 크 다는 사실의 관찰에 기초한다. 즉, Γi의 값을 작게 설정 하더라도 해의 성능 개선폭에 비해 강건성의 저하는 상대 적으로 작은 특성을 가진다.

    각 행 i에 대해 Γi가 상기와 같이 정의될 때 모형 (4) 에 대한 로버스트 최적화 모형은 다음과 같다.

    JKISE-38-117_Eq5.gif
    (5)

    Bertsimas and Sim[3]은 상기 비선형 최적화 모형이 다 음과 같은 선형 최적화 모형으로 동치 변환될 수 있음을 보였다.

    max   j c j x j s.t. j a ij x j + z i Γ i + j J i p ij b i i , z i + p ij a ˆ ij y j ,   i ,   j J i , y j x j y j   j , l j x j u j   j , p ij 0   i ,   j J i , y j 0   j ,   z i 0   i .
    (6)

    상기 모형의 특성은 다음과 같다. 각 행 i에서 Γi개의 계수만이 변한다고 가정할 때 상기 모형으로부터 얻어지 는 해는 어떠한 상황에서도 가능해가 된다. 더불어 Γi개 보다 더 많은 계수가 변한다고 하더라도 그 해는 높은 확 률로 가능해가 된다는 바람직한 특성이 있다. Bertsimas and Sim[3]은 모형 (6)을 풀어 얻은 로버스트 최적해가 i 번째 제약식을 위반할 확률에 대한 몇 가지 상한을 제시 하고 있는데, 계산 용이성과 정확성을 고려할 때 가장 우 수한 상한으로 다음을 제안하고 있다.

    1 μ C n , ν + i = ν + 1 n C n , 1
    (7)

    여기서

    이고, n = | J i|, ν = (Γi + n)/2, μ = ν -|ν|이다. 여러 가 지 | J i| 값에 대해, 제약식 위반 확률이 1%, 5%, 10% 미 만이 되게 하는 Γi값은 각각 <Table 1>과 같다.

    예를 들어, |Ji| = 2,000인 경우, 즉 행 i에 불확실한 값 을 가지는 계수의 개수가 2,000개인 경우를 생각해 보자. 만일 Γi의 값을 2,000개로 설정한다면 모든 불확실한 계 수가 명목값으로부터 변화될 수 있도록 허용하는 것이 고, 그렇게 로버스트 최적화 모형을 구성하여 얻어진 해 는 어떠한 경우에도 해당 제약식을 실제 위반하는 일은 발생하지 않는다. 하지만, Γi의 값을 2,000보다 훨씬 작은 105.1로 설정하더라도, 즉 2,000개의 계수 중 105.1개만 이 명목 값으로부터의 변화가 허용되도록 제한하더라도 모형으로부터 얻어진 해가 해당 제약식을 실제 위반할 확률은 1% 미만이 된다. 만일 Γi를 74.6 또는 58.4로 두 더라도 제약식 위반 확률은 각각 5%, 10% 미만이 된다. 이러한 결과는 주어진 J i 에 비해 Γi를 크게 줄이더라도 제약식 위반 확률은 그다지 커지지 않음을 보여준다. 이 에 반해 Γi를 줄이면 그에 비례하여 도출되는 해의 성능 은 크게 향상된다. Γi의 값에 따른 로버스트 최적화 모형 의 강건성과 해의 성능 간의 상기와 같은 상쇄관계 특성 은 Bertsimas and Sim[3]의 로버스트 최적화 방법의 유효 성을 잘 보여준다.

    4.로버스트 DEA 모형

    이제 앞서 살펴본 로버스트 선형최적화 방법을 부정 확한 데이터를 가지는 DEA 모형에 적용한다. 본 장에서 는 투입지향 BCC 모형을 기준으로 두 가지 형태의 DEA 모형, 즉 승수모형과 포락모형에 대해 로버스트 선형최 적화 방법을 적용한 결과를 제시하고, IDEA 모형과의 관계 등 그 특성에 대해 논의하고자 한다.

    모형 전개 과정에서 사용할 기호는 제 2장에서 정의된 바를 따르되, 투입요소 및 산출요소의 값은 명목 값 xijyrj를 중심으로 편차가 ŷrj인 구간의 형태로 주 어진다고 가정한다. 즉, 투입요소 값의 구간은 x ij x ˆ ij , x ij + x ˆ ij 이고, 산출요소 값의 구간은 [yrj-ŷrj, yrj+ŷrj] 로 주어진다.

    4.1.승수모형에 대한 로버스트 최적화

    투입요소 및 산출요소의 값이 명목값 xijyrj인 경우에 대해, DMU k의 효율성 점수를 계산하는 투입지향 BCC 승수모형은 다음과 같다.

    max e k s.t . e k r = 1 s u r y rk + ξ r = 1 s u r y rj i = 1 m v i x ij + ξ 0 j , i = 1 m v i x ik 1 , u r 0 , v i 0 r , i .
    (8)

    상기 모형은 일반적인 투입지향 BCC 승수모형과 조 금 차이가 있지만 상호 동치임을 쉽게 알 수 있다. 즉 상 기 모형에서는 목적함수에 부정확한 계수가 포함되지 않 도록 하기 위해 변수 ek를 도입하여 목적함수를 제약식 으로 처리하였고, 최적해에서는 항상 마지막 제약식이 등 식으로 성립함을 이용하여 i = 1 m υ i x ik = 1 를 부등식으로 대체하였다.

    모형 (8)에 Bertsimas and Sim[3]의 로버스트 최적화 접 근법을 적용하기 위해, DMU j의 투입요소 및 산출요소 값들 중 부정확한 값들의 지수(index) 집합을 각각 J j-Jj+로 정의한다. 또한, J j 개의 투입요소 값들과 J j + 개 의 산출요소 값들 중 변동이 허용되는 값들의 개수를 각 각 Γ j Γ j + 라고 하자. 그러면 모형 (8)에 대한 로버스트 최적화 모형은 다음과 같다.

    JKISE-38-117_Eq9.tiff
    (9)

    Γ j Γ j + 를 어떻게 설정하는지에 따라 모형 (9)로부 터 얻어진 해의 모형 (8)에서의 성능과 강건성이 달라지 게 된다. 예를 들어 Γ j = J j , , Γ j + = J j + 로 하면 모형 (9)의 해는 항상 모형 (8)의 가능해가 되어 강건성은 최 대가 되는 반면, 그 성능(모든 데이터가 명목 값을 취할 때 모형 (8)의 목적함수 값)은 가장 나빠지게 된다. 반대 로 Γ j = 0 , Γ j + = 0 라고 하면 모형 (9)의 해는 모든 데이 터가 명목 값을 취할 때의 모형 (8)의 최적해와 같아지게 되어 성능은 최대가 되지만, 데이터 부정확성을 전혀 감 안하지 못하게 되어 강건성은 가장 나빠진다.

    이러한 관계를 모형 (9)를 통해 산출되는 효율성 점수 의 관점에서 설명하면 다음과 같다. Γ j Γ j + 의 값을 크게 할수록 모형 (9)로 계산되는 효율성 점수가 실제 효 율성 점수보다 크게 될 위험이 줄어들게 되는 반면, 좀 더 보수적인 효율성 점수 추정이 이루어지게 된다. 반대 로 Γ j Γ j + 의 값을 작게 할수록 좀 더 낙관적인 효율 성 점수 추정이 이루어지는 반면, 모형 (9)로 계산되는 효율성 점수가 실제 효율성 점수를 초과하게 될 위험이 커지게 된다. 극단적인 경우로 Γ j = J j , Γ j + = J j + 로 둔다면 모형 (9)는 Despotis and Smirlis[7]가 제시한 모형 (3)과 동일한 결과를 산출한다는 점은 쉽게 알 수 있다. 즉, 주어진 데이터 부정확성 하에서 DMU k가 가질 수 있는 최악의 효율성 점수가 산출된다. 하지만, 모든 변동 가능한 데이터(투입요소 및 산출요소의 값)가 DMUk 의 효율성 점수가 최악이 되는 방향으로 동시에 변동할 확 률은 대단히 희박하므로 모형 (3)으로부터 산출되는 효 율성 점수는 현실적이지 못하다. 모형 (9)는 Γ j Γ j + 의 값을 조정할 수 있게 허용함으로써 강건성은 적정 수준 으로 유지한 채 보다 개연성 높은 효율성 점수의 산출을 가능케 해준다.

    이제 모형 (9)가 선형최적화 문제로 변환될 수 있음을 보이고자 하는데, Bertsimas and Sim[3]이 제시한 절차를 따르도록 한다. 우선, 모형 (9)을 풀어 얻어진 최적해 p = p r , q = q i , u = u r , υ = υ i 에 대해 p r = u r , q i = υ i |가 성립함은 자명하다. 그리고,

    β j + u , Γ j + = max S j + t j + S j + J j + , S j + = Γ j + , t j + J j + / S j + r S j + u j y ˆ rj + Γ j + , Γ j + , u t j y ˆ t j + j

    은 다음의 선형최적화 문제의 최적값과 같다.

    β j + u , Γ j + = max  r J j + u r y ˆ rj h rj + s.t.  r J j + h rj + Γ j + , 0 h rj + 1  ∀ r J j +

    이 문제의 쌍대문제를 구하면 다음과 같다.

    min z j + Γ j + + r J j + w rj + s.t . z j + + w rj + u r y ˆ rj r J j + , w rj + 0  ∀ r J j + ,     z j + 0

    이와 유사하게

    β j υ , Γ j = max S j J j , S j = Γ j , t j J j / S j i S j υ i x ˆ ij + Γ j , Γ j , υ t j x ˆ t j + j

    의 쌍대문제를 구성할 수 있으며 이 두 가지 쌍대문제를 모형 (9)에 대입하면 다음과 같은 선형최적화 문제가 얻 어진다.

    JKISE-38-117_Eq10.tiff
    (10)

    모형 (10)의 목적함수 형태가 최대화이고 제약식의 부 등호 방향에 따라 두 가지 쌍대문제의 목적함수 최소화 가 암시적으로 이루어짐을 알 수 있다.

    4.2.포락모형에 대한 로버스트 최적화

    투입요소 및 산출요소의 값이 명목 값 xijyrj인 경 우에 대해, DMU k의 효율성 점수를 계산하는 투입지향 BCC 포락모형은 다음과 같다.

    min θ s.t. j = 1 n x ij λ j θ x ik i , j = 1 n y rj λ j y rk r , j = 1 n λ j = 1 ,   λ j 0 j .

    제약식 좌변과 우변에 동일하게 나타나는 데이터(xikyrk)를 이항시켜 하나의 변수에 대한 계수로 합치면 다음과 같다.

    max θ s.t . j = 1 , j k n x ij λ j + x ik λ k θ 0 i , j = 1 , j k n y rj λ j y rk λ k 1 0  ∀ r , j = 1 n λ j = 1 ,   λ j 0 i .

    새로운 변수 λ k = λ k θ λ k + = λ k 1 를 도입하고 이 변수 치환을 DMU 지수 집합 {1, 2, …, k, …, n}에 반영 하기 위해 지수 집합에서 k를 제거하고 새로운 두 지수 k-k+를 추가한다. 또한 x i k = x ik , x ˆ i k = x ˆ ik , y r k + = y rk , y ˆ r k + = y ˆ rk 로 정의한다. 이를 통해 위 문제를 다시 쓰면 다 음과 같다.

    JKISE-38-117_Eq11.tiff
    (11)

    모형 (11)에 Bertsimas and Sim[3]의 로버스트 최적화 접근법을 적용하기 위해, 투입요소 i의 값이 부정확한 DMU들의 지수 집합을 J i , 산출요소 r의 값이 부정확한 DMU들의 지수 집합을 J r + 라고 정의한다. 또한, | J i |개의 투입요소 값들 중 변동이 허용되는 값들의 개수를 Γ i , | J r + | 개의 산출요소 값들 중 변동이 허용되는 값들의 개수를 Γ r + 라고 하자. 그러면 모형 (11)에 대한 로버스트 최적화 모형은 다음과 같다.

    JKISE-38-117_Eq12
    (12)

    승수모형의 경우와 마찬가지로, Γ i Γ r + 를 어떻게 설정하는지에 따라 모형 (12)로부터 얻어진 해의 모형 (11)에서의 성능과 강건성이 달라진다. 즉, Γ i Γ r + 의 값을 크게 할수록 모형 (12)의 해가 모형 (11)의 제약식 을 위반할 위험은 낮아지지만, 그 성능(모든 데이터가 명 목 값을 취할 때 모형 (11)의 목적함수 값)은 나빠진다. 반대로 Γ i Γ r + 의 값을 작게 할수록 해의 성능은 좋아 지지만 모형 (11)의 제약식을 위반할 위험은 높아지게 된다.

    하지만 이러한 관계가 모형 (12)를 통해 산출되는 효 율성 점수의 관점에서는 승수모형의 경우와 정반대의 상 황으로 나타나는데, 이는 승수모형과 포락모형의 목적함 수 형태가 최대화와 최소화로 서로 다르기 때문이다. 승 수모형에서는 평가대상 DMU의 효율성 점수를 최대화하 는 모형이므로 이에 대한 로버스트 최적화 모형은 주어 진 데이터 부정확성 내에서 최악의 효율성 점수를 최대 화하는 문제로 나타나게 된다. 따라서 승수모형의 로버 스트 최적화 모형을 통해 산출되는 효율성 점수는 데이 터의 명목 값을 기준으로 산출된 효율성 점수보다 일반 적으로 낮아진다. 반면, 포락모형에서는 평가대상 DMU 의 효율성 점수를 최소화하는 모형이므로 이에 대한 로 버스트 최적화 모형은 주어진 데이터 부정확성 내에서 최선의 효율성 점수를 최소화하는 문제로 나타나게 된 다. 따라서 포락모형의 로버스트 최적화 모형을 통해 산 출되는 효율성 점수는 데이터의 명목 값을 기준으로 산 출된 효율성 점수보다 일반적으로 높아진다.

    포락모형인 모형 (12)를 통해 산출되는 효율성 점수와 Γ i Γ r + 간의 관계를 다시 정리하면 다음과 같다. Γ i Γ r + 의 값을 크게 할수록 모형 (12)로 계산되는 효율성 점수가 실제 효율성 점수보다 작게 될 위험이 줄어들게 되는 반면, 좀 더 낙관적인 효율성 점수 추정이 이루어지게 된다. 반대로 Γ i Γ r + 의 값을 작게 할수록 좀 더 비관적 인 효율성 점수 추정이 이루어지는 반면, 모형 (12)로 계 산되는 효율성 점수가 실제 효율성 점수보다 작게 될 위 험은 커지게 된다. 극단적인 경우로 Γ i = J i , Γ r + = J r + 로 둔다면 모형 (12)는 Despotis and Smirlis[7]가 제시한 모형 (2), Cooper et al.[6]의 IDEA 모형과 동일한 결과를 산출한다는 점은 쉽게 알 수 있다. 즉, 주어진 데이터 부 정확성 하에서 DMU k가 가질 수 있는 최선의 효율성 점 수가 산출된다. 하지만, 모든 변동 가능한 데이터(투입요 소 및 산출요소의 값)가 DMU k의 효율성 점수가 최선이 되는 방향으로 동시에 변동할 확률은 대단히 희박하므로 모형 (2)로부터 산출되는 효율성 점수는 현실적이지 못하 다. 모형 (12)는 Γ i Γ r + 의 값을 조정할 수 있게 허용함 으로써 강건성은 적정 수준으로 유지한 채 보다 개연성 높은 효율성 점수의 산출을 가능케 해준다.

    승수모형의 경우와 유사한 방법으로 모형 (12)가 선형 최적화 문제로 변환될 수 있음을 보일 수 있다. 그 과정 은 앞서 기술한 것과 크게 다르지 않으므로 여기서는 그 결과만을 아래의 모형 (13)과 같이 제시하도록 한다.

    JKISE-38-117_Eq13
    (13)

    4.3.DEA 모형에서 로버스트 최적화의 의미

    지금까지 투입지향 BCC 모형을 기준으로 투입요소 및 산출요소 값의 부정확성이 구간의 형태로 주어질 때 승 수모형 및 포락모형에 대해 Bertsimas and Sim[3]의 로버 스트 최적화 방법을 적용한 결과를 제시하였다. 여기서 는 두 가지 DEA 모형에서 로버스트 최적화가 가지는 의 미에 관한 논의하기로 한다.

    앞서 기술한 바 있듯이 로버스트 최적화는 제약식을 위 반할 위험을 완화하면서 최선의 해를 찾기 위한 방법이라 고 볼 수 있다. Soyster[17]은 제약식 위반 위험을 완전히 제거하는 가장 보수적인 방법이고, Ben-Tal and Nemirovski [2]는 타원체의 형태로 범위가 한정된 데이터 불확실성 하 에서 제약식 위반 위험을 제거하는 방법을 취함으로써 지 나친 보수성을 완화시킨 방법이다. Bertsimas and Sim[3] 의 접근법 또한 변동이 가능한 데이터의 개수가 한정된 상태에서 제약식 위반 위험을 제거함으로써 로버스트 최 적화가 가지는 지나친 보수성을 완화하는 방법이다. 그렇 다면 DEA 모형에서 로버스트 최적화가 가지는 의미를 생 각해 볼 필요가 있으며, 효율성 점수 측정의 관점에서 구 체적으로 어떤 위험을 완화하고자 하는 것인지 고려하여 야 한다.

    두 가지 형태의 DEA 모형, 즉 승수모형과 포락모형 중 어떤 모형을 선택하여 로버스트 최적화를 적용하는지에 따라 전혀 다른 위험을 고려하게 된다. 승수모형에 로버 스트 최적화를 적용하는 경우에는 해당 모형을 통해 산출 되는 효율성 점수가 실제 효율성 점수를 초과할 위험을 완화하고자 하는 것이고, 포락모형에 로버스트 최적화를 적용하는 경우에는 산출되는 효율성 점수가 실제 효율성 점수에 미달할 위험을 완화하고자 하는 것이다. 따라서, 승수모형에 Soyster[17]의 로버스트 최적화 방법을 적용 한다면 주어진 데이터 부정확성 내에서 평가대상 DMU 가 가질 수 있는 최악의 효율성 점수를 계산하게 되고, 이는 Despotis and Smirlis[7]가 제시한 모형 (3)과 동일한 결과를 도출한다는 것을 알 수 있다. 이와 반대로 포락모 형에 Soyster[17]의 로버스트 최적화 방법을 적용한다면 주어진 데이터 부정확성 내에서 평가대상 DMU가 가질 수 있는 가장 높은 효율성 점수를 계산하게 되고, 이는 Despotis and Smirlis[7]가 제시한 모형 (2) 또는 Cooper et al. [6]의 IDEA 모형과 동일한 결과를 도출하게 된다. 즉, 여 기서 IDEA 모형은 사실상 포락모형에 Soyster [17]의 로버 스트 최적화 방법이 적용된 것이라는 점을 알 수 있다.

    Soyster[17]의 로버스트 최적화 방법이 가지는 지나친 보수성은 DEA 모형에 적용할 때에도 동일하게 발생한 다. 즉, 승수모형에 Soyster[17]의 로버스트 최적화 방법 이 적용된 결과인 모형 (2)는 과도하게 낮은 효율성 점수 를 산출하게 되고, 포락모형에 Soyster[17]의 로버스트 최적화 방법이 적용된 결과로 볼 수 있는 모형 (3) 또는 IDEA 모형은 과도하게 높은 효율성 점수를 산출하게 된 다. 이러한 문제점을 해결하기 위한 하나의 방법으로 본 연구에서 제시한 대로 Bertsimas and Sim[3]의 로버스트 최적화 방법을 두 가지의 DEA 모형에 적용하여 보수성 을 조정하는 것이 유용한 현실적 대안이 될 수 있다.

    4.4.효율성 점수의 확률적 계층화

    본 연구에서 채택한 Bertsimas and Sim[3]의 로버스트 최적화 방법이 가지는 장점 중 하나는 변동 가능 계수의 개수를 제한하는 파라미터를 통해 해의 성능과 보수성 간의 균형을 조절할 수 있다는 것이다. 또한, 해당 파라 미터의 값에 따른 제약식 위반 확률의 상한을 계산할 수 도 있다.

    이 방법론을 DEA 모형에 적용하는 경우 효율성 점수 에 대한 확률적 계층화가 가능해 진다. 예를 들어, 승수 모형에 대한 로버스트 최적화 모형에서는 제약식 위반 확률을 0%, 5%, 10%, …, 50% 등으로 설정하고 이에 따 른 Γ j Γ j + 의 값을 각각 찾은 후 모형 (10)을 풀면 각 경우에 대한 효율성 점수가 점차 증가하는 형태로 도출 된다. 즉, 제약식 위반 확률을 0%로 설정하면 모형 (10) 에서 Γ j Γ j + 의 값은 각각 J j J j + 이 될 것이고, 도출되는 효율성 점수는 평가대상 DMU가 주어진 데이 터 부정확성 하에서 얻을 수 있는 가장 낮은 점수가 된 다. 이 경우 얻어진 효율성 점수가 실제 효율성 점수보다 더 높을 확률은 0%가 된다. 제약식 위반 확률을 점점 높 여갈수록 이러한 보수성은 완화되면서 도출되는 효율성 점수는 높아진다.

    포락모형에 대한 로버스트 최적화 모형에서도 마찬가 지로 제약식 위반 확률을 0%, 5%, 10%, …, 50% 등으로 설정하고 이에 따른 Γ i Γ r + 의 값을 각각 찾은 후 모 형 (13)을 풀면 각 경우에 대한 효율성 점수가 점차 감소 하는 형태로 도출된다. 즉, 제약식 위반 확률을 0%로 설 정하면 모형 (13)에서 Γ i Γ r + 의 값은 각각 | J i |와 | J r + | 이 될 것이고, 도출되는 효율성 점수는 평가대상 DMU 가 주어진 데이터 부정확성 하에서 얻을 수 있는 가장 높은 점수가 된다. 이 경우 얻어진 효율성 점수가 실제 효율성 점수보다 더 낮을 확률은 0%가 된다. 제약식 위 반 확률을 점점 높여갈수록 이러한 보수성은 완화되면서 도출되는 효율성 점수는 낮아진다.

    상기와 같은 방식으로 효율성 점수를 확률적으로 계층 화함으로써 부정확한 데이터를 가지는 DEA 모형에 대한 기존의 해법을 보다 현실적 유용성을 가지도록 개선할 수 있다. 기존의 IDEA 모형이나 Despotis and Smirlis[7]의 모형 (2)를 통해 도출되는 효율성 점수를 기반으로 DMU 의 효율성을 분석하는 것은 과도한 보수성과 희박한 시나 리오를 가정하는 것이므로, 본 연구에서 개발한 방법을 통해 보다 합리적인 보수성과 현실적인 시나리오 하에서 의 효율성 점수 분석을 수행하는 것이 더 바람직하다. 예 를 들어, 계산되는 효율성 점수가 실제 효율성 점수보다 높거나 낮을 확률을 현실적으로 허용 가능한 수치(예를 들어 20%)로 설정한 후, 모형 (10)이나 모형 (13)을 풀어 도출되는 효율성 점수를 기반으로 효율성 분석을 수행하 는 것이 가능하다.

    5.수치 예제

    본 장에서는 앞서 개발한 로버스트 최적화 DEA 모형 을 실제 수치 예제에 적용한 결과를 검토하고, 이를 통해 모형의 특성 및 시사점을 논의하도록 한다.

    실험에 사용할 데이터는 Oral et al.[11]에서 소개된 터 키 철강산업 분야의 37개 R&D 프로젝트 평가 데이터를 사용한다. 데이터에 포함된 터키 철강산업 분야 37개의 R&D 프로젝트는 한정된 예산을 두고 상호 경쟁하며, 각 각의 프로젝트는 <Table 2>와 같이 5개의 산출요소와 1 개의 투입요소로 특징지어진다. 산출요소로는 간접적 경제 기여도(indirect economic contribution), 직접적 경제 기여도 (direct economic contribution), 기술적 기여도(technological contribution), 사회적 기여도(social contribution), 과학적 기 여도(scientific contribution)가 포함되고, 투입요소로는 비 용, 즉 예산이 포함된다. 모든 요소의 값은 전문가 설문을 통해 얻은 0~100사이의 점수로 표현된다.

    원래 데이터에서는 투입요소 및 산출요소의 값이 정 확한 값으로 주어지는 경우를 가정하고 있는데, 본 연구 에서는 이를 수정하여 모든 데이터에 10%의 부정확성이 있는 것으로 가정한다. 예를 들어, 1번 프로젝트의 경우 간접적 경제 기여도와 예산이 각각 67.53과 84.20으로 주 어져 있는데, 본 연구에서는 해당 값들이 10%의 편차를 가진 구간 값, 즉 각각 [60.78, 74.28]과 [75.78, 92.62]로 주어진다고 가정한다.

    상기 데이터를 바탕으로 모형 (10)과 모형 (13)을 각각 의 DMU를 평가대상으로 하여 푼 결과는 <Table 3> 및 <Table 4>와 같다. 두 가지 표에서 Nominal 열에 있는 값 들은 투입요소 및 산출요소가 명목 값을 가질 때 계산되는 효율성 점수로서 승수모형과 포락모형에서 동일한 값이 도출된다. 두 모형에 대한 로버스트 최적화 모형의 계산 결 과는 7가지의 제약식 위반확률에 대해 각각 산출하였다.

    승수모형에서 제약식 위반 확률 0%에 해당하는 효율성 점수(<Table 3>)는 Despotis and Smirlis[7]의 모형 (3)의 결 과와 동일하며, 주어진 데이터 불확실성 하에서 각각의 DMU가 가질 수 있는 최악의 효율성 점수에 해당한다. 해 당 효율성 점수가 실제 효율성 점수보다 높을 위험은 완전 히 제거되지만 지나치게 비관적인 결과가 초래된다. 제약 식 위반 확률을 높여갈수록 도출되는 효율성 점수는 비교 적 민감하게 변동하며 점차 증가함을 알 수 있는데, 위험 은 어느 정도 수용하면서 보다 현실성 있는 효율성 점수가 도출되는 것으로 볼 수 있다.

    포락모형에서 제약식 위반 확률 0%에 해당하는 효율 성 점수(<Table 4>)는 Despotis and Smirlis[7]의 모형 (2) 또는 Cooper et al.[6]의 IDEA 모형의 결과와 동일하며, 주어진 데이터 불확실성 하에서 각각의 DMU가 가질 수 있는 최선의 효율성 점수에 해당한다. 해당 효율성 점수 가 실제 효율성 점수보다 낮을 위험은 완전히 제거되지 만 지나치게 낙관적인 결과가 나타난다. 제약식 위반 확 률을 높여갈수록 도출되는 효율성 점수는 점차 감소함을 알 수 있는데, 위험은 일정 부분 수용하면서 보다 현실성 있는 효율성 점수를 얻는 것으로 볼 수 있다. 하나의 예 를 통한 결과로 일반화하기는 어렵지만, 포락모형의 경 우 제약식 위반 확률의 변화에 따른 효율성 점수의 변화 정도가 승수모형에 비해 상대적으로 크게 둔감한 특징이 나타난다. 따라서 효율성 점수의 확률적 계층화 측면에 서는 승수모형에 로버스트 최적화 방법을 적용하는 것이 더욱 유용한 정보를 제공하는 것으로 판단된다.

    한편, <Table 5>에는 앞서 도출된 효율성 점수들을 기 준으로 R&D Project의 순위를 매긴 결과가 나타나 있다. 명목 데이터에 기초하여 산출된 효율성 점수를 기준으로 한 순위와 모형 (10) 또는 모형 (13)을 통해 산출되는 효 율성 점수를 기준으로 한 순위에 유의미한 차이가 발생함 을 알 수 있다. 특히 승수모형에 로버스트 최적화를 적용 한 모형 (10)의 경우 더 뚜렷한 차이를 보이고 있다. 어느 정도의 제약식 위반 위험을 수용할지를 의사결정자가 판 단한 후 그에 따라 산출되는 효율성 점수를 기준으로 R&D 프로젝트를 평가한다면 지나친 보수성을 완화하여 보다 현실성 있는 결과를 얻을 수 있을 것으로 판단된다.

    6.결 론

    본 연구에서는 부정확한 데이터를 가지는 DEA 모형에 대해 로버스트 최적화 방법을 적용한 결과와 그 특성에 대해 논의하였다. 두 가지 DEA 모형인 승수모형과 포락모 형에 대해 로버스트 최적화 방법을 적용하였으며, 각각 경 우가 서로 다른 위험을 고려하고 있음을 밝혔다. 또한, 부정 확한 데이터를 가지는 DEA 모형의 해법에 대한 IDEA 모형 등 기존의 연구들은 승수모형 또는 포락모형에 대해 전통적 인 로버스트 최적화 방법을 적용한 결과임을 보였고, 이는 과도하게 보수적인 결과를 초래함을 논의하였다. 전통적인 로버스트 최적화 방법을 DEA 모형에 적용했을 때 초래되는 과도한 보수성을 극복하기 위해 변동 가능한 데이터의 개수 를 제한하는 방식의 로버스트 최적화 방법을 채택하여 승수 모형 및 포락모형에 적용하였다. 그 적용 결과를 통해 효율 성 점수를 확률적으로 계층화할 수 있음도 보였다. 수치 예제를 통해 실제 계산 결과를 살펴본 바, 본 연구 모형을 통해 도출되는 효율성 점수가 기존 모형의 결과와 차별적이 면서 보다 유용한 결과를 도출할 수 있음을 보였다.

    Figure

    Table

    Choice of Γi as a function of Ji

    Data of 37 R&D Project Proposals(Oral et al.[10])

    Efficiency Scores from Robust Optimization Applied to the Multiplier Model(10)

    Efficiency Scores from Robust Optimization Applied to the Envelopment Model(13)

    Ranks of Efficiency Scores from Different Models

    Reference

    1. Banker RD , Charnes A , Cooper WW (1984) Some models for estimating technical and scale inefficiencies in data envelopment analysis , Management Science, Vol.30 (9) ; pp.1078-1092
    2. Ben-Tal A , Nemirovski A (1999) Robust solutions of uncertain linear programs , Operations Research Letters, Vol.25 (1) ; pp.1-13
    3. Bertsimas D , Sim M (2004) The price of robustness , Operations Research, Vol.52 (1) ; pp.35-53
    4. Charnes A , Cooper WW , Rhodes E (1978) Measuring the efficiency of decision making units , European Journal of Operational Research, Vol.2 (6) ; pp.429-444
    5. Cook WD , Seiford LM (2009) Data envelopment analysis( DEA)-Thirty years on , European Journal of Operational Research, Vol.192 (1) ; pp.1-17
    6. Cooper WW , Park KS , Yu G (1999) IDEA and AR-IDEA : Models for dealing with imprecise data in DEA , Management Science, Vol.45 (4) ; pp.597-607
    7. Despotis DK , Smirlis YG (2002) Data envelopment analysis with imprecise data , European Journal of Operational Research, Vol.140 (1) ; pp.24-36
    8. Lim S (2015) A non-oriented DEA game cross efficiency model for supplier selection , Journal of Society of Korea Industrial and Systems Engineering, Vol.38 (2) ; pp.108-119
    9. Liu JS , Lu LY , Lu WM , Lin BJ (2013) Data envelopment analysis 1978~2010 : A citation-based literature survey , Omega, Vol.41 (1) ; pp.3-15
    10. Neralic L (2004) Preservation of efficiency and inefficiency classification in data envelopment analysis , Mathematical Communications, Vol.9 (1) ; pp.51-62
    11. Oral M , Kettani O , Lang P (1991) “A methodology for collective evaluation and selection of industrial R&D projects , Management Science, Vol.37 (7) ; pp.871-885
    12. Sadjadi SJ , Omrani H (2010) A bootstrapped robust data envelopment analysis model for efficiency estimating of telecommunication companies in Iran , Telecommunications Policy, Vol.34 (4) ; pp.221-232
    13. Sadjadi SJ , Omrani H (2008) Data envelopment analysis with uncertain data : An application for Iranian electricity distribution companies , Energy Policy, Vol.36 (11) ; pp.4247-4254
    14. Sadjadi SJ , Omrani H , Abdollahzadeh S , Alinaghian M , Mohammadi H (2011) A robust super-efficiency data envelopment analysis model for ranking of provincial gas companies in Iran , Expert Systems with Applications, Vol.38 (9) ; pp.10875-10881
    15. Seiford LM , Zhu J (1998) Sensitivity analysis of DEA models for simultaneous changes in all the data , Journal of the Operational Research Society, Vol.49 (10) ; pp.1060-1071
    16. Shokouhi AH , Hatami-Marbini A , Tavana M , Saati S (2010) A robust optimization approach for imprecise data envelopment analysis , Computers and Industrial Engineering, Vol.59 (3) ; pp.387-397
    17. Soyster AL (1973) Technical note-convex programming with set-inclusive constraints and applications to inexact linear programming , Operations Research, Vol.21 (5) ; pp.1154-1157
    18. Yoo S , Kim Y , Kim J , Choi J (2014) The evaluation of administrative efficiency of the Korean university using DEA model , Journal of the Korean Society for Quality Management, Vol.42 (4) ; pp.647-664
    19. Zhu J (2003) Imprecise data envelopment analysis (IDEA) : A review and improvement with an application , European Journal of Operational Research, Vol.144 (3) ; pp.513-529
    20. Zhu J (2004) Imprecise DEA via standard linear DEA models with a revisit to a Korean mobile telecommunication company , Operations Research, Vol.52 (2) ; pp.323-329