Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2005-0461(Print)
ISSN : 2287-7975(Online)
Journal of Society of Korea Industrial and Systems Engineering Vol.42 No.4 pp.39-48
DOI : https://doi.org/10.11627/jkise.2019.42.4.039

A Study on Resolving Prisoner’s Dilemma Using Incentives and Penalties

Jinho Lee†
Department of National Defense Management, Korea Naval Academy
Corresponding Author : jinho7956@gmail.com
08/08/2019 19/10/2019 23/10/2019

Abstract


This paper considers the Prisoner’s Dilemma Game in which there exists a dilemma that the best response is that both players are to confess, but doing not confess can give a higher gain to the both players in a social perspective. To resolve such a dilemma in the game, an incentive model to encourage to confess and a penalty model for being imposed when not confessing are introduced, respectively. Then, the conditions are characterized under which incentive or penalty involved in the game’s payoffs can make the game rational without a dilemma on both the personal and social perspectives, by taking the payoff values as variables with the incentive and penalty factors. Furthermore, it turns out that the resulting values of incentive and penalty are inversely proportional to each other, and thus, obtaining one of these amounts can provide the other. Simple examples are shown to interpret the theoretical verifications of our models, and randomly generated data based simulation results investigate the tendency of incentive and penalty and the resulting game values for a variety of instances. These results can provide a framework on resolving the dilemma by artificially putting incentive or penalty, although it is careful to apply more generalized real world games.



인센티브 및 패널티를 적용한 죄수의 딜레마 해소 방안에 관한 연구

이 진 호†
해군사관학교 국방경영학과

초록


    1. 서 론

    게임이론은 게임적 상황에서 경제주체가 어떻게 행동 하는가를 설명하는 이론이라고 할 수 있으며, 게임적 상 황은 두 사람 혹은 집단 이상이 동일한 대상이나 목적에 대해 서로 다른 의사결정을 함으로써 자신의 성과를 추 구하는 상황을 의미한다[5]. McCain[8]은 게임이론을 “상 호의존성을 내포한 상황에서 인간의 합리적 행동을 연구 하는 학문”으로 정의하며, 상호의존성은 상대방의 의사 결정을 고려한 상황에서 자신은 어떤 의사결정을 할 것 인가를 나타내며, 합리적 행동은 도덕적 합리성과 동기 등은 배제하고 양적으로 계량화된 척도에 의해 가장 이 익이 되는 대안을 선택하는 것이라 할 수 있다.

    ‘죄수의 딜레마 게임’은 두 용의자가 개인적 합리성을 고려하였을 때는 모두 자백하는 것이 각자에게 최선의 선 택이지만, 두 사람이 속한 사회적 합리성을 고려한다면 모두 부인을 하는 것이 사회 전체에 합리적인 선택이라는 결론을 제시한다. 즉, 개인적 합리성과 사회적 합리성이 충돌하기 때문에 ‘딜레마’ 라는 표현이 사용된다. 여기서 개인적 합리성은 상호의존성에 따라 상대방이 어떤 선택 을 할 것인가를 판단하여 자신의 형량이 최소화되는 선택을 하는 것을 의미하며, 사회적 합리성은 두 사람의 형량의 합이 최소화되는 선택을 의미한다. 이는 앞서 언급되었듯 이 합리적 행동이 양적으로 계량화된 척도인 형량의 크기 에 따른다는 것을 알 수 있다.

    죄수의 딜레마 게임은 폭넓은 분야에서 다양한 형태 로 연구되어 왔다. 사회과학 분야에서는 정치학 또는 국 제관계에서 국가 간이나 특정 집단 간의 관계를 해석하 기 위한 모델로 적용되어 왔으며, 공학 분야에서는 시스 템의 효율성 또는 개인과 집단의 이익이 충돌하는 과정 에서의 이익 최대화를 위한 모델로 이용되어 왔다. 대표 적으로 Kim et al.[4]는 무선 네트워크에서 원활한 통신 서비스의 제공을 위하여 전력을 제어하는 문제를 죄수의 딜레마 게임으로 해결하고자 하였다. 전력을 제어하기 위한 방법으로서 전력을 올리는 경우 패널티를 부과함으 로써 전력을 낮추는 것이 개인의 이익에 더욱 부합되는 모델을 제시하였다. Lee[6]는 각 개인 에이전트들이 상호 협동 또는 배반의 행동을 반복적으로 하는 게임에서 개 인의 이익이 아닌 집단의 이익을 최대화하기 위한 게임 을 설계하는 조건을 제시하였으며, Park and Kim[9]은 죄수의 딜레마 게임 매커니즘 내에서 상대방의 선택을 예측하는 알고리즘을 제시하였다. 이 외에도 반복적 죄 수의 딜레마 게임에서 협동을 통해 진화하는 의사결정 방법에 대한 연구[11], 죄수의 딜레마 게임에서 이익을 나타내는 함수의 변화가 게임에 미치는 영향[10], 유통업 체간 채널 갈등을 해결하기 위해 죄수의 딜레마 게임을 적용한 연구[2], 무선네트워크의 전력제어문제에 대한 죄 수의 딜레마 모형을 통한 분석[3], 두 제조업체간 경쟁정 도에 따른 선호하는 판매방식 선택[7] 등이 있었다. 이러 한 선행연구들을 참고하여 본 연구에서는 죄수의 딜레마 게임에서 단순히 형량의 크고 작음만을 따지는 개인적 합리성에 추가하여, 도덕적인 선택을 하는 죄수에게 합 리적인 형량을 제시하여 용의자들이 선택한 합리적 행 동이 도덕적으로도 부합하고 사회적 합리성도 동시에 추구할 수 있는 게임을 설계하기 위한 조건을 제시해 보 고자 한다. 또한 추가적으로 도덕적 합리성을 추구하도 록 자백에는 인센티브(incentive)를 부여하고 부인에는 패 널티(penalty)를 부과함으로써 개인적 합리성이 사회적 합리성으로 이어지도록 하는 인센티브와 패널티의 구조 를 분석해 본다. 이는 게임이론이 인간행위에 대한 기술 적 이론으로는 부족하다는 기존의 비판[1]을 완화하고 나아가 죄수의 딜레마 게임이 적용 가능한 여러 분야에 서 딜레마가 발생하지 않고 합리적 행동을 취할 수 있는 게임을 설계할 수 있음을 보여줌으로써 죄수의 딜레마 게임의 효용성을 제시하는데 그 목적이 있다.

    본 논문의 구성은 다음과 같다. 먼저 제 2장에서는 죄 수의 딜레마 게임의 개요와 딜레마를 해결하기 위한 이 득 행렬(payoff matrix)의 조건을 구해본다. 제 3장에서는 인센티브 및 패널티 모델을 소개하고 이를 통해 개인적 합리성과 사회적 합리성을 동시에 만족하는 딜레마 해소 방안을 제시하며, 제 4장에서는 수치 예제 및 시뮬레이 션을 통한 계산 실험 결과를 보여줌으로써 3장에서 제시 한 딜레마 해소 방안의 유용성을 검증한다. 마지막으로 제 5장에서 본 연구의 결론을 제시한다.

    2. 죄수의 딜레마 게임

    2.1 죄수의 딜레마 게임 개요

    A와 B라는 두 사람이 같은 혐의로 경찰에 체포되었 다. 경찰은 이 두 사람의 범행사실에 대하여 심증은 있지 만 이를 뒷받침할 만한 물증을 가지고 있지 않다. 그래서 그 혐의를 입증하기 위하여 자백이라는 방법을 사용하기 로 하고, 한 사람씩 다음과 같은 조건을 알려주고 심문을 한다. 이 때 각각의 이득은 Kim[3]의 예제를 참고하였다.

    두 사람은 체포된 이후 서로 다른 취조실에서 취조를 받고 있기 때문에 서로의 행동을 알 수 없고, 다만 자백 과 부인을 선택함에 따라 각자의 형량이 얼마나 주어지 는 것은 알고 있다고 가정한다. 이를 게임이론의 구도에 맞추어 정리해보면 다음과 같다.

    • 게임에 임하는 사람(players) : A, B

    • 선택할 수 있는 행동(actions) : 자백, 부인

    • 자백 혹은 부인에 따른 형량(payoffs)

      • 1) A, B가 자백하면 둘 다 9년형을 산다.

      • 2) A, B가 부인하면 둘 다 2년형을 산다.

      • 3) A, B 두 사람 중 한 사람이 자백하면 풀어주고 부 인한 사람은 17년형을 산다.

    • A, B는 이러한 게임의 구도는 알고 있지만, 상대방이 어떤 선택을 할지는 모른다.

    이러한 게임의 구도는 <Table 1>과 같이 나타낼 수 있 다. 각 항의 앞에 있는 숫자는 A의 형량, 뒤에 있는 숫자 는 B의 형량을 의미한다. 예를 들면, A가 부인을 하고 B 가 자백을 하는 경우에 A는 17년형을 받게 되고, B는 무 혐의로 석방되는 것이다.

    게임이론의 상호의존성과 합리적 행동이라는 두 요소 에 따라 내쉬 균형(Nash Equilibrium)을 다음과 같이 구할 수 있다. 먼저, B의 선택을 고려한 A의 선택을 고려해 보 자. B가 부인한다고 가정할 때, A는 자백하면 무혐의로 즉시 석방되게 되고, 반대로 A가 부인하게 되면 둘 다 부 인하게 되는 것이므로 둘 다 2년의 형을 받게 된다. 따라 서 A는 자백하는 것이 합리적 행동이 된다. 다음으로 B 가 자백한다고 가정하면, A는 자백하는 것이 더욱 작은 형량(9년)을 받게 되어 자백하는 것이 합리적 선택이다. 따라서 B의 선택에 무관하게 A는 자백하는 것이 최선의 선택이다. B의 입장에서 볼 때 동일한 상황이 전개되며 B 역시 A의 선택과 무관하게 자백하는 것이 최선의 선택 이 된다. 따라서 A, B 모두 자백하는 것이 내쉬 균형이 되어 두 사람 모두 9년이라는 형량을 받게 된다.

    본 예제에서 알 수 있듯이 개인적 합리성 측면에서 볼 때, 두 사람은 모두 상호의존성을 고려하여 각자에게 최 선의 선택을 하게 된다. 반면 사회적 합리성 측면에서 볼 경우 게임 참여자들이 속한 사회의 입장에서는 모두 부 인함으로써 각각 2년 씩, 총 4년의 형이 사회 전체에 부 여되는 것이 더욱 합리적인 선택이다. 즉, 개인적인 합리 성을 따지면 혐의를 자백하는 것이 합리적이지만, 사회 적인 합리성을 따져보면 혐의를 부인하는 것이 합리적이 기 때문에, 죄수의 딜레마 게임에서는 개인적 합리성과 사회적 합리성이 서로 충돌하는 상황이 발생하는 것이다.

    사회적인 통념상 범행을 저질렀을 경우 자백을 하는 것이 도덕적으로 옳은 행위이고, 부인하는 것은 옳지 않 은 행위이다. 그러나 죄수의 딜레마 게임의 경우 두 명 모 두 범행을 부인하는 옳지 않은 행위를 선택해야만 A와 B 가 각각 2년형만 살게 되어 사회적 만족도가 최대화된다. 반면 두 명 모두 자백을 할 경우, 자백이라는 도덕적으로 옳은 행위를 선택했음에도 불구하고 이 경우 범행을 부인 했을 때보다 더 긴 시간인 9년형을 살게 된다. 이는 현실 의 사회적 관점에서 볼 때 자백이라는 도덕적으로 옳은 선택을 하는 것이 지나치게 가혹한 형량에 도달하게 되고 부인이라는 옳지 못한 선택에 대해 상대적으로 관대한 형 량이 부과되게 된다. 따라서 본 연구에서는 죄수의 딜레 마 게임에서 발생하는 개인적 합리성과 사회적 합리성의 충돌을 막고 개인적 합리성이 사회적 합리성을 동시에 추 구할 수 있는 게임 설계와 조건을 제시한다.

    2.2 딜레마 해결을 위한 조건

    A와 죄수의 딜레마 해결을 위해 먼저 이득행렬에서 나타나는 형량을 변수로 설정하였고 <Table 2>에 나타나 는 바와 같다. <Table 2>는 <Table 1>과 동일한 상황 하 에서 각자의 선택에 따른 형량만을 변수로 설정한 결과 이다. 따라서 두 사람 모두 부인을 했을 경우 각각 x의 형량이 부과되며, 둘 중 한 명이 자백할 경우 자백한 사 람은 z , 부인한 사람은 υ라는 형량이 부과되고 두 사람 모두 부인할 경우 각각 y라는 형량이 부과되게 된다. 여 기서 모든 변수는 형량을 나타내므로 이득의 측면에서는 음수이다.

    이렇게 설정된 게임의 변수들을 바탕으로 죄수의 딜 레마 게임에서 도덕적으로 옳은 선택이 개인적 합리성을 추구하는 선택이 됨과 동시에 사회적 합리성을 만족하는 결과가 되기 위한 변수들의 조건을 구해본다. 먼저 기존 의 죄수의 딜레마 게임에서와 마찬가지로 상대방의 선택 에 무관하게 자백하는 것이 부인하는 것보다 이득이 되 도록 하기 위해서는 조건 (1)~(2)가 요구된다.

    y > υ
    (1)

    z < x
    (2)

    다음으로 현실 사회에서처럼 ‘도덕적인 행위를 했을 때에 보다 합당한 결과가 있어야 한다’는 사회적 합리성 을 추가로 고려하여 다음과 같은 조건들이 추가된다.

    z > υ
    (3)

    2 y > 2 x
    (4)

    2 y > υ + z
    (5)

    υ + z > 2 x
    (6)

    조건 (3)에서 z는 자백할 경우의 형량이며 υ는 부인할 때의 형량이므로 자백한 경우가 부인한 경우보다 형량이 작아야 함을 의미한다. 조건 (4)는 A, B가 모두 자백할 경 우가 모두 부인할 경우보다 사회적 합리성 측면에서 최선 의 선택이 되도록 하기 위한 조건이다. 따라서 조건 (1), (2)를 만족하는 상황에서 조건 (4)를 통해 개인적 합리성 과 사회적 합리성이 충돌되는 것을 방지한다. 조건 (5)는 A, B 모두 자백을 했을 때의 형량의 합이 둘 중의 한 명 만 자백한 경우의 형량의 합보다 더 작게 함으로써 둘 다 자백한 경우가 어느 한 사람만 자백한 경우보다 사회적 만족도가 더욱 높게 나타나도록 제약한다. <Table 1>의 게임을 고려할 경우 두 사람 모두 자백을 했을 경우 형량 의 합이 -18이며 둘 중 한 명만 자백할 때 형량의 합이 -17이 되어 조건 (5)를 만족하지 못하는 상황이 되는데, 이는 사회적으로 두 사람 모두 자백한 경우보다 어느 한 사람만 자백한 경우가 형량의 합이 낮게 나타나므로 본 연구에서 추구하고자 하는 사회적 만족도를 저하시키게 된다. 따라서 이를 방지하고자 조건 (5)를 고려하게 되었다. 마찬가지로 조건 (6)은 두 사람 모두 부인하는 것이 어느 한 사람이 자백한 경우보다 형량의 합이 커지게 함으로써 둘 다 부인하는 것보다는 한 사람이 자백하는 쪽에 사회 적 합리성을 더욱 부여하도록 제한한다. 조건 (5)-(6)을 조 합하면 조건 (7)과 같이 정리된다.

    2 y > υ + z > 2 x
    (7)

    따라서 조건 (7)은 두 사람 모두 자백한 것이 어느 한 사람이 자백한 경우보다는 사회적 합리성이 높아지도록 하며, 어느 한 사람이 자백한 경우가 두 사람 모두 부인 했을 경우보다는 사회적 합리성이 높아지도록 제약하는 것을 의미한다.

    이제 조건 (1)~(4)와 함께 고려하면 yz는 각각 υx보다 크다는 것을 알 수 있다. 그러나 yz의 관계 및 υx의 관계는 정의되지 않는다. 따라서 이를 조합하여 정리하면 조건 (8)~(12)와 같은 4가지 경우의 수가 발생 한다.

    y > z > υ > x
    (8)

    z > y > υ > x
    (9)

    z > y > x > υ
    (10)

    y > z > x > υ
    (11)

    이 4가지 경우의 수가 조건 (7)을 만족시키도록 하기 위 해서는 추가적인 고려가 필요하다. 먼저 조건 (8)의 상황 에서는, y > z , y > υ이므로 2y > υ + z를 만족하며, z > x, υ > x로부터 υ + z > 2x이기 때문에 조건 (7)이 항상 만족 된다. 그러나 조건 (9), (10), (11)의 상황 하에서 (7)이 만족 됨을 보장하지 못하게 되며, 조건 (7)을 만족시키지 못한 다는 것은 앞서 언급된 바와 같이 딜레마가 여전히 발생할 수 있음을 의미한다.

    3. 인센티브 및 패널티 모델

    3.1 인센티브 모델

    본 절에서는 죄수의 딜레마 게임에서 자백을 할 경우 형량이 감소되는 인센티브를 부여함으로써 조건 (7)이 만족되도록 하는 인센티브의 양을 결정하는 모델을 제시해 보고자 한다. 각자는 자백을 할 경우에는 인센티브 α를 부여하도록 하며 이때 α는 0 < α < 1의 값을 취할 수 있 게 함으로써 원래 형량에 α를 곱하여 형량이 줄어들게 한다. 따라서 α가 0에 가까울수록 인센티브가 높게 부여 되는 결과를 가져오며 1에 가까울수록 낮게 부여되는 결 과가 나타나게 된다. 이를 이득행렬로 나타내면 <Table 3>과 같다.

    <Table 3>과 같이 이득행렬이 주어진 상황에서 제 2.2 절에서 제시한 딜레마 해결 조건을 적용하면 다음과 같다.

    α y > υ
    (12)

    α z > x
    (13)

    α z > υ
    (14)

    2 α y > 2 x
    (15)

    2 α y > υ + α z
    (16)

    υ + α z > 2 x
    (17)

    또한 조건 (16)-(17)을 조합하면 (18)을 도출할 수 있다.

    2 α y > υ + α z > 2 x
    (18)

    이렇게 제약함으로써 게임 참가자들은 개인적 합리성 에 따라 자백을 선택하더라도 사회적 합리성을 동시에 추구함으로써 딜레마를 해결하고, 나아가 자백을 도덕적 인 행위로 인식하고 이를 통해 형량의 감소를 얻을 수 있음을 깨닫게 됨으로써 사회적 만족도가 높아지는 결과 를 가져온다.

    인센티브 모델에 의해 기존의 조건 (9)~(11)은 다음과 같이 변형된다.

    α z > α y > υ > x
    (19)

    α z > α y > x > υ
    (20)

    α y > α z > x > υ
    (21)

    조건 (19)~(21)은 기존의 조건 (9)~(11)이 주어지는 한 항상 만족된다. 그 이유는 υ , x, y, z가 모두 음수이며 α 의 범위가 0 < α < 1이기 때문이다. 따라서 기존의 조건 (9)~(11) 하에서 인센티브를 부여할 경우 제약조건 (12)~(15)는 자동적으로 만족되므로 조건 (18)을 만족하 는 α의 범위를 구할 수 있으며 Proposition 1과 같다.

    Proposition 1.υ , x, y, z가 모두 음수일 때, 죄수의 딜레 마 게임에서 개인적 합리성과 함께 사회적 합리성을 동 시에 추구할 수 있는 인센티브 α(0 α < 1)의 조건은 다음과 같다.

    • (a) 조건 (9)인 경우, α < α * = υ 2 y z

    • (b) 조건 (10)인 경우,

      1. 2x - υ < 0이면,

        α < α * = min { υ 2 y z , 2 x υ z }

      2. 2x - υ ≥ 0이면, 유의한 α는 존재하지 않는다.

    • (c) 조건 (11)인 경우,

      1. 2x - υ < 0이면, α < α * = 2 x υ z

      2. 2x - υ ≥ 0이면, 유의한 α는 존재하지 않는다.

    (Proof)

    • (a) 조건 (9) (z > y > υ > x) 하에서, 사회적 합리성을 만족 하지 못하는 1) 2yυ + z 또는 2) υ + z ≤ 2x의 경우에 대하여, 인센티브 α를 부여하여 2αy > υ + αz > 2x이 만 족되도록 하는 α의 조건을 구하여야 한다:

      • 1) 2yυ + z인 경우, 2αy > υ + αz를 만족하는 α의 조 건은 (2y - z )α > υ이다. 또한 조건 (9)의 z > y로부 터 z + y > 2y가 성립하므로, y > 2y - z이며 y가 음 수이므로 2y - z 또한 음수이다. 따라서 α < υ 2 y z 이다. 또한 주어진 2yυ + z를 이용하여 2 y z υ ( 1 2 y z ) ( 2 y z ) υ ( 1 2 y z ) υ 2 y z 1 이므로 α < υ 2 y z 는 유의한 조건이다.

      • 2) 조건 (9)로부터 υ > x, z > x가 성립한다. 따라서 υ + z > 2x이므로 υ + z ≤ 2x는 발생할 수 없다.

    • (b) 조건 (10) (z > y > x > υ ) 하에서, 1) 2yυ + z 또는 2) υ + z ≤ 2x의 경우에 대하여, 2αy > υ + αz > 2x가 되도록 하는 인센티브 α를 구하면,

      • 1) 2yυ + z인 경우, 2αy > υ + αz를 만족하는 α의 조 건은 α < υ 2 y z 이다(Note : 2y - z < 0, υ 2 y z 1 ).

      • 2) υ + z ≤ 2x인 경우, υ + αz > 2x를 만족하는 α의 조건 은 α < 2 x υ z 이다. 이때 2x - υ ≥ 0이면 α < 2 x υ z < 0이므로 유의하지 않으며, 2x - υ < 0이면 α < 2 x υ z 로써 유의한 조건을 도출한다(Note : υ + z ≤ 2x이므로 2 x υ z 1 ).

    • (c) 조건 (11) (y > z > x > υ) 하에서, 1) 2yυ + z 또는 2) υ + z ≤ 2x의 경우에 대하여, 2αy > υ + αz > 2x가 되도록 하는 인센티브 α를 구하면,

      • 1) 조건 (11)로부터 y > z , y > υ가 성립한다. 따라서 2y > υ + z이므로 2yυ + z는 발생할 수 없다.

      • 2) v+ z ≤ 2x인 경우, υ + αz > 2x를 만족하는 α의 조 건은 α < 2 x υ z 이다. 그러나 x > υ이므로 2x - υ < 0임을 보장하지 않으며, 2x - υ ≥ 0일 때 인센티 브 α는 존재하지 않는다. 따라서 2x - υ < 0일 때 α < 2 x υ z 는 유의한 조건이다. □

    3.2 패널티 모델

    패널티 모델은 부인하는 사람에 대해 형량을 높게 부과 하도록 하기 위한 모델이며 부인한 경우 원래 형량에 패널 티 β를 곱하여 형량이 늘어나게 한다(β > 1) . 따라서 β의 값이 클수록 패널티 부과 량이 늘어나 형량이 증가하게 된다. 이를 이득행렬로 나타내면 <Table 4>와 같다.

    패널티 모델을 통한 딜레마 해결 조건을 적용하면 다 음과 같다.

    y > β υ
    (22)

    z > β x
    (23)

    z > β υ
    (24)

    2 y > 2 β x
    (25)

    2 y > β υ + z
    (26)

    β υ + z > 2 β x
    (27)

    또한 제약조건 (26)~(27)을 조합하면 (28)을 도출할 수 있다.

    2 y > β υ + z > 2 β x
    (28)

    조건 (22)~(25) 또한 기존의 조건 (9)~(11)이 주어지는 한 항상 만족된다. 그 이유는 υ , x, y, z가 모두 음수이며 β가 1보다 큰 수이기 때문이다. 따라서 기존의 조건 (9)~ (11) 하에서 패널티를 부여할 경우 제약조건 (22)~(25)는 자동적으로 만족되므로 조건 (28)을 만족하는 β의 범위 에 대하여 분석해 보고자 한다.

    Proposition 2.υ, x, y, z가 모두 음수일 때, 죄수의 딜레마 게임에서 개인적 합리성과 함께 사회적 합리성을 동시에 추구할 수 있는 패널티 β (β > 1)의 조건은 다음과 같다.

    • (a) 조건 (9)인 경우, β > β * = 2 y z υ

    • (b) 조건 (10)인 경우,

      • i) 2x - υ < 0이면,

        β > β * = max { 2 y z υ , z 2 x υ }

      • ii) 2x - υ ≥ 0이면, 유의한 β는 존재하지 않는다.

    • (c) 조건 (11)인 경우,

      • i) 2x - υ < 0이면, β > β * = z 2 x υ

      • ii) 2x - υ ≥ 0이면, 유의한 β는 존재하지 않는다.

    (Proof)

    • (a) 조건 (9) (z > y > υ > x) 하에서, 1) 2yυ + z 또는 2) υ + z ≤ 2x의 경우에 대하여, 패널티 β를 부여하 여 2y > βυ + z > 2βx이 만족되도록 하는 β의 조건을 구하여야 한다:

      • 1) 2yυ + z인 경우, 2y > βυ + z를 만족하는 β의 조건 은 β > 2 y z υ 이다(Note : 2yυ + z이므로 2 y z υ 1 ).

      • 2) 조건 (9)로부터 υ > x, z > x가 성립한다. 따라서 υ + z > 2x이므로 υ + z ≤ 2x는 발생할 수 없다.

    • (b) 조건 (10) (z > y > x > υ ) 하에서, 1) 2yυ + z 또는 2) υ + z ≤ 2x의 경우에 대하여, 2y > βυ + z > 2βx가 되도록 하는 패널티 β를 구하면,

      • 1) 2yυ + z인 경우, 2y > βυ + z를 만족하는 β의 조건 은 β > 2 y z υ 이다(Note : 2yυ + z이므로 2 y z υ 1 ).

      • 2) υ + z ≤ 2x인 경우, βυ + z > 2βx를 만족하는 β의 조 건은 (2x - υ)β < z이다. 이때 2x - υ ≥ 0이면 β < z 2 x υ 이지만 z 2 x υ < 0 이므로 유의하지 않으며, 2x - υ < 0이면 β > z 2 x υ 로써 유의한 조건을 도출 한다(Note : υ + z ≤ 2x이므로 z 2 x υ 1 ).

        1), 2)의 결과를 종합했을 때, 2x - υ ≥ 0이면, 유의한 β는 존재하지 않으며, 2x - υ < 0이면, 1), 2)의 결과 를 모두 반영하여 두 가지 경우를 모두 만족시키는 β > β > max { 2 y z υ , z 2 x υ } 의 조건이 성립한다.

    • (c) 조건 (11) (y > z > x > υ) 하에서, 1) 2yυ + z 또는 2) υ + z ≤ 2x의 경우에 대하여, 2y > βυ + z > 2βx가 되도록 하는 패널티 β를 구하면,

      • 1) 조건 (11)로부터 y > z , y > υ가 성립한다. 따라서 2y > υ + z이므로 2yυ + z는 발생할 수 없다.

      • 2) υ + z ≤ 2x인 경우, βυ + z > 2βx를 만족하는 β의 조 건은 (2x - υ)β < z이다. 이때 2x - υ ≥ 0이면 β < z 2 x υ 이지만 z 2 x υ < 0 이므로 유의하지 않으며, 2x - υ < 0이면 β > z 2 x υ 로써 유의한 조건을 도출 한다(Note : υ + z ≤ 2x이므로 z 2 x υ 1 ). □.

    3.3 인센티브 및 패널티의 관계

    제 3.1, 3.2절로부터 인센티브 및 패널티를 정리한 결과 는 <Table 5>와 같다. <Table 5>에서 나타나는 바와 같이, 각각의 조건 하에서 인센티브 및 패널티가 존재할 경우 항상 서로에게 역수의 관계를 만족한다(즉, α*= 1/β*). 이 것은 죄수의 딜레마 게임에서 자백할 경우 기존 형량의 α*배 만큼 감형함으로써 딜레마를 해결하는 것과 부인할 경우 기존 형량의 β*(=1/α*)배 만큼 형량을 증가시킴으로 써 딜레마를 해결하는 것과 같은 효과를 가져 옴을 의미한 다. 예를 들어, 자백의 기존 형량에 80%(4/5)를 부여함으 로써 딜레마를 해결하거나 또는 부인에 125%(5/4)를 부과 함으로써 딜레마를 해결할 수 있음을 보여준다. 따라서 이 런 관계를 이용하여 자백 또는 부인 중 어느 한 쪽을 선택 하여 인센티브나 패널티의 양을 정하면 역수의 관계를 이 용하여 다른 한 쪽의 양 또한 정할 수 있음을 나타낸다.

    4. 수치 예제 및 시뮬레이션 결과

    본 장에서는 제 3장에서 도출한 인센티브 및 패널티 모델의 사회적 합리성 추구를 위한 조건을 수치 예제를 통하여 그 유용성을 확인해 보고, 시뮬레이션을 통해 인 센티브 및 패널티를 계산한 결과를 분석해 본다.

    <예제 1>

    조건 (9)인 z > y > υ > x를 만족하는 변수 υ, x, y, z를 임의로 생성한 z = - 1, y = - 3, υ = - 4, x = - 5를 고 려한다. 인센티브 또는 패널티가 없을 때, 조건 (7)인 2y > υ + z > 2x 중 2y > υ + z를 만족하지 못하게 된다.

    먼저 인센티브를 적용할 경우, 조건 (18)인 2αy > υ + αz > 2x가 되고 이 조건을 만족시키는 α의 범위를 구할 수 있다. 여기서 만족하지 못한 2y > υ + z를 인센티브를 통해 2αy > υ + αz의 부등식이 성립되도록 하며, 원래 만 족했던 부등식 υ + z > 2x는 조건 (9) 하에서 항상 만족하 며 인센티브를 투입하여도 υ + αz > 2x는 항상 만족한다 (υ + αz > υ + z > 2x). 이러한 결과를 반영하여 도출한 Proposition 1의 (a)에 의해, α

    α < α * = υ 2 y z = 4 2 × ( 3 ) ( 1 ) = 4 5

    이므로 α < 0.8의 범위를 도출할 수 있다.

    다음으로, 패널티를 적용한다면 조건 (28)인 2y > βυ + z > 2βx를 만족하는 β의 범위를 구할 수 있으며, Proposition 2의 (a)에 따라

    β > β * = 2 y z υ = 5 4

    이므로 β > 1.25의 범위를 도출할 수 있으며 패널티와 인 센티브는 서로 역수의 관계에 있음을 알 수 있다. 본 예 제를 통해 동일한 죄수의 딜레마 게임에 대하여 인센티 브를 부여할 경우에는 자백에 대해 80% 미만 감형, 패널 티를 부과할 경우에는 부인에 대해 25%를 초과하는 추 가 형량을 통해 딜레마를 해결할 수 있음을 보여준다.

    <예제 2>

    조건 (10)인 z > y > x > υ를 만족하는 임의의 변수 z = - 2, y = - 3, x = - 4, υ = -7를 고려한다. 인센티브나 패널 티가 없을 때, 2y > υ + z > 2xυ + z > 2x를 만족하지 못함을 알 수 있다.

    먼저 인센티브를 적용할 경우, 인센티브를 투입한 2αy > υ + αz > 2x을 만족하는 α의 범위를 구할 수 있다. 그러 나 본 예제에서 고려하는 조건 (10)의 경우 υ + αz > 2x를 통해 나타나는 α의 범위인 α < (2x - υ)/z에서 2x - υ가 항상 음수임을 보장하지 않는다. 본 예제의 경우 2x - υ = - 1이므로 유의한 α의 범위는 존재함을 알 수 있으며, 이 러한 결과를 반영한 Proposition 1의 (b)를 통해 인센티브 를 부여한 결과

    α < α * = min { υ 2 y z , 2 x υ z } = { 7 4 , 1 2 } = 1 2

    이므로 α < 0.5의 범위를 도출할 수 있다.

    이제 패널티를 고려한 딜레마 해결방안을 살펴보면, Proposition 2의 (b)에 따라

    β > β * = max { 2 y z υ , z 2 x υ } = max { 4 7 , 2 } = 2

    로써 인센티브의 역수임을 알 수 있다.

    따라서 본 예제는 자백의 형량에 α < 0.5의 범위 내에 서 인센티브를 주거나 부인의 형량에 β > 2 이상의 패널 티를 부과하여야만 두 플레이어에게 자백을 선택하도록 할 수 있으며, 이는 개인적 또한 사회적으로도 합리적 선 택이 되게 된다.

    <예제 3>

    마지막으로, 조건 (11)인 y > z > x > υ를 만족하는 임의 의 변수 y = - 1, z = - 2, x = - 3, υ = - 5를 고려한다. 인센티브 또는 패널티가 없을 때, 2y > υ + z > 2xυ + z > 2x를 만족하지 못한다.

    먼저 인센티브를 고려할 때, 인센티브를 투입한 2αy > υ + αz > 2x의 부등식을 모두 만족하는 α의 범위를 구하 여야 한다. 이 때 조건 (11)의 경우 2y > υ + z는 항상 만 족하며 따라서 2αy > υ + αz도 항상 만족한다. 그러므로 두 번째 부등식인 υ + αz > 2x를 통해 나타나는 α의 범 위인 α < (2x - υ)/z 및 2x - υ =- 1 < 0임을 고려하여 Proposition 1의 (c)에 따라 α < α * = 2 x υ z = 1 2 로써 α < 0.5 의 범위를 도출할 수 있다. 패널티는 Proposition 2의 (c) 및 인센티브와의 역수 관계를 이용하여 β > 2일 때 두 플레이어 모두 자백을 함과 동시에 사회적 합리성을 추 구할 수 있는 게임을 설계할 수 있다.

    지금까지의 예제를 통해 살펴본 결과를 바탕으로 계산 실험을 추가적으로 진행하였다. 조건 (9)-(11)에 대하여 조건 (7)의 2y > υ + z > 2x이 만족되지 않는 임의의 변수 를 생성하여 인센티브 또는 패널티를 결정하였다. 계산 실험을 위해, 조건 (9)~(11)별로 총 10가지 경우의 임의의 변수를 생성하였다. 총 4개의 변수 υ, x, y, z의 부등호 관계에 따라 크게 [-4, -1], [-8, -5], [-12, -9], [-16, -13] 네 가지 구간에 대해 균등분포로 난수를 발생하였고 2x - υ < 0인 경우만을 고려하였다. 이를 바탕으로 인센티브 및 패널티를 구한 결과는 <Table 6>과 같이 나타났다.

    먼저, 조건 (9)를 만족하는 10가지 표본의 경우 υ + z > 2x는 항상 만족하며 2y > υ + z를 만족하지 못함을 알 수 있다. 따라서 α < α*= υ/(2y - z )에 의한 인센티브 값, 2y > βυ + z를 만족하는 β > β*= (2y - z )/υ를 통한 패널 티 값을 도출하였다. 여기서 2y - z 대비 υ가 작을수록 α*는 더욱 작게, β*는 더욱 큰 값을 가지게 됨을 알 수 있다. 또한 α < α*를 만족하는 임의의 값 α ^ = α * 0.05 을 대입하여 인센티브가 적용된 이후의 2 α ^ y > υ + α ^ z > 2 x 의 부등식을 비교해 본 결과, 2 α ^ y υ + α ^ z 의 차이가 υ + α ^ z 와 2x 간의 차이보다 적게 나타나며, 이는 만족되지 못한 양을 최소한의 인센티브를 통해 만족토록 한 결과에서 비롯되었고, β ^ = β * + 0.05 을 대입한 패널티 모델에서도 동 일하게 나타났다. 동일한 방식으로 조건 (10) 및 조건 (11)을 만족하면서 2y > υ + z > 2x을 만족하지 못하는 임 의의 10가지 표본을 각각 생성하여 인센티브 및 패널티 값을 도출하였으며, 이들이 적용된 2 α ^ y > υ + α ^ z > 2 x 2 y > β ^ υ + z > 2 β ^ x 를 비교하였다.

    계산 실험을 통해 나타난 결과는 그 경향과 특징에 대 해서는 충분히 참고할 수 있지만, 이를 매우 광범위한 경 우의 죄수의 딜레마 게임에 일반화시켜 해석하기에는 무 리가 따를 수 있으며 인센티브 및 패널티의 값은 전적으 로 변수 값에 종속되어 나타나는 결과임을 유의할 필요 가 있다.

    5. 결 론

    지금까지 죄수의 딜레마 게임이 가지고 있는 딜레마 를 해결하기 위한 방안에 대하여 살펴보았다. 딜레마는 개인적 합리성의 결과가 사회적 합리성과 부합되지 않음 으로써 발생하였고, 이를 해결하기 위해 자백했을 때 인 센티브를 부여하는 방안과 부인했을 때 패널티를 부과하 는 방안에 대하여 다루어 보았다. 또한 인센티브와 패널 티의 양을 얼마나 부여하는 것이 적절한 지 확인해 보기 위하여 이론적 결과를 제시하였고, 이를 예제 및 임의로 생성한 데이터들을 통해 그 유용성을 확인하였다. 추가 적으로 인센티브와 패널티는 서로 역수의 관계에 있음을 관찰할 수 있었으며 이는 어느 한 쪽을 구한다면 다른 한 쪽은 자동적으로 해결됨을 보여주었다. 이를 통해 죄 수의 딜레마 게임에 대해서 다시 한 번 고찰해 볼 수 있 었으며, 이는 현실세계에서 접할 수 있는 딜레마의 상황 을 어떻게 해결해 나갈 것인가에 대한 참고자료를 제시 할 수 있을 것이다. 인센티브 또는 패널티를 적용하여 딜 레마를 해소할 수 있을 것으로 기대되는 대표적인 분야 로 갈등 관리를 고려할 수 있으며, 두 당사자의 갈등을 해결하는데 인센티브나 패널티를 적용함으로써 각자의 합리적인 선택의 결과가 공익에도 부합되도록 게임을 조 정할 수 있을 것이다.

    본 연구에서 고려한 죄수의 딜레마 게임은 변수의 조 건이 일반적인 상황 모두를 고려하지는 못하였다. 이는 자백과 부인이라는 두 가지 선택에 동일한 형량이 부과 되게 함으로써 실제 죄수의 딜레마 게임에서 자백과 부 인 간의 상관관계 또는 종속관계에 의해 나타날 수 있는 다양한 경우에 대한 일반적인 해법을 제시하지는 못했다 는 한계점을 지니고 있다. 또한 본 연구에서 제시한 인센 티브나 패널티를 통한 해결 방안 이외에도 고려할 수 있 는 해결 방안이 충분히 가능할 것이다. 본 연구에서 다루 지 못한 부분의 추가적인 연구를 통해 보다 일반화된 형 태의 죄수의 딜레마 게임에 대한 고찰 및 해결 방안에 대한 제시는 더욱 의미 있는 결과가 될 수 있을 것으로 기대된다.

    Figure

    Table

    Payoff Matrix of Prisoner’s Dilemma

    Variables in the Payoff Matrix

    Payoff Matrix with Incentive Factor

    Payoff Matrix with Penalty Factor

    Incentives and Penalties According to the Conditions

    Dilemma Resolving Results using Incentives and Penalties

    Reference

    1. Chung, H., Game theory, rational choice theory, and the prisoner’s dilemma: some clarifications, Korean Journal for the Philosophy of Science, 2014, Vol. 17, No. 3, pp. 23-51.
    2. Jang, D.C. and Ahn, B.H., Competition between offline and online retailers and sales tax, Korean Journal of Marketing, 2008, Vol. 23, No. 3, pp. 93-115.
    3. Kim, J.-H., Jang, Y.-S., Lee, D.-J., and Hong, E.-K., Power control algorithm with finite strategic game : Game theoretic approach, The Journal of Korea Navigation Institute, 2009, Vol. 13, No. 1, pp. 87-96.
    4. Kim, K., Lee, D., Jang, Y., Kim, J., and Hong, I., A prisoner’s dilemma model application to power control for wireless network communication, Proceedings of the Fall Conference on the Korean Institute of Industrial Engineers, 2008, pp. 670-678.
    5. Kim, K.-H., Negotiation and Strategy : Economics of Interdependence and Intuition, Yulgokbook Publishing Co., 2012.
    6. Lee, C.-H., Effects of defection on benefits of artificial group : a game theory perspective, Journal of KISS : Software and Applications, 2011, Vol. 38, No. 9, pp. 491-496.
    7. Lee, M. and Cho, H.-R., Game theoretic analysis of the direct marketing channel strategy of a manufacturer, Journal of Society of Korea Industrial and Systems Engineering, 2009, Vol. 32, No. 3, pp. 168-177.
    8. McCain, R.A., Game Theory : A Nontechnical Introduction to the Analysis of Strategy, World Scientific, 2010.
    9. Park, H. and Kim, K.-J., Opponent’s player’s decision modeling in iterated prisoner’s dilemma using reverse engineering technique, Proceedings of the Conference on the Korean Institute of Information Scientists and Engineers, 2013, pp. 1499-1501.
    10. Seo, Y.-G. and Cho, S.-B., Experimental study on cooperative coalition in N-person iterated prisoner’s dilemma game using evolutionary approach, Journal of KISS : Software and Applications, 2000, Vol. 27, No. 3, pp. 257-265.
    11. Yang, S.-L., Noh, H.-G., and Cho, S.-B., The evolution of cooperation according to decision making methods of strategic coalition in iterated prisoner’s dilemma game, Proceedings of the Conference on the Korean Institute of Information Scientists and Engineers, 2002, pp. 310-312.