Gurugail Game/Prisoner Dilemma
Game

Prisoner Dilemma

게임 이론은 1944년 수학자이자 물리학자인 폰 노이만(John von Neumann)과 경제학자 Oskar Morgensterm에 의해 시작된 수학적 이론으로 현재는 경제학, 정치, 군사전략 등 많은 분야에서 활용되고 있다. 그 중 죄수의 딜레마는 게임 이론에 있어 2명이 참가하는 비제로섬 게임의 일종으로, 일정한 조건에서 경쟁자간의 경쟁 상태를 모형화하여 참여자의 행동을 분석함으로써 최적 전략을 선택하는 것을 수학적으로 분석하는 이론에 속한다.

죄수의 딜레마에서의 게임 원칙

본 게임의 원칙을 말로 풀어 쓰면 다음과 같다. 우선 게임의 참가자는 2명이 있어야 하며, 2명이 선택할 수 있는 옵션은 협력 또는 배신 뿐이다.

  • 협력이란 2명이 상호 도움이 되는 행동을 뜻하며,
  • 배신은 참가자 자신만을 위한 행동을 뜻한다.

그 중 협력을 하면 상호 이득을 보게 되지만, 배신을 하게 되면 협력을 하게 될 경우보다 상당한 이득을 보게 된다. 다만, 서로 배신을 하면 피해를 보게 된다. 죄수를 예로 들어 보자. 서로 공범인 두 죄수는 서로 의사소통할 수 없는 분리된 공간에서 별도의 심문을 받게 된 경우를 보자. 이 경우에 있어, 두 죄수는 협력, 또는 배신이 가능할 것이며 아래 표에 따라 결과가 달라질 수 있다.(협력이란 서로의 죄를 부인하여 배신이란 서로의 죄를 고발하는 것으로 이해할 수 있다.)

A 죄수B 죄수결과
협력협력서로에게 상호 협력에 대한 이득
배신협력A에게는 매우 이득, B에게는 매우 불리
협력배신A에게는 매우 불리, B에게는 매우 이득
배신배신A, B 모두에게 불리


만약 실제 위와 같은 상황이 직면했다고 가정하면, 과연 당신이라면 무슨 패를 내밀 것인가? 고민해 볼만한 문제이다. 이것이 죄수의 딜레마에서 다루어야 할 전략적이고 이론적인 게임 이론 중 하나인 셈이다.

1라운드 게임라면 배신을 하라

죄수의 딜레마에서 딜레마(Dilemma) 이러지도 저러지도 못하는 궁지. ~에 빠지다. 라는 이름이 붙은 이유는 다음과 같다. 위의 표를 다시 한번 확인하자. A 입장에서 고려해 보자. B가 협력의 카드를 제시할 경우, A는 배신을 하는 것이 A에게는 매우 이롭다. B가 배신을 하는 경우는 어떠한가? A가 협력을 하면 A에게 매우 불리하게 된다. 결국 B가 배신할 경우에도 A 역시 배신을 하는 편이 협력보다는 A에게는 유리하다는 결론에 도달한다. 다시 말해, 상대방의 카드에 상관 없이 항상 배신(카드)을 하는 것이 가장 이득이거나 피해를 덜 보게 된다는 결론에 도달한다. 그러므로 상대방이 합리적인 경기자이면, 모두 배신하여 같이 벌금 또는 운 좋으면 유혹료를 받게 될 것으로 끝난다. 두 사람 모두 만일 쌍방이 '협력'만을 낸다면 상호 협력으로 비교적 높은 보수를 받을 것을 확실히 알고 있다. 하지만 '배신'의 카드를 내는 것이 최선의 행동이라는 것이다. 쌍방이 서로 연락하거나 정보를 주고 받을 수 있다면, 서로 연락해서 '협력'의 카드를 제출하겠지만, 그렇지 않을 경우에는 '배신'을 하는 것이 합리적인 게임 진행이 될 것이다.

반복 게임이라면,...

죄수 A, B가 위와 같은 상황에서 협력 또는 배신의 카드를 제시해야 한다면, 처음인 경우 배신을 할 것이다. 그게 상대 카드에 상관없이 그래도 이득을 취할 수 있는 방법이기 때문이다. 그러므로 1라운드의 상황에서는 상호 배신으로 끝나게 될 가능성이 높다. 그러나 그런 상황이 한번 더 반복된다면 어떠할까? 가령 다시 A, B가 잡혀 협력 또는 배신의 카드 중 하나를 제시해야 한다면 어떠할까? 그 때도 혹은 계속해서 상호 배신으로 계속 유지하는 것이 합리적일까? ( 이와 같은 반복은 두 사람이 반복적으로 공범자로 잡힌다고 가정하면 간단히 설명된다. 단 서로의 연락은 되지 않는다.) 상대방의 선택에 상관없이 배신을 하는 쪽이 언제나 이익이므로 합리적인 죄수라면 배신을 택한다. 결국 배신, 배신으로 A, B 모두에게 불리하게 작용하게 된다. 이런 상황이 N 회 반복된다면, 결국 자기 자신에 대해 불리하게 되니, 상호 협력을 통한 이득을 꾀하려는 움직임이 발생하게 되는 것이다. (개인주의적이지만 사회로의 협력을 통해 개인 이득을 최대화하려는 심리)

전략

과연 위와 같은 상황에 계속해서 닥칠 경우 어떤 전략으로 처신해야 장기적으로 이득를 거둘 수 있을 것인가를 생각해보자. 다시 말해 상대방이 제시한 카드에 따른 대응 전략이 필요하다. 아래는 여러 가지 전략 중 예제들이다.

  • 항상 협력
  • 두 발에 한발 갚기 : 최초 협력, 상대방이 두 번 연속 배신을 하면 배신
  • '당하면 갚는다(tit for tat)': 최초의 카드는 협력으로 시작하고 그 이후는 단순히 바로 전에 상대가 낸 카드를 흉내내는 것뿐이다. 즉, 상대가 배신을 하면 내가 배신을 하는 것이다.
  • '소박한 시험꾼(naive prober)' : 최초 협력, 가끔 배신
  • '원한파' : 한번 상대방이 배신하면 끝까지 배신하는 전략
  • 항상 배신

참고

http://ko.wikipedia.org/wiki/%EC%A3%84%EC%88%98%EC%9D%98_%EB%94%9C%EB%A0%88%EB%A7%88