페이지

2020년 12월 23일 수요일

몬티 홀 문제와 베이지안 추론

몬티 홀 문제와 베이지안 추론

몬티 홀 문제를 풀고 이에 대하여 베이지안 추론 방식으로 설명해 보고자 합니다.

문제 정의

세 개의 문이 있고 한 개의 문 뒤에는 자동차, 나머지 두 개의 문 뒤에는 염소가 있습니다. 각각의 문에는 1, 2, 3으로 번호가 붙어 있고 문이 닫힌 상태에서는 뒤에 무엇이 있는지 알 수 없습니다. 게임쇼 참여자가 1번을 선택하였습니다. 이어서 문 뒤에 무엇이 있는지 알고 있는 진행자는 3번 문을 열었고 그 뒤에는 염소가 있었습니다. 게임쇼 참여자에게 선택을 2번으로 바꿀 수 있는 기회가 주어집니다. 그렇다면 1번에 머무르는 것보다 2번으로 바꾸는 것이 우승할 확률을 더 높여줄까요?

문제 해결의 단서

  • 문 뒤에 무엇이 있는지 알고 있는 진행자는 2번 문과 3번 문 중 어느 하나를 무작위로 선택해서 여는 것이 아니라 자동차가 없는 문을 골라서 여는 것입니다. 진행자의 행위로 인해 2번 문 뒤에 자동차가 있을 확률이 더 높아졌다고 말할 수 있습니다.
  • 문 뒤에 무엇이 있는지 모르는 진행자가 2번 문과 3번 문 중에서 3번 문을 임의로 선택해서 열었는데 거기에 염소가 있다면 그것은 우연히 그렇게 된 것일 뿐입니다. 이 경우에는 2번 문 뒤에 자동차가 있을 확률을 더 높여주지 않으므로 1번 문을 선택한 게임쇼 참여자가 2번 문으로 바꿀 이유가 없습니다.

베이지안 추론

베이즈 정리

베이즈 정리는 아래의 식으로 표현됩니다.

  • P(CE)=P(EC)×P(C)P(E)P(C|E) = \frac{P(E|C)\times P(C)}{P(E)}

위의 식을 몬티 홀 문제에 적용하기 위하여 C와 E를 다음과 같이 정의합니다.

  • C: 2번 문 뒤에 자동차 존재 (2-car)
  • E: 3번 문 열기 (3-open)

3번 문 뒤에 염소가 있을 경우 2번 문 뒤에 자동차가 있을 확률을 아래와 같이 조건부확률로 표현할 수 있습니다.

  • P(2-car3-open)P(2\textnormal{-}car|3\textnormal{-}open)

이를 베이즈 정리에 따라 표현하면 아래와 같습니다.

  • P(2-car3-open)=P(3-open2-car)×P(2-car)P(3-open)P(2\textnormal{-}car|3\textnormal{-}open)=\frac { P(3\textnormal{-}open|2\textnormal{-}car)\times P(2\textnormal{-}car) }{ P(3\textnormal{-}open) }

확률 계산

3번 문을 열지 않은 상태에서 각각의 문 뒤에 자동차가 있을 확률

  • P(1-car)=13P(1\textnormal{-}car) = \frac{1}{3}
  • P(2-car)=13P(2\textnormal{-}car) = \frac{1}{3}
  • P(3-car)=13P(3\textnormal{-}car) = \frac{1}{3}

1번 문 뒤에 자동차가 있을 때 진행자가 3번 문을 열 확률

  • P(3-open1-car)=12P(3\textnormal{-}open|1\textnormal{-}car) = \frac{1}{2}

2번 문 뒤에 자동차가 있을 때 진행자가 3번 문을 열 확률

  • P(3-open2-car)=1P(3\textnormal{-}open|2\textnormal{-}car) = 1

3번 문 뒤에 자동차가 있을 때 진행자가 3번 문을 열 확률

  • P(3-open3-car)=0P(3\textnormal{-}open|3\textnormal{-}car) = 0

게임쇼 참여자가 1번 문을 선택했을 때 자동차가 어디에 있는지 알고 있는 진행자가 2번, 3번 문 중에서 3번 문을 열 확률

  • P(3-open)=P(3-open1-car)×P(1-car)+P(3-open2-car)×P(2-car)+P(3-open3-car)×P(3-car)=12×13+1×13+0×13=12P(3\textnormal{-}open) \\ \quad = P(3\textnormal{-}open|1\textnormal{-}car)\times P(1\textnormal{-}car) \\ \quad + P(3\textnormal{-}open|2\textnormal{-}car)\times P(2\textnormal{-}car) \\ \quad + P(3\textnormal{-}open|3\textnormal{-}car)\times P(3\textnormal{-}car) \\ \quad = \frac{1}{2}\times \frac{1}{3} + 1 \times \frac{1}{3} + 0\times \frac{1}{3} \\ \quad = \frac{1}{2}

3번 문을 열었을 때 2번 문 뒤에 자동차가 있을 확률

  • P(2-car3-open)=P(3-open2-car)×P(2-car)P(3-open)=1×1/31/2=23P(2\textnormal{-}car|3\textnormal{-}open) \\ \quad =\frac { P(3\textnormal{-}open|2\textnormal{-}car)\times P(2\textnormal{-}car) }{ P(3\textnormal{-}open) } \\ \quad = \frac{1\times 1/3}{1/2} \\ \quad = \frac{2}{3}

베이지안 추론 방식의 설명

3번 문을 열지 않은 상태에서 2번, 3번 문 중의 하나 뒤에 자동차가 있을 확률이 2/3인데, 3번 문 뒤에 자동차가 없다는 것을 알게 되었으므로 2번 문 뒤에 자동차가 있을 확률은 2/3가 됩니다.

이를 문제 정의 단원에서 제시한 내용과 확률 계산 단원에서 얻은 값을 사용하여 베이지안 추론 방식으로 설명할 수 있습니다.

  1. 기존 믿음(Prior)
    • 3번 문을 열지 않은 상태에서 2번 문 뒤에 자동차가 있을 확률은 1/3이고 2번, 3번 문 중의 하나 뒤에 자동차가 있을 확률은 2/3입니다.
  2. 새로운 증거(New Evidence)
    • 문 뒤에 무엇이 있는지 알고 있는 진행자가 3번 문을 열어서 염소가 있음을 보여주었습니다.
  3. 믿음 수정(Posterior)
    • 기존의 믿음, 그리고 새로운 증거를 고려하여 2번 문 뒤에 자동차가 있을 확률을 2/3로 수정합니다.

Written with StackEdit.

국어 맞춤법 참고 자료

  제목 설명(인용) 출처 IT 글쓰기와 번역 노트 IT 기술 문서 및 서적을 집필/번역/교정하면서 얻은 경험/정보/지식을 공유합니다. 전뇌해커 [우리말 바루기] ‘대로’의 띄어쓰기 명사 뒤에서는 붙여 쓰고, 그 외에는 띄어 쓴다고 생각하면 쉽다. 다...