기본 콘텐츠로 건너뛰기

라벨이 베이즈 추론인 게시물 표시

유방암 양성예측도와 베이지안 추론

유방암 양성예측도와 베이지안 추론 이 글에서는 유방암 진단 결과가 양성으로 나올 경우 실제로 유방암에 걸렸을 확률을 계산하는 식을 유도합니다. 또한 진단을 전후하여 달라지는 확률에 대하여 베이지안 추론 방식으로 설명해 보고자 합니다. 문제 정의 관심 대상군에 속하는 여성의 1%가 유방암 에 걸린다고 알려져 있습니다. 병원을 방문한 어떤 여성의 진단 결과가 양성 으로 나왔고 진단에 사용한 장비의 민감도는 90 % , 특이도는 85% 입니다. 그렇다면 그 여성이 실제로 유방암에 걸렸을 확률 은 얼마입니까? 민감도와 특이도에 대해서는 다음 장에서 설명합니다. 진단 장비의 성능 평가 혼동행렬(Confusion Matrix) 진단 장비의 성능을 파악하기 위하여 질병의 유무를 알고 있는 사람들을 대상으로 진단을 수행하고 아래와 같이 혼동행렬을 작성합니다. 진단 질병(숫자) 정상(숫자) 양성(숫자) A B 음성(숫자) C D A: 진양성(True Positive) 수 B: 위양성(False Positive) 수 C: 위음성(False Negative) 수 D: 진음성(True Negative) 수 민감도(Sensitivity) 질병이 있는 사람을 양성으로 판정하는 정도를 민감도(sensitivity)라고 하며 아래와 같이 구합니다. 민감도 = A A + C \frac{ A } { A+C } A + C A ​ 특이도(Specificity) 질병이 없는 사람을 음성으로 판정하는 정도를 특이도(specificity)라고 하며 아래와 같이 구합니다. 특이도 = D B + D \frac{ D }{ B+D } B + D D ​ 진단 성능 지표 AUC ROC 진단 장비의 양성, 음성 판단 기준을 변경하면 혼동행렬에서 A, B, C, D의 값이 달라지고 이것은 민감도와 특이도가 변한다는 것을 의미합니다. 그래서 양성, 음성 판단 기준을 조정해 가면서 아래와 같은 민감도...

몬티 홀 문제와 베이지안 추론

몬티 홀 문제와 베이지안 추론 몬티 홀 문제 를 풀고 이에 대하여 베이지안 추론 방식으로 설명해 보고자 합니다. 문제 정의 세 개의 문이 있고 한 개의 문 뒤에는 자동차, 나머지 두 개의 문 뒤에는 염소가 있습니다. 각각의 문에는 1, 2, 3으로 번호가 붙어 있고 문이 닫힌 상태에서는 뒤에 무엇이 있는지 알 수 없습니다. 게임쇼 참여자가 1번을 선택하였습니다. 이어서 문 뒤에 무엇이 있는지 알고 있는 진행자는 3번 문을 열었고 그 뒤에는 염소가 있었습니다. 게임쇼 참여자에게 선택을 2번으로 바꿀 수 있는 기회가 주어집니다. 그렇다면 1번에 머무르는 것보다 2번으로 바꾸는 것이 우승할 확률을 더 높여줄까요? 문제 해결의 단서 문 뒤에 무엇이 있는지 알고 있는 진행자 는 2번 문과 3번 문 중 어느 하나를 무작위로 선택해서 여는 것이 아니라 자동차가 없는 문을 골라서 여는 것입니다. 진행자의 행위로 인해 2번 문 뒤에 자동차가 있을 확률이 더 높아졌다고 말할 수 있습니다. 문 뒤에 무엇이 있는지 모르는 진행자 가 2번 문과 3번 문 중에서 3번 문을 임의로 선택해서 열었는데 거기에 염소가 있다면 그것은 우연히 그렇게 된 것일 뿐입니다. 이 경우에는 2번 문 뒤에 자동차가 있을 확률을 더 높여주지 않으므로 1번 문을 선택한 게임쇼 참여자가 2번 문으로 바꿀 이유가 없습니다. 베이지안 추론 베이즈 정리 베이즈 정리는 아래의 식으로 표현됩니다. P ( C ∣ E ) = P ( E ∣ C ) × P ( C ) P ( E ) P(C|E) = \frac{P(E|C)\times P(C)}{P(E)} P ( C ∣ E ) = P ( E ) P ( E ∣ C ) × P ( C ) ​ 위의 식을 몬티 홀 문제에 적용하기 위하여 C와 E를 다음과 같이 정의합니다. C: 2번 문 뒤에 자동차 존재 (2-car) E: 3번 문 열기 (3-open) 3번 문 뒤에 염소가 있을 경우 2번 문 뒤에 자동차가 있을 확률...