이 글에서는 유방암 진단 결과가 양성으로 나올 경우 실제로 유방암에 걸렸을 확률을 계산하는 식을 유도합니다. 또한 진단을 전후하여 달라지는 확률에 대하여 베이지안 추론 방식으로 설명해 보고자 합니다.
문제 정의
관심 대상군에 속하는 여성의 1%가 유방암에 걸린다고 알려져 있습니다. 병원을 방문한 어떤 여성의 진단 결과가 양성으로 나왔고 진단에 사용한 장비의 민감도는 90 %, 특이도는 85% 입니다. 그렇다면 그 여성이 실제로 유방암에 걸렸을 확률은 얼마입니까?
민감도와 특이도에 대해서는 다음 장에서 설명합니다.
진단 장비의 성능 평가
혼동행렬(Confusion Matrix)
진단 장비의 성능을 파악하기 위하여 질병의 유무를 알고 있는 사람들을 대상으로 진단을 수행하고 아래와 같이 혼동행렬을 작성합니다.
진단
질병(숫자)
정상(숫자)
양성(숫자)
A
B
음성(숫자)
C
D
A: 진양성(True Positive) 수
B: 위양성(False Positive) 수
C: 위음성(False Negative) 수
D: 진음성(True Negative) 수
민감도(Sensitivity)
질병이 있는 사람을 양성으로 판정하는 정도를 민감도(sensitivity)라고 하며 아래와 같이 구합니다.
민감도 = A+CA
특이도(Specificity)
질병이 없는 사람을 음성으로 판정하는 정도를 특이도(specificity)라고 하며 아래와 같이 구합니다.
특이도 = B+DD
진단 성능 지표 AUC ROC
진단 장비의 양성, 음성 판단 기준을 변경하면 혼동행렬에서 A, B, C, D의 값이 달라지고 이것은 민감도와 특이도가 변한다는 것을 의미합니다. 그래서 양성, 음성 판단 기준을 조정해 가면서 아래와 같은 민감도, 특이도 그래프를 그릴 수 있습니다.
TP 비율(True Positive Rate) = 민감도
FP 비율(False Positive Rate) = 1 - 특이도
그래프 곡선 아래의 면적을 구함으로써 성능 평가 지표인 AUC(Area Under the Curve) ROC(Receiver Operating Characteristic)를 구합니다. 아래 그림의 그래프를 살펴 보면 AUC가 클수록 낮은 FP 비율을 유지하면서도 더 높은 TP 비율을 보여줍니다. 즉 서로 다른 두 장비의 진단 성능을 비교할 때 AUC가 큰 쪽의 진단 성능이 더 좋다고 말할 수 있습니다.
질병에 걸렸을 확률
유병율(Prevalence)
대상 집단 중에서 질병을 가지고 있는 사람의 비율을 나타내는 유병율은 아래와 같이 구합니다.
유병율 = A+B+C+DA+C
양성예측도(Positive Predictive Value)
진단 결과가 양성으로 나왔을 때 실제로 질병에 걸렸을 확률을 나타내는 양성예측도는 아래와 같이 구합니다.
양성예측도 = A+BA
장비의 성능 평가 단계 이후에는 민감도, 특이도, 그리고 유병율을 사용하여 양성예측도를 계산할 수 있습니다.
조사 대상군 크기(Nsample)
질병 보유군 크기(Ndisease)= Nsample×prevalence
정상군 크기(Nnon-disease) = Nsample×(1−prevalence)
진양성 수(A) = Ndisease×sensitivity
위양성 수(B) = Nnon-disease×(1−specificity)
위의 표현을 사용하여 양성예측도 수식을 전개하면 아래와 같이 민감도, 특이도, 그리고 유병율로 표현한 계산식을 얻게 됩니다.
댓글 없음:
댓글 쓰기