기본 콘텐츠로 건너뛰기

라벨이 베이지안 추론인 게시물 표시

믿음의 정도를 수로 나타내고 이에 대한 수정 과정을 수식으로 표현하기

인간은 살아가면서 수많은 결정을 내리고 그것이 기대한 결과로 이어지기를 바랍니다. 부서 회식 장소 결정하기 영어 학원 등록 여부 결정하기 이사할 집 결정하기 결혼할 배우자 결정하기 입사할 회사 결정하기 결정에 따르는 결과를 완전히 운에 맡기는 것이 아니라면 결정을 내리기 전까지 거치는 과정을 아래와 같은 다이어그램으로 표현할 수 있습니다. 위에서 사실(fact), 확률(probability) 대신에 굳이 믿음(belief)이라는 용어를 사용한 이유는 충분한 증거가 없는 상태에서 무엇이 어떠하다라고 생각하는 것은 믿음에 가깝기 때문입니다. 한편으로는 믿음이라고 표현함으로써 얻게 되는 이득 중의 하나는 구체적인 적용을 시도할 때 엄밀함을 추구하지 않아도 된다는 것입니다. 우리는 일상 대화에서 믿음의 정도를 백분율로 표현하곤 합니다. 예를 들자면 아래와 같습니다. 나는 이번 선거에서 홍길동 후보가 당선될 것이라고 100% 확신한다. 나는 이 도자기가 고려시대에 만들어졌을 가능성은 고작 10% 정도라고 본다. 나는 이 식물이 암 치료에 99% 효과가 있다고 믿는다. 그러다가 자신이 가지고 있는 믿음에 반하거나 부합하는 어떤 증거를 발견하게 되면 믿음의 정도를 낮추거나 높입니다. 예시-1. 지구는 편평하다는 믿음 수정 과정 지구는 평평하다. (기존의 믿음) 바다에서 해안으로 접근하는 배의 꼭대기부터 보인다. (새로운 증거) 새로운 증거로 인해 지구가 평평하다는 믿음이 약해진다. (수정된 믿음) 예시-2. 인류 출현 시기에 대한 지식 수정 과정 인류는 20만년 전에 출현했다. (기존의 지식) 독일과 모로코 공동연구팀은 7일(현지시각) 북서부 아프리카의 모로코 한 유적지에서 발굴한 호모 사피엔스의 두개골, 이빨, 아래턱뼈 등 화석들의 연대를 분석한 결과 30만년 전 것으로 확인됐다고 과학저널 <네이처> 8일치에 보고했다. (새로운 증거) 인류가 30만년 전 출현했다. (수정된 지식) 예시-3. 유방암에 걸렸을 확률 수정 과정 관심 대상군에 속하는 여성의 1%가 ...

당뇨병 발병 예측 - Gaussian Naive Bayes 모델

diabetes-onset-by-gaussian-nb 당뇨병 발병 예측 - Gaussian Naive Bayes 모델 ¶ 이 글에서는 피마 인디언 당뇨병 데이터세트를 사용하여 어떻게 당뇨병 발병을 예측할 수 있는지 베이지안 추론 방식으로 보여줍니다. 이 글의 전개 과정은 아래와 같습니다. 당뇨병 발병 데이터세트를 준비합니다. 발병 여부별로 측정값의 히스토그램을 그려서 분포를 파악합니다. 발병 여부에 따라서 측정값이 어떻게 분포할 수 있는지 설명하는 모델을 정의합니다. 측정값이 주어질 때 발병 여부를 예측하는 분류기를 구현합니다. 데이터 세트를 훈련 데이터와 검증 데이터로 나누어 분류기를 훈련시키고 예측 성능을 구합니다. 라이브러리 준비 ¶ 사용할 파이썬 라이브러리들을 임포트합니다. In [23]: from collections import defaultdict import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from scipy.stats import norm import matplotlib.pyplot as plt % matplotlib inline np . set_printoptions ( precision = 6 ) np . random . seed ( 7 ) 데이터 준비 ¶ UCI Machine Learning 에서 제공하는 Pi...