iris-classification-by-gaussian-nb 붓꽃 분류 - Gaussian Naive Bayes 모델 ¶ 이 글에서는 붓꽃의 꼳받침과 꽃잎의 특징을 사용하여 어떻게 꽃의 종류를 예측할 수 있는지 베이지안 추론 방식으로 보여줍니다. 이 글의 전개 과정은 아래와 같습니다. 붓꽃 데이터 세트를 준비합니다. 꽃 종류별로 측정값의 히스토그램을 그려서 분포를 파악합니다. 꽃 종류에 따라서 측정값이 어떻게 분포할 수 있는지 설명하는 모델을 정의합니다. 측정값이 주어질 때 꽃의 종류를 예측하는 분류기를 구현합니다. 데이터 세트를 훈련 데이터와 검증 데이터로 나누어 분류기를 훈련시키고 예측 성능을 구합니다. 라이브러리 준비 ¶ 사용할 파이썬 라이브러리들을 임포트합니다. In [1]: from collections import defaultdict import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from scipy.stats import norm import matplotlib.pyplot as plt % matplotlib inline np . set_printoptions ( precision = 6 ) np . random . seed ( 7 ) 데이터 준비 ¶ scikit-learn 에서...