기본 콘텐츠로 건너뛰기

2021의 게시물 표시

Guava BloomFilter 사용 기초

Guava BloomFilter 사용 기초 사용 환경 Windows 10 Java 1.8 Gradle 7.2 Spring Boot 2.5.4 Oracle DB 19 MyBatis 2.2.0 프로젝트 생성하기 프로젝트 생성 브라우져에서 spring initializr 를 방문하여 아래와 같이 입력하고 GENERATE 버튼을 클릭합니다. Project: Gradle Project Language: Java Spring Boot: 2.5.5 Project Meta: Group: trvoid.bloomfilter Artifact: bloom-filter Name: bloom-filter Package name: trvoid.bloomfilter Packaging: Jar Java: 8 Dependencies: JDBC API MyBatis Framework Oracle Driver 생성된 프로젝트 파일을 다운로드하여 압축을 풉니다. 프로젝트 폴더 구조는 아래와 같습니다. bloom-filter |-src |-main |-java |-trvoid.bloomfilter |-BloomFilterApplication.java |-resources |-application.properties |-test |-java |-trvoid.bloomfilter |-BloomFilterApplicationTests.java |-build.gradle build.gradle 파일에서 의존성 항목을 확인할 수 있습니다. dependencies { implementation 'org.springframework.boot:spring-boot-starter-jdbc' implementation 'org.mybatis.sprin...

당뇨병 발병 예측 - Gaussian Naive Bayes 모델

diabetes-onset-by-gaussian-nb 당뇨병 발병 예측 - Gaussian Naive Bayes 모델 ¶ 이 글에서는 피마 인디언 당뇨병 데이터세트를 사용하여 어떻게 당뇨병 발병을 예측할 수 있는지 베이지안 추론 방식으로 보여줍니다. 이 글의 전개 과정은 아래와 같습니다. 당뇨병 발병 데이터세트를 준비합니다. 발병 여부별로 측정값의 히스토그램을 그려서 분포를 파악합니다. 발병 여부에 따라서 측정값이 어떻게 분포할 수 있는지 설명하는 모델을 정의합니다. 측정값이 주어질 때 발병 여부를 예측하는 분류기를 구현합니다. 데이터 세트를 훈련 데이터와 검증 데이터로 나누어 분류기를 훈련시키고 예측 성능을 구합니다. 라이브러리 준비 ¶ 사용할 파이썬 라이브러리들을 임포트합니다. In [23]: from collections import defaultdict import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from scipy.stats import norm import matplotlib.pyplot as plt % matplotlib inline np . set_printoptions ( precision = 6 ) np . random . seed ( 7 ) 데이터 준비 ¶ UCI Machine Learning 에서 제공하는 Pi...