기본 콘텐츠로 건너뛰기

라벨이 기계학습인 게시물 표시

[신경망 이해] 모델 학습 세 단계

 1. 모델 함수 정의 (Model Function Definition) 이 단계는 "가설을 세우는 단계"라고 할 수 있습니다. 데이터의 입력(X)과 출력(Y) 사이에 어떤 수학적 관계가 있을 것이라고 가정하고, 그 관계를 나타내는 함수를 정의합니다. 이 함수를 '모델' 또는 '가설(Hypothesis)'이라고 부릅니다. 역할: 입력 변수들을 사용해서 예측값을 어떻게 계산할지 구조를 결정합니다. 예시: 선형 회귀 (Linear Regression): 입력(x)과 출력(y) 사이에 직선 관계가 있다고 가정하고, 모델 함수를 H(x)=Wx+b 와 같이 정의합니다. 여기서 W(가중치)와 b(편향)가 우리가 찾아야 할 파라미터입니다. 신경망 (Neural Network): 여러 개의 뉴런과 활성화 함수를 복잡하게 연결하여 비선형 관계를 표현할 수 있는 매우 유연한 함수를 정의합니다. 2. 비용 함수 정의 (Cost Function Definition) 이 단계는 "모델의 예측이 얼마나 틀렸는지 측정하는 기준을 세우는 단계"입니다. 모델이 예측한 값(H(x))과 실제 정답(y) 사이의 차이(오차)를 계산하는 함수를 정의합니다. 이 함수를 '비용 함수(Cost Function)' 또는 '손실 함수(Loss Function)'라고 합니다. 역할: 모델의 성능을 정량적인 숫자로 평가합니다. 비용 함수의 값이 작을수록 모델의 예측이 더 정확하다는 의미입니다. 목표: 이 비용 함수의 값을 최소화하는 것이 학습의 목표가 됩니다. 예시: 평균 제곱 오차 (Mean Squared Error, MSE): 회귀 문제에서 주로 사용되며, (예측값 - 실제값)²의 평균을 계산합니다. 교차 엔트로피 (Cross-Entropy): 분류 문제에서 주로 사용되며, 모델의 예측 확률 분포와 실제 정답 분포의 차이를 측정합니다. 3. 모델 파라미터 찾기 (Finding Model Parameters) 이 단계...

로지스틱 회귀 이해

로지스틱 회귀 이해 1. 문제 정의 1.1. 데이터 세트 로지스틱 회귀에 대한 이해를 돕기 위하여 다음과 같이 두 종류의 데이터 세트를 준비하고 설명을 진행합니다. Dataset-A: x = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ] , y = [ 0 , 0 , 0 , 0 , 0 , 1 , 1 , 1 , 1 , 1 ] x=\left[ 1,2,3,4,5,6,7,8,9,10 \right] , \quad y=[0,0,0,0,0,1,1,1,1,1] x = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 1 0 ] , y = [ 0 , 0 , 0 , 0 , 0 , 1 , 1 , 1 , 1 , 1 ] Dataset-B: x = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ] , y = [ 0 , 0 , 0 , 0 , 1 , 0 , 1 , 1 , 1 , 1 ] x=\left[ 1,2,3,4,5,6,7,8,9,10 \right] ,\quad y=[0,0,0,0,1,0,1,1,1,1] x = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 1 0 ] , y = [ 0 , 0 , 0 , 0 , 1 , 0 , 1 , 1 , 1 , 1 ] 위에서 x x x 는 독립 변수이고 y y y 는 종속 변수입니다. y y y 는 0 0 0 또는 1 1 1 을 값으로 가집니다. 위 그래프에 나타나 있듯이 Dataset-A에서는 x x x 축의 특정 값을 기준으로 y y y 가 0 0 0 인 경우와 1 1 1 인 경우로 명확하게 나누어지고 Dataset-B에서는 x x x 축의 일정 구간에서 y y y 가 0 0 0 인 경우와 1 1 1 인 경우가 서로 섞여 있다는 것을 알 수 있습니다. 1.2. 해결 과정 문제 해결 과정을 아래의 단계로 구분할 수 있습니다. 데이터 세트의 특성을 잘 나타내는 모델 함수(hypothesis)를 찾습...