본문 바로가기

머신러닝공부

Logistic Regression - Classfication 요약 정리

728x90
반응형

분류 Classfication

Training Data 특서과 관계등을 파악한 후에, 미지의 입력 데이터에 대해서 결과가 어떤 종류의 값으로 분류할 수 있는지를 예측하는 것

1. input 2. learning 3. ask 4. predict

 

Logistic Regression 알고리즘

1. Training Data 특성과 분포를 나타내는 최적의 직선을 찾는다.

2. 최적의 직선을 기준으로 데이터 (1) 또는 (0) (위/아래 or 왼쪽/오른쪽)등으로 분류해주는 알고리즘을 classfication이라고 한다.

-> 이러한 Logistic Regression은 Classfication 알고리즘 중에서도 정확도가 높은 알고리즘으로 알려져 있어서 Deep Learning에서 기본 Component로 사용되고 있음

Sigmoid function

출력값 y가 -1 또는 0만을 가져야만 하는 분류 시스템에서, 함수 값으로 0~1 사이의 값을 가지는 sigmoid 함수를 사용할 수 있음

-> 즉, linear regression 출력 Wx + b가 어떤 값을 갖더라도, 출력 함수로 sigmoid를 사용해서 1. sigmoid 계산 값이 0.5보다 크다면 결과로 1이 나올 확률이 높다는 것이기 때문에 출력값 y는 1을 정의하고 2. sigmoid 계산 값이 0.5미만이면 결과로 0이 나올 확률이 높다는 것이므로 출력 값 y는 0 정의하여 classfication 시스템을 구현할 수 있음

☑️ Sigmoid 함수의 실제 계산 값 sigmoid(Z)는 결과가 나타날 확률을 의미함

손실함수 Loss function, W, b

분류시스템 Classfication 최종 출력 값 y는 sigmoid 함수에 의해 논리적으로 1 또는 0 값을 가지기 때문에 연속 값을 갖는 선형회기 때와는 다른 손실함수가 필요하다.

 

반응형