로지스틱 회귀(Logistic Regression), 범주형 데이터 분류
선형 회귀는 범주형 데이터를 대상으로 한 분류 문제에 적합하지 않다. *범주형 데이터란 'A', 'B', 'C'와 같이 종류를 표시하는 데이터를 말한다. 선형 회귀를 사용하여 2진 분류[ex) 성공 or 실패]를 나타낸 그림이다. X축을 노력한 시간, Y축을 합격 확률이라고 한다면, 노력한 시간(X)이 작으면 합격 확률(Y)이 음수가 되는 것을 볼 수 있고, 반대로 노력한 시간(X)이 계속 늘어날수록 합격 확률(Y)도 계속해서, 즉, 무한대로 늘어나는 것을 볼 수 있다. 선형 회귀로 2진 분류 문제를 풀기에는 다소 적절하지 않은 것을 알 수 있다. 로지스틱 회귀에서 쓰이는 함수(시그모이드) 로지스틱 회귀는 인공지능이 2항 분류[ex)합격 or 불합격, 음성 or 양성으로 분류]에 사용한다. 로지스틱 회귀..
2020.07.05