정의
로지스틱 회귀는 선형 회귀처럼 기본 분석 모델입니다. 로지스틱 회귀 분석은 알고리즘 근간을 선형회귀 분석에 두고 있어서 선형 회귀 분석과 상당히 유사하지만 다루는 문제가 다릅니다.
선형 회귀 분석은 연속된 변수를 예측하는 반면, 로지스틱 회귀 분석은 Yes/No 처럼 두가지로 나뉘는 분류 문제를 다룹니다.
예시
장단점
장점 | 단점 |
선형 회귀 분석만큼 구현하기 용이합니다 | 선형 회귀 분석을 근간으로 하고 있기 때문에 선형 관계가 아닌 데이터에 대한 예측력이 떨어집니다 |
계수(기울기)를 사용해 각 변수의 중요성을 쉽게 파악할 수 있습니다 |
Package
import statsmodels.api as sm
평가방법
이진분류 평가방법중 가장 간단한 정확도(accuracy)를 사용합니다
정확도
정확도는 예측값과 실제값을 비교하여 얼마나 맞추었는지를 확인하는 것입니다.
시험셋 100개를 예측하고 그중 90개를 맞췄다면 정확도는 0.9입니다.
정확도의 좋고 나쁨을 결정하는 절대적인 지표는 없습니다. 상황마다 다르게 고려되어야 합니다.
이진분류에서 고유값이 50:50 비율로 분포되어 있다면 80%이상이면 나쁘지 않다고 보고 90%이상 이면 괜찬은 결과로 보는 편입니다.
Must Have 데싸노트의 실전에서 통하는 머신러닝 / 권시현 / 2022년, 골든래빗
'IT > 머신러닝' 카테고리의 다른 글
나이브 베이즈(Naive Bayes) (0) | 2024.09.11 |
---|---|
K-최근접이웃(K-NN, K-Nearest Neighbors) (1) | 2024.08.30 |
회귀분석(+다중공선성 문제) (0) | 2024.08.20 |
오버피팅과 언더피팅 (1) | 2024.08.19 |
독립변수, 종속변수, 연속형 변수, 범주형 변수 (0) | 2024.08.16 |