비대칭 데이터1 비대칭 데이터 머신러닝을 위해 데이터 전처리를 하기위해서는 여러가지 이해가 필요하지만 그중 비대칭 데이터에 대해 공부한 내용이다 비대칭 데이터란?이진 분류 문제를 예를 들었을때 사건이 발생경우와 그렇지 않은 경우에 데이터량이 매우 크게 차이나는 데이터를 말합니다. 예를 들면 데이터가 10000개 인데 사건이 발생한 경우는 9990개고 사건이 발생한 경우가 10개라면 비대칭 데이터하고 할수 있다실제로 희귀 난치병이나 사업장 안전사고, 발전소 설비고장 등이 있습니다. 이런 경우에는 정확도로 모델을 평가하면 안됩니다. 분류 모델이 정확도를 판단하면 10/10000 으로 99.9%의 예측 정확도가 나오기 때문입니다. 이런 경우에는 민감도(Sesnsitivity, Recall)가 더 중요한 판단 기준이 됩니다 언더 샘플링데이.. 2024. 7. 26. 이전 1 다음