데이터분석/통계

편향(bias)과 분산(variance)

씩씩한 IT블로그 2020. 12. 18. 16:34
반응형

1. 정의

(1) 편향(bias) : 예측값과 실제값의 거리

- 편향이 작을 때 : 데이터를 최대치로 학습함을 의미(과대적합)

- 편향이 클 때 : 데이터를 최소치로 학습함을 의미(최소적합)

 

(2) 분산 : 학습한 모델의 예측값이 평균으로 부터 퍼진 정도

 

2. 편향과 분산과의 관계

(1) 모델의 복잡도가 낮으면? bias는 증가하고 variance가 감소 (ols회귀분석)

(2) 모델의 복잡도가 높으면? bias는 감소하고 variance가 증가 (딥러닝)

=> bias와 variance가 최소화 되는 수준에서 모델의 복잡도 선택

 

*출처 : 패스트캠퍼스 "파이썬을 활용한 시계열 데이터분석 A-Z"

반응형