아래 분포를 만족하는 직선을 찾아 다른 값을 예측하는 것.
이러한 분포를 만드는 상황은 다양하다.
경력에 따른 연봉, 공부한 시간에 따른 시험점수 등등...
직선을 찾기 위해서는 직선의 방정식을 이용하여, 직선의 기울기와 y절편을 구한다.
여기서 x와 y는 주어졌으므로 b의 값을 찾으면 직선을 그릴 수 있다.
최적의 b의 값을 찾아 가는 과정을 Linear Regression에서 학습이라고 한다.
최적이란? SSE(오차)가 최소가 되게 만드는 것
연봉을 결정하는데 꼭 경험 만 관여를 하는가?
x와 y로 떨어지는 상황은 많지 않다.
연봉을 결정하는데는 나이도 경력도 직책도 많은 것이 관여를 한다.
이럴때 직선의 방정식은?
[머신러닝] Label Encoding / One-Hot Encoding (0) | 2021.05.17 |
---|---|
[머신러닝]Multiple Linear Regression (0) | 2021.05.17 |
[머신러닝] sklearn으로 쉬운 Feature scaling 피처 스케일링 (0) | 2021.05.06 |
[머신러닝]Linear Regression 연봉예측 (0) | 2021.05.06 |
머신러닝 supervised/unsupervised (0) | 2021.05.03 |