상세 컨텐츠

본문 제목

[머신러닝]Logistic Regression

coding/머신러닝

by golduny_zoo 2021. 5. 17. 12:29

본문

728x90

2가지로 분류하기 Logistic Regression

이메일 클릭을 할 사람과 안할 사람으로 분류하여 그래프로 나타내기

나이에 따라 이메일을 클릭을 한 사람을 1, 안한 사람을 0으로 바꾸고 그래프를 그려 데이터를 나타낼 때 

빨간점인 데이터를 따라 선을 그리면  

요러한 모습을 가지게 되는데

sigmoid함수를 이용하여 그래프를 나타낼 수 있다.

위와 같은 식을 가진 regression 을, Logistic Regression이라 한다.

이제 우리는, 이를 가지고 두개의 클래스로 분류할 수 있다. ( 클릭을 한다, 안한다 두개로.)
확률로 나타낼 수 있게 되었다.( p는 확률값을 나타낸다.)

클릭할 확률
20대는 0.7%
30대는 23%
40대는 85%
50대는 99.4% 

기준점을 두게되면 클릭을 할지 안할지의 두분류로 나눌 수 있다. 

기준점(Threshold) : 0.5

관련글 더보기