상세 컨텐츠

본문 제목

[머신러닝]SVM(Support Vector Machine)

coding/머신러닝

by golduny_zoo 2021. 6. 7. 14:17

본문

728x90

SVM은 돌연변이 구분을 특이한 것들까지 잘 분류하는 문제에는 최고이다!
(딥러닝이 나오기 전까지..)

 

이 그래프를 구분하는 선을 결정할 때  수만가지의 방식이 나올 것이다. 

SVM은 분류선에 가장 가까운 데이터들의 가장 큰 마진을 결정하는 분류선을 결정한다. 
분류선을 Maximum Margin Classifer 라고 한다.

실생활에서 사과와 오랜지를 비교하는 예를 들자면

무엇이 사과 이고 무엇이 오랜지인지 너무나 명확하다.

일반적인 사과와 오랜지는 분류선에서 먼 곳에 데이터로 잡혀 분류가 쉽다. 

하지만 이 과일들은 너무 헷깔리게 생겼다. 

이렇게 일반적이지 않은 데이터들은 분류선과 가장 가까이 붙어 있거나 멀리 떨어져 있지만,
다행이 레이블화 되어 있어 이들을 기준으로  마진을 극대화하여 분류선을 잡아 내어 
특이한 것들을 잘 잡아낼 수 있는 러닝머신이 될 수 있다. 

만약 이런식으로 포함 되어 있을 경우 데이터가 직선으로 나눠지지 않을 경우 
차원을 만들거나, 통과선을 곡선으로 만들어 처리한다.

관련글 더보기