정보관리기술사/AI

서포트 벡터 머신-SVM(Support Vector Machine)

기술기술 2024. 2. 6. 17:30

1. 정의

  • 데이터가 사상 된 공간에서 여백(Margin)을 최대화하고 일반화 능력을 극대화하여 결정 직선을 찾는 두 범주를 갖는 객체들을 분류(이진 분류, Binary classification) 하는 알고리즘
  • 데이터 사상공간 경계선과 최근접 데이터(Support Vector) 최대거리 경계 식별 알고리즘(MMH :Miximum Margin Hyperplane, 초평면)
  • 활용 : 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석 비확률적 이진 선형 분류 모델 생성, 지지도 이용, 벡터 이용, 기계학습

 

2. 구성도 및 구성요소

가. 구성도 

 

나. 구성요소  -   서마초커

- 주어진 많은 데이터들을 가능한 멀리 두 개의 집단으로 분리시키는 최적의 초평면(hyperplane)을 Training data에서 두 클래스의 어떤 Point로부터도 최대한 멀리 떨어져 있는 Decision boundary 확보

- 서포트 벡터 머신(Support Vector Machine)은 마진(margin)의 허용 정도에 따라 소프트 마진 SVM(Soft 
Margin SVM)과 하드 마진 SVM(Hard Margin SVM)으로 분류

 

3. 선형 서포트 벡터 머신의 마진(Margin) 분류 방법  -  하소

가. 하드 마진(예외X)

  • 최대 마진(maximum margin)안에 어떠한 데이터 혹은 아웃 라이어(outlier)를 허용하지 않는 서포트 벡터 머신(SVM) 기법

- 개별적인 학습 데이터를 모두 정확하게 분류하려고 할 경우 마진(margin)이 급격하게 작아지고 오버피팅
(Overfitting)이 발생하며 이를 보완하는 기법으로 소프트 마진(Soft Margin)이 존재

나. 소프트 마진(예외허용)

  • 최대 마진(maximum margin)안에 이상치(outlier)를 허용하도록 분류하는 서포트 벡터 머신(SVM) 기법