1. 정의
- 데이터가 사상 된 공간에서 여백(Margin)을 최대화하고 일반화 능력을 극대화하여 결정 직선을 찾는 두 범주를 갖는 객체들을 분류(이진 분류, Binary classification) 하는 알고리즘
- 데이터 사상공간 경계선과 최근접 데이터(Support Vector)간 최대거리 경계 식별 알고리즘(MMH :Miximum Margin Hyperplane, 초평면)
- 활용 : 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석 비확률적 이진 선형 분류 모델 생성, 지지도 이용, 벡터 이용, 기계학습
2. 구성도 및 구성요소
가. 구성도
나. 구성요소 - 서마초커
- 주어진 많은 데이터들을 가능한 멀리 두 개의 집단으로 분리시키는 최적의 초평면(hyperplane)을 Training data에서 두 클래스의 어떤 Point로부터도 최대한 멀리 떨어져 있는 Decision boundary 확보
- 서포트 벡터 머신(Support Vector Machine)은 마진(margin)의 허용 정도에 따라 소프트 마진 SVM(Soft
Margin SVM)과 하드 마진 SVM(Hard Margin SVM)으로 분류
3. 선형 서포트 벡터 머신의 마진(Margin) 분류 방법 - 하소
가. 하드 마진(예외X)
- 최대 마진(maximum margin)안에 어떠한 데이터 혹은 아웃 라이어(outlier)를 허용하지 않는 서포트 벡터 머신(SVM) 기법
- 개별적인 학습 데이터를 모두 정확하게 분류하려고 할 경우 마진(margin)이 급격하게 작아지고 오버피팅
(Overfitting)이 발생하며 이를 보완하는 기법으로 소프트 마진(Soft Margin)이 존재
나. 소프트 마진(예외허용)
- 최대 마진(maximum margin)안에 이상치(outlier)를 허용하도록 분류하는 서포트 벡터 머신(SVM) 기법
'정보관리기술사 > AI' 카테고리의 다른 글
데이터 레이블링 (0) | 2024.02.07 |
---|---|
KNN(K-Nearest Neighbor/k-최근접 이웃 알고리즘) (0) | 2024.02.06 |
GRU(Gated Recurrent Unit/게이트 순환 유닛) (0) | 2024.02.06 |
LSTM(Long Short Term Memory) (1) | 2024.02.06 |
RNN(Recurrent Neural Networks/순환 신경망) (0) | 2024.02.06 |