지도학습 3

KNN(K-Nearest Neighbor/k-최근접 이웃 알고리즘)

1. 정의 신규 데이터(fingerprint)의 군집 할당을 위해 기존 모든 데이터와 신규 데이터 거리를 측정하여 최고 인접 다수결에 의해 군집에 할당하는 감독 학습 알고리즘 2. 특징 및 동작원리 가. 특징 - 최유레단N 최고인접 다수결 : 기존 데이터 중 가장 유사한 k개의 데이터를 측정하여 분류 유사도(거리) 기반 : 유클리디안 거리, 마할라노비스 거리, 코사인 유사도 등 활용 Lazy Learning 기법 : 새로운 입력 값이 들어온 후 분류 시작 데이터 셋을 저장만 하고 일반화된 모델을 능동적으로 만들거나 하지는 않음 데이터가 들어온 후 분류 및 처리한다는 의미 단순 유연성 : 모형이 단순하며 파라미터의 가정이 거의 없음 NN(Nearest Neighbors) 개선 : KNN은 가장 근접한 k개..

서포트 벡터 머신-SVM(Support Vector Machine)

1. 정의 데이터가 사상 된 공간에서 여백(Margin)을 최대화하고 일반화 능력을 극대화하여 결정 직선을 찾는 두 범주를 갖는 객체들을 분류(이진 분류, Binary classification) 하는 알고리즘 데이터 사상공간 경계선과 최근접 데이터(Support Vector)간 최대거리 경계 식별 알고리즘(MMH :Miximum Margin Hyperplane, 초평면) 활용 : 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석 비확률적 이진 선형 분류 모델 생성, 지지도 이용, 벡터 이용, 기계학습 2. 구성도 및 구성요소 가. 구성도 나. 구성요소 - 서마초커 - 주어진 많은 데이터들을 가능한 멀리 두 개의 집단으로 분리시키는 최적의 초평면(hyperplane)을 Train..