정보관리기술사/DB 데이터분석

랜덤 포레스트 (Random Forest)

기술기술 2024. 1. 11. 17:22

1. 정의

  • 배깅(bagging)보다 더 많은 임의성을 주어 학습기들을 생성한 후 이를 선형 결합하여 최종 학습기를 만드는 방법
  • 목적 : 오버피팅 방지
  • [사용기법] 앙상블 학습, 베깅

 

2. 개념도 및 절차

가. 개념도

- 배깅(Bagging) + 서브넷(Subset)의 특징을 Tree에 반영한 분석기법.

- 임의의 트리를 생성하고, 각각 개별적으로 학습시킨 트리가 생성됨

나. 절차

  1. 데이터 집합 생성(부트스트랩, T개 훈련데이터 집합)
  2. 훈련(T개 기초분류기)
  3. 결합(분류기 결합)
  4. 단일 모델을 결합하여 배깅 모델 생성