강화학습

정보관리기술사/AI

강화학습

기술기술 2024. 1. 9. 16:54

1. 정의

어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화
하는 행동 혹은 행동 순서를 선택하는 방법
목적 ) 강화학습의 목적은 에이전트를 보상이 가장 높은 행위로 이끄는 것이다
특징 ) 보상함수, 평가지표 적용

2. 개념도 및 구성요소

가. 개념도 - 에행환리상

나. 구성요소

3. 강화학습 종류 - 브몬마 큐다디

Brute force(모든 경우의 수 계산)
Monte Carlo methods(샘플 평균, 결정값 Gt)
MDP(Markov Decision Processes)-( Agent, Enviroment, Markov property)
Q-Learning
Dynamic Programming(동적 계획법)
DQN

'정보관리기술사 > AI' 카테고리의 다른 글

머신러닝 파이프라인 (0)	2024.01.22
자기지도학습 (0)	2024.01.16
비지도학습(무감독학습) (0)	2024.01.09
지도학습(감독학습) (0)	2024.01.09
기계학습(Machine Learning) (0)	2024.01.08

현재글강화학습

기술기술

블록체인, ISO 26262, 혼잡제어, csap, 암호화, 지도학습, 인더스트리 4.0, 가상화, 오류제어, 프로젝트 관리, 비지도, agile, SDLC, XaaS, TEST, Cloud, 암호학적 해시함수, UML, SDX, RNN,

Today :
Yesterday :

티스토리툴바