전체 글 228

강화학습

1. 정의 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화 하는 행동 혹은 행동 순서를 선택하는 방법 목적 ) 강화학습의 목적은 에이전트를 보상이 가장 높은 행위로 이끄는 것이다 특징 ) 보상함수, 평가지표 적용 2. 개념도 및 구성요소 가. 개념도 - 에행환리상 나. 구성요소 3. 강화학습 종류 - 브몬마 큐다디 Brute force(모든 경우의 수 계산) Monte Carlo methods(샘플 평균, 결정값 Gt) MDP(Markov Decision Processes)-( Agent, Enviroment, Markov property) Q-Learning Dynamic Programming(동적 계획법) DQN

가상 메모리

1. 정의 물리적 주기억장치의 한계를 극복하기 위해 프로그램의 일부를 보조기억장치에 저장하고, 필요시에 할당, 배치, 인출, 교체하는 메모리 관리 기술 주기억장치 안의 프로그램 양이 많아질 때, 사용하지 않는 프로그램을 보조기억장치 안의 특별한 영역 으로 옮겨서, 그 보조기억장치 부분을 주기억장치처럼 사용할 수 있는데, 이때 사용하는 보조기억장치 의 일부분을 가상기억장치라고 함. Ex) 디스크 일부분 2. 개념도 3. 관리기법 - 할배인교 - 할당 정책 Page 교체 방법 - 페세 Paging 기법(고정분할) : 메모리(보조기억장치)를 고정된 작은 크기의 페이지(프레임) 단위로 미리 나누는 방식 외부 단편화 해결 가능, 내부 단편화 발생 PMT(Page Map Table)이 필요 Segmentation(..