원본 논문: https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
- 강화학습을 DNN에 적용한 최초의 논문
강화학습이란 ?
- 현재 머신러닝은 크게 3가지로 분류된다.
- 비지도 학습(Unsupervised learning)
- 지도 학습(Supervised learning)
- 강화 학습(Reinforcement learning)
강화학습도 비지도학습의 일부가 아니냐는 주변분들의 의견이 있긴하지만
크게 3가지로 나누는 것에 이견은 없는 것으로 보인다.
- 강화학습은 쉽게 표현하면 연속적인 결정 을 내리는 과정이라고 볼 수 있다. 그리고 그 결정은 순수하게 보상이라는 것에 의해 결정된다.
- 강화학습에는 행동의 주체 에이전트(agent), 행동(action), 보상(reward), 환경(environment) 가 존재한다.
- 정책(policy), 가치함수(value function) 등 더 세부적인 내용이 있지만 결국 설계자가 지정한 보상을 최대로 하는 행동을 알아내고 수행하는 것이 강화학습의 작동원리이다.
- 정책(policy), 가치함수(value function) 등 더 세부적인 내용이 있지만 결국 설계자가 지정한 보상을 최대로 하는 행동을 알아내고 수행하는 것이 강화학습의 작동원리이다.
What is reinforcement learning? The complete guide - deepsense.ai
Although machine learning is seen as a monolith, this cutting-edge technology is diversified, with various sub-types including machine learning, deep learning, and the state-of-the-art technology of deep reinforcement learning.
deepsense.ai