원본 논문: https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

  • 강화학습을 DNN에 적용한 최초의 논문

강화학습이란 ?

  • 현재 머신러닝은 크게 3가지로 분류된다.
    1. 비지도 학습(Unsupervised learning)
    2. 지도 학습(Supervised learning)
    3. 강화 학습(Reinforcement learning)
강화학습도 비지도학습의 일부가 아니냐는 주변분들의 의견이 있긴하지만 
크게 3가지로 나누는 것에 이견은 없는 것으로 보인다.
  • 강화학습은 쉽게 표현하면 연속적인 결정 을 내리는 과정이라고 볼 수 있다. 그리고 그 결정은 순수하게 보상이라는 것에 의해 결정된다.
  • 강화학습에는 행동의 주체 에이전트(agent), 행동(action), 보상(reward), 환경(environment) 가 존재한다.
  • 정책(policy), 가치함수(value function) 등 더 세부적인 내용이 있지만 결국 설계자가 지정한 보상을 최대로 하는 행동을 알아내고 수행하는 것이 강화학습의 작동원리이다.

  • 정책(policy), 가치함수(value function) 등 더 세부적인 내용이 있지만 결국 설계자가 지정한 보상을 최대로 하는 행동을 알아내고 수행하는 것이 강화학습의 작동원리이다.
 

What is reinforcement learning? The complete guide - deepsense.ai

Although machine learning is seen as a monolith, this cutting-edge technology is diversified, with various sub-types including machine learning, deep learning, and the state-of-the-art technology of deep reinforcement learning.

deepsense.ai

 

+ Recent posts