forward 관점과 backward 관점을 수식을 풀어 같음을 증명한다.

아래 수식을 증명하여 같음을 보인다.

식 7.8

여기서 ,

  • -return alogrithm 의 TD-error 이다.
  • 즉 forward 관점이다.

그리고,

  • TD() 의 TD-error
  • 즉 backward 관점이다.

그리고,

  • 이면 1, 아니면 0 을 리턴하는 함수
  • identity indicator function

results matching ""

    No results matching ""