정책과 계획 모두 일방향적인 어떤 선택을 말한다.
둘다 정해져있다.
정책의 특징은 어떤 곳에서든 동일하게 작동한다는 것이다.
계획은 특정한 시점이나 환경이 갖춰져야만 실행이 되기에 계획 자체가 실패할 수 있다.
하지만 정책은 실행 불가능 할 수 없다. 무조건 적용된다.
그 적용에 의해 결과적으로 게임에서 실패할 수 있지만, 어쨌든 무조건 실행된다.
아무것도 안하는 것보다 실패할 때가 나을 때가 있다. 아니 많다.
그렇기에 정책이 우선시되고 언제든 실패하고 틀어질 수 있는 계획은 부차적으로 따라와야만 하는 것이다.
또한 정책은 최악의 상황까지 포함한 즉 전체상을 보고 정한 방향이다.
계획은 잘 될거라고만 생각했을 때 정한 방향인 것과 다르다.
전체상을 봤기 때문에 어떤 시점에서도 적용할 수 있는 방향이다.
'소프트웨어 > AI' 카테고리의 다른 글
[AI] Temporal Difference ( 일시적 차이 ) (0) | 2022.06.04 |
---|---|
[AI] Q 러닝 이해 (0) | 2022.06.03 |
[AI] 인공지능이 인간보다 나은 이유 (0) | 2022.06.02 |
[AI] 불확실함을 다른말로 게임이라고 한다 (0) | 2022.06.02 |
활성화 함수가 필요한 이유? (0) | 2022.04.06 |