탐색은 가보지 않은 길을 가는 것이고
활용은 알고있는 확실한 길을 가는 것이다.
탐색은 그냥 재미있기 위해서 하는게 아니라, 지금 내가 알고 있는 길에 대한 의심이 있기에 하는 행동이다.
그 의심이란 단순히 믿지 못하는 것이 아니라 오히려 내가 알고 있는 길을 더 확신하기 위해서이기도 하다.
ε-greedy 알고리즘은 ε% 만큼은 빼고 모두 탐욕적으로 이미 알고있는 보상이 큰 쪽을 택하겠다는 행동선택 정책이다.
탐욕스러운 활용적 선택만을 고집했을 땐 탐색으로 인한 새로운 발견은 거의 하지 못하게 된다.
환경에 따라 그것을 조절하는 것이 필요하다.
'소프트웨어 > AI' 카테고리의 다른 글
[ai] 뇌는 미래를 예측하기 위해 만들어진 부품 (0) | 2022.07.03 |
---|---|
[AI] 알고리즘을 공부하지 않을 수 있는 알고리즘 (0) | 2022.06.26 |
[AI] 경험 리플레이 ( experience replay ) (0) | 2022.06.05 |
[AI] 마음챙김과 경사 하강법 (0) | 2022.06.04 |
[AI] 기본적인 신경망 이해 (0) | 2022.06.04 |