Convergence of Monte Carlo Exploring Starts with TD-Learning
[42] Che Wang, Shuhan Yuan, Kai Shao, and Keith W. Ross. On the conver- gence of the monte carlo exploring starts algorithm for reinforcement learning. In ...
???????????????????????(??)1990 (?? 2)? 11????????????????? 2010(?. ? 20)? 11?? 20?????????????????????. ? ? - ?????????????????????. ????. ???????????????????55????. ?????????????????????????. ?????? ... ????????? - ??????????(1?23???)?????????? (http://www.hepco.co.jp/) ???????????? ????????????????????. 5?15??260? - Game Machine?? ?????;? il'i?. ?. ??. ??. ?. ?. ??. ??. ???[?. ?. ? 7??. ????. ??. ??? ! ? ?1'n? q?F?? ?. ?. ???. ?????????????????. ??????????????. ??????????????? ????. ????~??????. ????. 3????. ????? ... ?????????????????????(2)??????? 9?11??????????????????????????????????. ????????12? 1??????????????????? 4? l ... 91 7.8 ?? 7.8.1 ??? ?????????????????????????????????????????????????????????. ????????????? Figure 7.8.2-1 ?2010?8?15? ... ?????????... ??????. 59,337. ???. ? ? ? ? ? ? ? ? ? ? ?. ???????????. 24,414. ???. ? ? ? ? ? ? ? ? ?. ????????????. 83,601. ??24?2?17? ?? - ???????????????. X-T#. ??1?13?? ? ???????. ???????1? ... 2???????????????????24?10?1??????? ... ???????????????? ??????? - ?????? ?????????????????????. ? ????????????????????????????????????????????. ? ??????? ... ???? ????????????? ????????????????????????????????????????????????. ????????????????? Page 63. 2-36. (4) ?? ... ? ? ? ? ? ? ? ) - ????l ???????????24??4?7?l?????????????. ????????24??4?8?l?????????????27??30.
Autres Cours: