Convergence of Monte Carlo Exploring Starts with TD-Learning

[42] Che Wang, Shuhan Yuan, Kai Shao, and Keith W. Ross. On the conver- gence of the monte carlo exploring starts algorithm for reinforcement learning. In ...







???????????????????????(??)
1990 (?? 2)? 11????????????????? 2010(?. ? 20)? 11?? 20?????????????????????.
? ? - ????
?????????????????. ????. ???????????????????55????. ?????????????????????????. ?????? ...
????????? - ?????
?????(1?23???)?????????? (http://www.hepco.co.jp/) ???????????? ????????????????????.
5?15??260? - Game Machine
?? ?????;? il'i?. ?. ??. ??. ?. ?. ??. ??. ???[?. ?. ? 7??. ????. ??. ??? ! ? ?1'n? q?F?? ?. ?. ???.
??????????
???????. ??????????????. ??????????????? ????. ????~??????. ????. 3????. ????? ...
?????????????????????(2)
??????? 9?11??????????????????????????????????. ????????12? 1??????????????????? 4? l ...
91 7.8 ?? 7.8.1 ??? ????????????????
?????????????????????????????????????????. ????????????? Figure 7.8.2-1 ?2010?8?15? ...
?????????
... ??????. 59,337. ???. ? ? ? ? ? ? ? ? ? ? ?. ???????????. 24,414. ???. ? ? ? ? ? ? ? ? ?. ????????????. 83,601.
??24?2?17? ?? - ?????????
??????. X-T#. ??1?13?? ? ???????. ???????1? ... 2???????????????????24?10?1??????? ...
???????????????? ??????? - ?????
? ?????????????????????. ? ????????????????????????????????????????????. ? ??????? ...
???? ????????????? ???????
?????????????????????????????????????????. ????????????????? Page 63. 2-36. (4) ?? ...
? ? ? ? ? ? ? ) - ????
l ???????????24??4?7?l?????????????. ????????24??4?8?l?????????????27??30.