Convergence of Monte Carlo Exploring Starts with TD-Learning
[42] Che Wang, Shuhan Yuan, Kai Shao, and Keith W. Ross. On the conver- gence of the monte carlo exploring starts algorithm for reinforcement learning. In ...    
         
	
 ???????????????????????(??)1990 (?? 2)? 11????????????????? 2010(?. ? 20)? 11?? 20?????????????????????.    ? ? - ?????????????????????. ????. ???????????????????55????. ?????????????????????????. ?????? ...    ????????? - ??????????(1?23???)?????????? (http://www.hepco.co.jp/) ???????????? ????????????????????.    5?15??260? - Game Machine?? ?????;? il'i?. ?. ??. ??. ?. ?. ??. ??. ???[?. ?. ? 7??. ????. ??. ??? ! ? ?1'n? q?F?? ?. ?. ???.    ?????????????????. ??????????????. ??????????????? ????. ????~??????. ????. 3????. ????? ...    ?????????????????????(2)??????? 9?11??????????????????????????????????. ????????12? 1??????????????????? 4? l ...    91 7.8 ?? 7.8.1 ??? ?????????????????????????????????????????????????????????. ????????????? Figure 7.8.2-1 ?2010?8?15? ...    ?????????... ??????. 59,337. ???. ? ? ? ? ? ? ? ? ? ? ?. ???????????. 24,414. ???. ? ? ? ? ? ? ? ? ?. ????????????. 83,601.    ??24?2?17? ?? - ???????????????. X-T#. ??1?13?? ? ???????. ???????1? ... 2???????????????????24?10?1??????? ...    ???????????????? ??????? - ?????? ?????????????????????. ? ????????????????????????????????????????????. ? ??????? ...    ???? ????????????? ????????????????????????????????????????????????. ????????????????? Page 63. 2-36. (4) ?? ...    ? ? ? ? ? ? ? ) - ????l ???????????24??4?7?l?????????????. ????????24??4?8?l?????????????27??30.   
     
    
  
  
       
  Autres Cours: