歡迎來到 黑吧安全網聚焦網絡安全前沿資訊,精華內容,交流技術心得!

深入淺出強化學習:原理入門 中文pdf完整版[112MB] 含源代碼

  • 軟件大小:0 Bytes
  • 軟件語言:簡體中文
  • 軟件類型:電子書
  • 軟件授權:免費軟件
  • 更新時間:2019-02-25
  • 標簽:
  • 開 發 商:Home Page
  • 應用平臺:XP/Win7/Win8/Win10
軟件評分
網友評分:5

同類人氣軟件

立即下載

深入淺出強化學習:原理入門 中文pdf完整版[112MB] 含源代碼軟件介紹

《深入淺出強化學習:原理入門》用通俗易懂的語言深入淺出地介紹了強化學習的基本原理,覆蓋了傳統的強化學習基本方法和當前炙手可熱的深度強化學習方法。開篇從最基本的馬爾科夫決策過程入手,將強化學習問題納入到嚴謹的數學框架中,接著闡述了解決此類問題最基本的方法——動態規劃方法,并從中總結出解決強化學習問題的基本思路:交互迭代策略評估和策略改善。

基于這個思路,分別介紹了基于值函數的強化學習方法和基于直接策略搜索的強化學習方法。最后介紹了逆向強化學習方法和近年具有代表性、比較前沿的強化學習方法。

除了系統地介紹基本理論,書中還介紹了相應的數學基礎和編程實例。因此,《深入淺出強化學習:原理入門》既適合零基礎的人員入門學習、也適合相關科研人員作為研究參考。

目錄
1 緒論 1
第一篇 強化學習基礎 17
2 馬爾科夫決策過程 18
3 基于模型的動態規劃方法 36
第二篇 基于值函數的強化學習方法 57
4 基于蒙特卡羅的強化學習方法 58
5 基于時間差分的強化學習方法 75
6 基于值函數逼近的強化學習方法 88
第三篇 基于直接策略搜索的強化學習方法 125
7 基于策略梯度的強化學習方法 126
8 基于置信域策略優化的強化學習方法 142
9 基于確定性策略搜索的強化學習方法 165
10 基于引導策略搜索的強化學習方法 171
第四篇 強化學習研究及前沿 185
11 逆向強化學習 186
12 組合策略梯度和值函數方法 202
13 值迭代網絡 207
14 基于模型的強化學習方法:PILCO及其擴展 214
  • 熱門下載
秒速时时彩骗局