聯合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優于DDPG算法。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 欧美一区二区三区高清不卡tv | 成人免费男女视频网站慢动作 | 1024手机在线观看 | 国产成人啪精品视频免费网站软件 | 亚洲成人91 | 乡村乱肉情欲小说 | 亚洲精品高清国产麻豆专区 | 国内不卡一二三四区 | 亚洲不卡一区二区三区 | 狠狠狠狠狠狠狠狠 | 国产综合成色在线视频 | 亚洲欧美高清在线 | 欧美日韩一日韩一线不卡 | 最新欧美一级视频 | 国产成人影院 | 亚洲天堂成人在线 | 国产精品人人爽人人做 | 成人av手机在线观看 | 小明日韩在线看看永久区域 | 免费观看黄色毛片 | 激情综合五月 | 99久久999久久久综合精品涩 | 香蕉视频在线观看网站 | 成人国产精品久久久免费 | 寡妇一级a毛片免费播放 | 男女一进一出无遮挡黄 | 在线欧美视频免费观看国产 | 亚洲成a人在线播放www | 伊人婷婷色香五月综合缴激情 | 国产精品免费视频一区一 | 亚洲第一视频在线播放 | 午夜一区二区三区 | 国产三级精品三级在专区中文 | 国产欧美激情一区二区三区-老狼 | 成人在线不卡视频 | 成人性欧美丨区二区三区 | 中文字幕国产亚洲 | 日本高清视频色wwwwww色 | 亚洲激情专区 | aaaaaa毛片免费看 | 青草热久精品视频在线观看 |