2017-10-16 20:16 已编辑帝都小航算法工程师

关注

DQN的计算问题

求问大家为什么dqn的计算要用下一步的q value的max值呢，用mean不可以么

全部评论

推荐最新楼层

哈尔滨工业大学算法工程师

最优贝尔曼方程

点赞回复分享

发布于 2017-10-16 22:55

中国科学院算法工程师

因为更新往reward最大的action走

点赞回复分享

发布于 2017-10-16 20:48

北京大学算法工程师

q learning是off policy的，它每次实验选择下一个a是由behavior policy决定的。这里的behavior policy采用了选择q最大的a。如果是sarsa这种on policy的，它会按照之前学习的target policy去选a，一般是epsilon-greedy。以上是我个人的理解。

点赞回复分享

发布于 2017-10-17 08:55

今天 00:49

已编辑

门头沟学院 Java

211硕士花30万进烟草局划算吗

牛客解忧铺

点赞评论收藏

分享

03-16 17:16

蚂蚁集团_后端开发

蚂蚁实习内推—蚂蚁内推码

第一天来到工位的时候闹了个笑话，入职当天每个人工位上都有个新橙子，只有我的已经发霉好多天了，一开始还以为是什么新奇的抹茶橘子，我说大厂就是不一样进入大楼可以看到装修很新很华丽，当然每层也有贴心的空气检验合格报告工位很舒适，入职时配备了一台MacBook Air M3以及一台27寸2K显示器楼内有健身房、篮球场、食堂，还有不定期的小游戏小抽奖。（只是食堂有点小价格有点高东西有点少三天就吃腻了，还好有餐补让人好受些蚂蚁是有点强度的，但是能给的待遇感觉基本拉满了，各种细节，在里面上班会有一种你只要专心做好自己的工作，其他的都不用操心 ，看明年我会给大家分享啥，希望明年还能给大家继续分享...

蚂蚁集团公司福利 109人发布

点赞评论收藏

分享

01-30 14:23

浙江工业大学 Java

求内推 没工作了我😭

神哥了不得：你简历字体有点不太协调呀，下面的字实在太小了呀，而且项目也不太行，建议换几个高质量的项目，面试会多很多

点赞评论收藏

分享

02-14 15:34

门头沟学院 Java

26届双非Java无实习求锐评简历

找实习找崩溃了，已读不回或者简历没过初筛

Java抽象带篮子：专业技能怎么写可以看看我发的帖子

点赞评论收藏

分享

03-15 14:48

已编辑

南京大学 Java

感觉这次的难度明显亲和的很多（但并不妨碍我a不出第三题orz）第一题本来打算用栈处理多个'Z'连续撤销的情况，后来一看题目中说'R'和'Z'都只会出现一次，所以直接模拟即可。 public class Main { public static void main(String[] args) { Scanner in = new Scanner(System.in); int n = in.nextInt(); in.nextLine(); for (int i = 0; i < n; i++) { ...

dapan74：上午美团嘻嘻哈哈，下午淘天原地爆炸。这电话面完也不用等结果了，彻底凉凉

投递美团等公司10个岗位 > 软件开发笔面经技术岗笔试题求解

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 字节求职进展汇总 #

679704次浏览 6828人参与

# 读研or工作，哪个性价比更高？ #

32001次浏览 433人参与

# 携程求职进展汇总 #

188474次浏览 1349人参与

# 牛友故事会 #

192869次浏览 3689人参与

# 讲讲我的真实离职原因 #

27930次浏览 238人参与

# 传音控股求职进展汇总 #

8920次浏览 73人参与

# 元戎现在香不香 #

70682次浏览 614人参与

# 歌尔求职进展汇总 #

48316次浏览 322人参与

# 烟草笔面经互助 #

12056次浏览 165人参与

# 德州仪器求职进展汇总 #

1999次浏览 38人参与

# 你上一次加班是什么时候？ #

40951次浏览 295人参与

# 入职以后才知道的校招谎言 #

68531次浏览 442人参与

# 90后北漂现状 #

20558次浏览 186人参与

# 安克创新求职进展汇总 #

20907次浏览 221人参与

# 牛友打假中心 #

9033次浏览 426人参与

# 初创公司值得加入吗？ #

15248次浏览 129人参与

# 软开人，秋招你打算投哪些公司呢 #

72501次浏览 804人参与

# 机械只有转码才有出路吗？ #

120781次浏览 1570人参与

# 滴滴求职进展汇总 #

117923次浏览 1025人参与

# OPPO求职进展汇总 #

603857次浏览 4817人参与

# 如果公司给你放一天假，你会怎么度过？ #

11004次浏览 94人参与

# 实习必须要去大厂吗？ #

75687次浏览 1130人参与

牛客网
牛客企业服务