q learning是off policy的，它每次实验选择下一个a是由beha_牛客网

2017-10-17 08:55 北京大学算法工程师

关注

q learning是off policy的，它每次实验选择下一个a是由behavior policy决定的。这里的behavior policy采用了选择q最大的a。如果是sarsa这种on policy的，它会按照之前学习的target policy去选a，一般是epsilon-greedy。以上是我个人的理解。

点赞评论

昨天 22:19

已编辑

门头沟学院 Java

暑期实习投递记录

记录一下这次暑期实习流程字节：集团信息系统：2.20投递 2.24一面 2.26二面（挂）飞书：3.20待一面腾讯：IEG-游戏国际发行：2.24一面 2.25二面（排序挂）CDG-金融科技：3.4一面（挂）CSIG-腾讯云：3.7一面 3.8二面（挂）TEG-计费平台部：3.11一面（挂，纯纯KPI，开局三道算法题，全A出来，八股实习答得也没觉得有问题，面完刷新秒挂）IEG-游戏前沿技术：3.13一面（挂，开局问我只会Java吗，我说是，看到他失落的眼神就知道已经挂了）腾讯音乐：2.26投递 2.28一面（挂，面这么多次遇到最sb的面试官）阿里云：2.27投递 ...

投递快手等公司10个岗位 >

点赞评论收藏

分享

03-17 10:55

已编辑

浙江大学嵌入式工程师

浙大老学姐的省钱小妙招——千万千万千万不要在杭州理发！

为什么不要在杭州理发呢，因为会把你坑到找不到北！在浙江生活的人可能都听过这句话——“宁波海鲜，杭州理发”指的就是坑你没商量的乱象。于是贫穷的老学姐在杭州读书的这几年，小心翼翼的谨遵这项原则，省钱方式都是在杭州简单剪剪发，做什么烫染造型都等到回老家。但是最近不是临近毕业，又燃起了熊熊的美丽之心，犹豫再三还是选择了一家杭州商城理发连锁大店进行染发操作。机智的学姐没有被美丽冲昏头脑，染发之前详细问了前台如果染发，想办七折优惠卡的充值要求，回答说是最低要求充1000（记住这个重点），想想杭州一次染发估计就得七八百，充1000再剩几百块钱也没事，留着剪头发，老学姐就快快乐乐心安理得地去挑选发色了...

牛客激励计划我的省钱小妙招

点赞评论收藏

分享

02-22 20:12

门头沟学院 Java

全宇宙最好的Java简历来了

假的，呜呜呜呜呜，求求各位爹，帮我看看简历。秋招没找到好工作，春招找不到我都不想活了。#你的简历改到第几版了# #机械人晒出你的简历# #你的秋招简历被谁挂了？# #投了多少份简历才上岸# #简历中的项目经历要怎么写# #你已经投递多少份简历了# #简历被挂麻了，求建议#

你见过凌晨四点的牛客吗_BY_KobeBryant：和我开两把原神先😋

你的简历改到第几版了机械人晒出你的简历

点赞评论收藏

分享

昨天 16:13

中南大学 Java

谁这么坏在唱衰java啊？

前有自媒体不顾事实唱衰java，后有黑马培训出来月薪4w,市场一片欣欣向荣是谁这么坏在唱衰java呢？都给我学java狠赚笔！月入过w都是谦虚了----------------------------------------------------------想要学习Java冲实习或冲春招的，我能助你一臂之力，我之前整理了高质量可速成的魔改外卖项目话术和7000字轮子项目话术，还有超全超精品八股大全专栏，怎么写简历，怎么包装实习经历，怎么0基础速成冲春招和实习等等等等精品帖子，大家可以去看看我的精品文章汇总帖子：https://www.nowcoder.com/discuss/7217...

牛客创作赏金赛

点赞评论收藏

分享

牛客热帖

更多

正在热议

更多

# 字节求职进展汇总 #

679938次浏览 6855人参与

# 读研or工作，哪个性价比更高？ #

32121次浏览 446人参与

# 元戎现在香不香 #

70734次浏览 645人参与

# 牛友故事会 #

193088次浏览 3774人参与

# 讲讲我的真实离职原因 #

27968次浏览 252人参与

# 传音控股求职进展汇总 #

8932次浏览 77人参与

# 携程求职进展汇总 #

188546次浏览 1377人参与

# 歌尔求职进展汇总 #

48325次浏览 322人参与

# 烟草笔面经互助 #

12057次浏览 165人参与

# 德州仪器求职进展汇总 #

2006次浏览 45人参与

# 你上一次加班是什么时候？ #

40959次浏览 295人参与

# 入职以后才知道的校招谎言 #

68541次浏览 450人参与

# 90后北漂现状 #

20567次浏览 186人参与

# 安克创新求职进展汇总 #

20910次浏览 229人参与

# 牛友打假中心 #

9076次浏览 509人参与

# 初创公司值得加入吗？ #

15252次浏览 129人参与

# 软开人，秋招你打算投哪些公司呢 #

72507次浏览 804人参与

# 机械只有转码才有出路吗？ #

120782次浏览 1570人参与

# 滴滴求职进展汇总 #

117943次浏览 1025人参与

# OPPO求职进展汇总 #

603899次浏览 4821人参与

# 如果公司给你放一天假，你会怎么度过？ #

11019次浏览 94人参与

# 实习必须要去大厂吗？ #

75699次浏览 1130人参与

牛客网
牛客企业服务