想回老家的潜伏者躺平又起来了

2019-07-26 23:46 已编辑浙江大学算法工程师

关注

《强化学习》 DP动态规划

奖赏设计

累计奖赏和折扣累计奖赏

数学上看，折扣奖赏机制可以将累计回报转化为递推的形式：

\begin{matrix} G_{t} & = R_{t} + γ (R_{t + 1} + γ R_{t + 2} + . . .) \\ = R_{t} + γ G_{t + 1} \end{matrix}

折扣是一种固定效应模型

奖赏设计：不要平移，奖励做什么而不是怎么做

奖赏设计：缩放，塑形

贝尔曼等式

状态值函数

值函数的贝尔曼期望等式

动作值函数

两者关系

动作值函数的贝尔曼期望等式

衡量策略优劣

贝尔曼最优等式

广义策略迭代GPI

策略评估

策略改进

GPI

策略迭代

值迭代

对比

全部评论

推荐最新楼层

11-28 18:05

杭州电子科技大学 Java

经常一起加班也会产生“吊桥效应”

我发现那些和我一起经常加班、通宵赶deadline的小组同事，相比于到点就下班的同事关系来说，我们的团队感会更强，甚至某些人之间还会有些暧昧，而且在离职之后我们之间的关系也会保存的更久一些，就像那种共患难过的战友般的情谊。 但是…这种“共患难”没必要，我宁愿孤独… …

点赞评论收藏

分享

11-27 00:00

南方科技大学整车软件集成工程师

我才知道秋招不值得焦虑

昨天我经历了美团面试官的“拷打”，整整50分钟后被秒挂。面试中我问到校招生能提供什么价值，面试官直言不讳地说，校招生的价值不大，主要是用来培养的。虽然这话听着有点扎心，但他笑着说的，让我反而松了口气。实习经历再多，如果不思考也没用，毕竟公司并不期待我们一进门就能立刻上手。求职其实是双向选择，挂了也没什么，说明我们不合适。所以我觉得也没必要焦虑了，你们觉得呢？

牛客创作赏金赛

点赞评论收藏

分享

10-14 13:25

已编辑

门头沟学院 C++

双飞硕简历修改求指导

MD没offer想跳楼了

点赞评论收藏

分享

11-23 12:11

小红书_社区技术部_前端开发(实习员工)

8.23校招网易雷火一面

这一次面试是第一次参加秋招，感觉和实习面的感受大有不同，给我问懵逼了，然后当时面试环境也有点窘迫，起了个大早找了个窄窄的电话间，很多比较细的基础题我都回答不清楚，浪费了学长给我的特别内推机会，感觉很内疚，没表现好，但是因此重新去巩固了一遍基础知识。其实现在看来问的确实不难啊啊啊，校招生能问多难呢，没把握住机会，很可惜！！。更完这一篇先休息一下！下午再更1.自我介绍直接开始问八股2.html有head标签，head里有meta标签，meta标签里有些什么常用的属性，分别有什么作用3.dom元素的事件传递过程？用什么来阻止事件冒泡4.说说css表现的优先级5.css动画animation常用属性6...

查看24道真题和解析面经烤面筋

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 拼多多求职进展汇总 #

234546次浏览 2033人参与

# ai智能作图 #

23227次浏览 273人参与

# 北方华创开奖 #

66296次浏览 549人参与

# 25届秋招总结 #

400744次浏览 4018人参与

# 实习，投递多份简历没人回复怎么办 #

2437158次浏览 34713人参与

# 地方国企笔面经互助 #

6666次浏览 16人参与

# 阿里云管培生offer #

60221次浏览 1755人参与

# 机械求职避坑tips #

22704次浏览 242人参与

# 25届机械人为了秋招做了哪些准备？ #

25510次浏览 357人参与

# 我的实习求职记录 #

6125239次浏览 83974人参与

# 歌尔求职进展汇总 #

42812次浏览 294人参与

# 机械人怎么评价今年的华为 #

157357次浏览 1346人参与

# 如果再来一次，你还会选择这个工作吗？ #

112269次浏览 1123人参与

# 软件开发投递记录 #

1479563次浏览 23935人参与

# 硬件兄弟们甩出你的华为奖状 #

78174次浏览 626人参与

# 经纬恒润求职进展汇总 #

99425次浏览 960人参与

# 联想求职进展汇总 #

202853次浏览 1816人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

10102次浏览 217人参与

# 实习与准备秋招该如何平衡 #

723252次浏览 8553人参与

# 如果可以，你希望哪个公司来捞你 #

31850次浏览 188人参与

# 牛客租房专区 #

5215次浏览 134人参与

# 腾讯求职进展汇总 #

207906次浏览 1695人参与

牛客网
牛客企业服务