想回老家的潜伏者躺平又起来了

2019-07-26 23:48 已编辑字节跳动_算法工程师

关注

《强化学习》模型无关方法

模型无关学习

Monte-Carlo & Temporal Difference; Q-learning

探索与利用

on-policy 和 off-policy

SARSA

Expected value SARSA

SARSA和Q-Learning对比

on-policy和off-policy对比

on-policy	off-policy
Agent 可以选择动作	Agent 不能选择动作
Most obvious setup	Learning with exploration,playing without exploration
Agent always follows his own policy	Learning from expert(expert is imperfect)
Learning from sessions(recorded data)
can’t learn from off-policy	can learn from on-policy
SARSA	Q-learning
more…	Expected Value SARSA

经验回放

略

全部评论

推荐最新楼层

02-14 15:19

OPPO_JAVA(准入职员工)

OPPO内推OPPO面经

OPPO 测开面经昨天在等某小厂面试时候，突然接到oppo电话，聊了两句直接就开始问八股了，可能要人要的比较急，没有通过hr约时间。询问内容主要是java的八股，记录如下：1、接口和抽象类的概念，定义以及区别。2、synchronized关键字，能够修饰什么，修饰方式的作用3、什么是单例模式，回答中有提到会减少性能消耗，有揪着这个点继续问，为什么会性能更好，这个是主要目的吗？不同的单例模式实现方法之间的性能差别（没回答出来）4、Stringbuilder和Stringbuffer之间的区别，为什么一个线程安全一个不安全5、volatile关键字6、原子操作7、Java 的反射机制8、sql t...

点赞评论收藏

分享

02-18 22:36

四川大学 Java

【2.18更新】25届春招汇总

最近神哥贴子的流量好差，希望大家多多送花点赞收藏转发关注~一键五连🤣来源：牛客网神哥也整理了2个表格(均为每日更新)，一个是实习校招汇总表，公司包含部门推荐和避雷，不能直接公开放出，可以一起交流，free获取；另一个是全行业知名企业名单汇总，大家可随意转发，点此跳转链接精选★ 所有文章汇总：神哥所有文章汇总😍神品八股、项目推荐、投递表、经验分享、学习路线等★ 拒绝“假高频”，专治背八股时间紧、说不出、容易忘：神品八股专栏简介★ 高质量项目测评：25届秋招总结&经验分享★ 春招投递表：25届春招汇总★ 实习投递表：25&26届实习汇总(包括日常和暑期)春招已开219家山西省事...

投递中国银行等公司10个岗位 >

点赞评论收藏

分享

02-16 16:40

电子科技大学 C++

26届，准备找实习中……

目前还在打磨简历，第一次找实习，感觉要准备的东西太多了，抓不住重点，大佬能给点建议嘛。

点赞评论收藏

分享

01-27 00:39

山东管理学院嵌入式软件开发

给孩子点建议，有条路可以走吧！

沟头学院：无关比赛不要写，这样会显着你主次不分，比赛不要撒谎，有哪些就写那些，创新创业建议删除。技能特长可以适当夸大。

点赞评论收藏

分享

昨天 15:06

牛客_技术部_大数据工程师

春暖花开，万物复苏，又到了动物们交

流春招经验的时候了。 春招固然重要，可生活不止眼前的苟且， 毕竟 “若无樱花常开，人间春色不再”。不如周末约上三五好友，访花、举杯、吟诗，感悟自然与人生，说不定能有别样的收获。 北京赏花攻略->如果你也在北京，那么这份赏花攻略一定要收藏好。图源 微博 首都园林绿化

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试被问“你的缺点是什么?”怎么答 #

5998次浏览 95人参与

# 租房找室友 #

7941次浏览 53人参与

# 水滴春招 #

15542次浏览 190人参与

# 读研or工作，哪个性价比更高？ #

26102次浏览 356人参与

# 文科生还参加今年的春招吗 #

4072次浏览 31人参与

# 职场新人生存指南 #

199060次浏览 5504人参与

# 简历无回复，你会继续海投还是优化再投？ #

48570次浏览 560人参与

# 如果重来一次你还会读研吗 #

155692次浏览 1705人参与

# 机械人选offer，最看重什么？ #

69068次浏览 449人参与

# 听劝，这个简历怎么改 #

14024次浏览 180人参与

# 参加完秋招的机械人，还参加春招吗？ #

26835次浏览 276人参与

# 选择和努力，哪个更重要？ #

44188次浏览 492人参与

# 入职第四天，心情怎么样 #

11169次浏览 62人参与

# 如果再来一次，你还会学硬件吗 #

103614次浏览 1245人参与

# 22届毕业，是读研还是拿外包offer先苟着 #

4650次浏览 27人参与

# 招聘要求与实际实习内容不符怎么办 #

46470次浏览 493人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

20503次浏览 412人参与

# 软开人，你觉得应届生多少薪资才算合理？ #

81363次浏览 496人参与

# 你们的毕业论文什么进度了 #

900974次浏览 8956人参与

# 长光卫星求职进展汇总 #

27821次浏览 186人参与

# 互联网行业现在还值得去吗 #

2365次浏览 22人参与

牛客网
牛客企业服务