2019-09-20 22:49 已编辑天津大学 C++

关注

期望DP

也许更好的阅读体验

文章目录

数学期望
- 符号
- 含义
转移方程
经典例题

数学期望

符号

$E = p * v$ 其中 $E$ 为期望， $v$ 为权值， $p$ 为概率

含义

期望表示多个可能事件的合理分配情况 ~~(本人自己的理解，不喜勿喷)~~
汉语期望意思是指人们对某样东西的提前勾画出的一种标准，达到了这个标准就是达到了期望值(百度百科)
数学期望也可认为是进行某件事能得到的平均结果，或者理想代价
期望值也许和每个得到值都 不相等
举个例子
你去买彩票，每张彩票 $10$ 元，中了奖可以得 $10000$ 元，有 $30 %$ 的概率中奖
我们来算一下买一张彩票的期望利润
首先有 $30 %$ 的概率中奖，根据定义期望得到 $30 % * 10000$ 元
又有 $70 %$ 的概率不中奖，那么我们期望得到 $70 % * 0$ 元
我们每次买一张彩票 $100$ 会花掉 $10$ 元
所以有 $E = 30 % * 10000 + 70 % * 0 - 10 = 290$
我们可认为每买一张彩票赚了 $290$ 元
但是实际上无论怎样，一张彩票都不会赚 $290$ 元的。

转移方程

几种常见设转移方程数组的方法

设 $f [i]$ 表示的是由 $i$ 状态变成最终状态的期望
按照题意直接设
把选择的东西加入数组，如 $f [i] [j]$ 表示第 $i$ 个物品选 $j$ 个的期望或 $f [i] [j]$ 表示有 $i$ 个 $A$ 物品， $j$ 个 $B$ 物品的期望

求转移方程
应优先考虑进行操作后当前状态会怎么样，而不是如何变成当前状态，即先考虑逆向
如果逆向没有思路，则考虑正向

经典例题

注：没有贴出代码，有些题目现在找不到了 ~~(至少博主没有找到)~~，也有博主自己想的题目 ~~(很水)~~，如博主有写代码则已放进标题的链接里，那些链接都是题解，不是原题链接

SP1026FavoriteDice

题目大意

一个 $n$ 面的骰子，求期望掷几次能使得每一面都被掷到

解决方法

设 $f [i]$ 表示已经掷到过 $i$ 面，还期望掷多少次骰子使每一面都被掷到
现在掷一次骰子，有两种情况

有 $\frac{i}{n}$ 的概率掷到已经掷到过的面，此时仍然还要掷 $f [i]$ 次骰子
有 $\frac{n - i}{n}$ 的概率掷到没掷到过的面，此后就掷到过 $i + 1$ 个面了，还需掷 $f [i + 1]$ 次骰子

需要注意的是，无论是掷到以上哪种情况，都需要掷一次骰子
所以有
$f [i] = \frac{i}{n} f [i] + \frac{n - i}{n} f [i + 1] + 1$
将其化简
$f [i] = f [i + 1] + \frac{n}{n - i}$

初值 $f [n] = 0$ ，答案为 $f [0]$
应逆向循环

涂格子/小孩和礼物

题目大意

有 $n$ 个格子，每次等概率随机给一个格子染色，问涂 $m$ 次后期望有多少格子被染色了

解决方法

设 $f [i]$ 表示涂 $i$ 次后期望有多少格子被染色了
现在进行第 $i$ 次染色，仍然有两种情况

有 $\frac{f [i - 1]}{n}$ 的概率涂到已经涂过的格子
有 $\frac{n - f [i - 1]}{n}$ 的概率涂到没涂过的格子

需要注意的是，无论是以上哪种，都已经有 $f [i - 1]$ 个格子被染色了
所以有
$f [i] = \frac{f [i - 1]}{n} \cdot 0 + \frac{n - f [i - 1]}{n} \cdot 1 + f [i - 1]$
将其化简
$f [i] = \frac{n - f [i - 1]}{n} + f [i - 1] = \frac{n - 1}{n} f [i - 1] + 1$
此时该式就是一个等差数列套等比数列
于是我们可以求其通项公式，博主懒得求了写下大致过程

令 $k = \frac{n - 1}{n}$
$f_{n} = k f_{n - 1} + 1$
$f_{n} + \frac{1}{k - 1} = k f_{n - 1} + \frac{k}{k - 1}$
$f_{n} + \frac{1}{k - 1} = k (f_{n - 1} + \frac{1}{k - 1})$
令 $g_{n} = f_{n} + \frac{1}{k - 1}$
则 $g_{n} = k g_{n - 1}$
怎么求 $g_{n}$ 就不用说了吧
$f_{n} = g_{n} - \frac{1}{k - 1}$
$f_{n}$ 也能求出来了

初值 $f [0] = 0 ∣ f [1] = 1$ 答案为 $f [m]$
应正向循环

简单题

题目大意

桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。

解决方法

设 $f [i] [j]$ 表示有 $i$ 张红牌， $j$ 张黑牌的期望收益
考虑翻一张牌，还是有两种情况

有 $\frac{i}{i + j}$ 的概率翻到红牌，此后就只有 $i - 1$ 张红牌， $j$ 张黑牌
有 $\frac{j}{i + j}$ 的概率翻到黑牌，此后就只有 $i$ 张红牌， $j - 1$ 张黑牌

需要注意的是，不要忘了翻开的牌的贡献
翻开一张牌后，该颜色牌数目就少了一张

所以有
$f [i] [j] = \frac{i}{i + j} (f [i - 1] [j] + 1) + \frac{j}{i + j} (f [i] [j - 1] - 1)$
由于是最优策略，所以咱是不可能赔钱的
$f [i] [j] = m a x (0, \frac{i}{i + j} (f [i - 1] [j] + 1) + \frac{j}{i + j} (f [i] [j - 1] - 1))$

初值 $f [0] [1] = 0, f [1] [0] = 1$ ，答案为 $f [R] [B]$
应正向循环

亚瑟王

题目大意

给出 $n$ 个技能，每个技能按输入顺序有 $p [i]$ 的概率释放并造成 $d [i]$ 的伤害。每轮游戏从前往后顺序查看每个技能，若技能发动过则跳过，没发动过则以 $p [i]$ 的技能发动，即每个技能只能发动一次，若将一个技能发动，则进行下一轮游戏，没有成功发动或被跳过就查看下一个技能，一轮游戏可能每个技能都不发动，问 $r$ 轮游戏一共能造成的伤害期望。

解决方法

因为有一个顺序查看的限制，没有后效性的状态是十分不好设的，因为不知道前面有几个技能发动了，若一个技能前面的技能在某轮发动了，则该技能本轮一定不能发动，若前面有些技能发动过，则它们都会被跳过
为了解决这种情况，我们设状态时试着强制限制技能发动（ $n r$ 枚举情况），当然，设的状态仍然要满足所有情况都考虑在内
设 $f [i] [j]$ 表示对前 $i$ 个技能进行了 $j$ 轮游戏发生的概率
若前 $i$ 个技能进行了 $j$ 轮游戏
则有 $j$ 轮不会考虑第 $i + 1$ 个技能
即有 $r - j$ 轮游戏选择了 $i$ 之后的技能
此时考虑第 $i + 1$ 个技能的情况，分为两种

有 $p [i + 1]^{r - j}$ 的概率 $i + 1$ 号技能从未发动
有 $1 - p [i + 1]^{r - j}$ 的概率 $i + 1$ 号技能发动过

需要注意的是，此时已经确定前 $i$ 个技能进行并 只进行 了 $j$ 轮游戏，其概率应该也计算在内
所以有

$f [i + 1] [j] + = 1 - p [i + 1]^{r - j} f [i] [j]$
$f [i + 1] [j + 1] + = (1 - p [i + 1]^{r - j}) f [i] [j]$

$j + 1$ 要小于等于 $r$

初值 $f [0] [0] = 1$ ，答案在中途计算
应正向循环

计算了概率，别忘了求的是期望伤害，在求概率的时候顺便用概率乘以伤害

抽卡

题目大意

$M o r n i n g_G l o r y$ 最近迷上了抽卡，每次抽卡抽到 $6$ 星卡的概率为 $p$ 。抽卡活动进行 $n$ 天，在第 $i$ 天要花 $c [i]$ 游戏币进行抽卡。求 $M o r n i n g_G l o r y$ 抽得 $k$ 张 $6$ 星卡数时的期望游戏币花费。

解决方法

设 $f [i] [j]$ 表示第 $i$ 天抽到 $j$ 张 $6$ 星卡的期望游戏币花费
在第 $i$ 天进行抽卡，有两种情况

有 $p$ 的概率抽到 $6$ 星卡
有 $1 - p$ 的概率没抽到 $6$ 星卡

需要注意的是无论是否翻到，都要花费
所以有
$f [i] [j] = p \cdot f [i - 1] [j - 1] + (1 - p) \cdot f [i - 1] [j] + c [i]$

初值 $f [0] [0] = 1, f [0] [1] = 0$ ，答案为 $f [n] [k]$
应正向循环

收集邮票

[POJ3682]King_Arthur’s_Birthday_Celebration

这两题是一样的类型，只有概率与计算答案要改一下，这里用收集邮票来做例题
题目大意

有 $n$ 种邮票，每天等概率的买一张邮票，第 $i$ 天购买要花费 $i$ 元，求收集 $n$ 种邮票的期望花费

解决方法

先设 $f [i]$ 表示买到 $i$ 种邮票后，离买到 $n$ 种邮票的期望还差天数
和最上面那题一样的处理方法
考虑当前买了 $i$ 张邮票，再买一张邮票，有两种情况

有 $\frac{i}{n}$ 的概率买到重复的邮票，此时仍只买到 $i$ 张邮票
有 $\frac{n - i}{n}$ 的概率买到没买过的邮票，此后就已买到 $i + 1$ 张邮票

需要注意的是，无论哪种情况，都过了一天
所以有
$f [i] = \frac{i}{n} f [i] + \frac{n - i}{n} f [i + 1] + 1$
将其化简
$f [i] = f [i + 1] + \frac{n}{n - i}$

初值 $f [n] = 0$ ，答案为 $f [0]$
应逆向循环

当然这只是期望天数，不是期望花费
设 $g [i]$ 表示拥有(不是买) $i$ 种邮票，买到 $n$ 种邮票的期望花费
考虑当前拥有了 $i$ 张邮票，买一张邮票，有两种情况

有 $\frac{i}{n}$ 的概率买到重复的邮票，此时仍只拥有 $i$ 种
有 $\frac{n - i}{n}$ 的概率买到没买过的邮票，此后就已拥有 $i + 1$ 张邮票

需要注意的是，无论哪种情况，都买了一张邮票
此时我们不知道每张邮票多少钱
但我们知道每张邮票和过了多少天有关
这次的注意写在前面，我们是认为有了 $i$ 张邮票后才开始，所以第一天邮票价格为 $1$ 元
为什么这么设？
我们不知道也不好处理出前面买了多少张邮票，再买到一张邮票要多少钱
但是我们知道第一天肯定是只要 $1$ 元的，答案为 $g [0]$ ，中间的过程不重要，只需推出最终答案
我们借助初始状态的这条非常有用的性质于是就设出了这样的 $g$
这样我们可以知道

若买到重复的邮票，我们知道，因为是设当前是第一天，所以原本希望买到的邮票的天数又往后推了一天，所以总价格要多 $f [i]$ 元，还要加上自己的 $1$ 元
若买到没买过的邮票，同理，因为后面的 $g [i + 1]$ 也是从第 $1$ 天开始考虑的，所以原本希望买到的邮票数也往后推了一天，所以价格要多 $f [i + 1]$ 元，还要加上自己的 $1$ 元