J - Sushi - kyopuro-ryusuke920

J - Sushi

#2023-12-07 #期待値dp #dp #EDPC

/icons/hr.icon

出典

EDPC-J

/icons/hr.icon

問題

J - Sushi

/icons/hr.icon

考察・解法

期待値 dp といえばと言うほど有名な問題だと思っています。

個人的にまとめておこう思いました。

$ \begin{aligned} {\mathrm dp} [i][j][k] &:= \\ &1 枚の皿が i 枚, 2 枚の皿が j 枚, 3 枚の皿が k 枚残っている時の期待値 \end{aligned}

このように定義します。何番目のお皿がどうこうと言うのが今回は気にする必要がないのがミソです。

最初の数列$ Aに対して$ 1,2,3枚のお皿の個数をそれぞれ$ x,y,zとすると、

求める答えは $ {\mathrm dp}[x][y][z] となります。

遷移を考えます。

残り$ 1,2,3枚の皿がそれぞれ$ i, j, k枚の時、

残り$ 1枚の皿を引く確率 : $ \dfrac{i}{N}

残り$ 2枚の皿を引く確率 : $ \dfrac{j}{N}

残り$ 3枚の皿を引く確率 : $ \dfrac{k}{N}

残り$ 0枚の皿を引く確率 : $ \dfrac{N - (i + j + k)}{N}

したがって、

$ \begin{aligned} {\mathrm dp}[i][j][k] &= dp[i - 1][j][k] \times \dfrac{i}{N} \\ & + {\mathrm dp}[i + 1][j - 1][k] \times \dfrac{j}{N} \\ & + {\mathrm dp}[i][j + 1][k - 1] \times \dfrac{k}{N} \\ & + {\mathrm dp}[i][j][k] \times \dfrac{N - (i + j + k)}{N} \\ & + 1 \end{aligned}

しかしこのままでは右辺にも$ {\mathrm dp}[i][j][k] があり自己ループを起こしてしまいます。

したがって、式変形を行いましょう。

左辺へ持ってくる

$ \begin{aligned} {\mathrm dp}[i][j][k]　- \quad {\mathrm dp}[i][j][k] \times \dfrac{N - (i + j + k)}{N} &= \\ & dp[i - 1][j][k] \times \dfrac{i}{N} \\ & + {\mathrm dp}[i + 1][j - 1][k] \times \dfrac{j}{N} \\ & + {\mathrm dp}[i][j + 1][k - 1] \times \dfrac{k}{N} \\ & + 1 \end{aligned}

共通因数で括る

$ \begin{aligned} {\mathrm dp}[i][j][k] \times \dfrac{i + j + k}{N} &= \\ & dp[i - 1][j][k] \times \dfrac{i}{N} \\ & + {\mathrm dp}[i + 1][j - 1][k] \times \dfrac{j}{N} \\ & + {\mathrm dp}[i][j + 1][k - 1] \times \dfrac{k}{N} \\ & + 1 \end{aligned}

定数を両辺にかける

$ \begin{aligned} {\mathrm dp}[i][j][k] &= \\ & dp[i - 1][j][k] \times \dfrac{i}{i + j + k} \\ & + {\mathrm dp}[i + 1][j - 1][k] \times \dfrac{j}{i + j + k} \\ & + {\mathrm dp}[i][j + 1][k - 1] \times \dfrac{k}{i + j + k} \\ & + \dfrac{N}{i + j + k} \end{aligned}

/icons/hr.icon

コード

code:python

n = int(input())

a = list(map(lambda x: int(x) - 1, input().split()))

# dpijk := 1,2,3枚の皿が残りi,j,k枚の時の全ての寿司を無くすまでの期待値

dp = [[0 * (n + 1) for _ in range(n + 1)] for _ in range(n + 1)]

# 皿の枚数を計算する

cnt = 0 * 3

for i in range(n):

cnt[ai] += 1

for k in range(n + 1):

for j in range(n + 1):

for i in range(n + 1):

p = i + j + k

if p == 0 or p > n:

continue

prob = 0

if i >= 1:

prob += dpi - 1jk * i

if j >= 1:

prob += dpi + 1j - 1k * j

if k >= 1:

prob += dpij + 1k - 1 * k

prob += n

dpijk += prob / p

x, y, z = cnt

print(dpxyz)

ここで注意が必要なのが for ループの$ i,j,kの順番です。

$ {\mathrm dp}[i + 1][j - 1][k] を求めるには$ jは減るが、$ iは増えるので$ jよりも$ iを先に計算する必要があります。

同様に、$ {\mathrm dp}[i][j + 1][k - 1] を求めるには$ kは減るが、$ jは増えるので$ kよりも$ jを先に計算する必要があります。

したがって、$ k, j, iの順番で for ループを回す必要があることに注意しましょう。

提出詳細: https://atcoder.jp/contests/dp/submissions/48247479