Poker Lesson 7 - 比大小遊戲 (完整版)

Poker

Author

Tai-Ning Liao

Published

December 23, 2025

今天我們繼續比大小遊戲，但是上次假設，若先手 Player A check，則強制攤牌。這次我們來討論更一般的情況: Player B 可以選擇主動下注。

不過我們還是先忽略可以加注 (raise) 的情況。

遊戲規則: [0,1] 連續版本

玩家：Player A 與 Player B。
底池 (Pot)：\(P\) 元（可視為雙方起始強迫下注 \(P/2\)）。
發牌：雙方從 \([0,1]\) 均勻分布抽取一個數字作為自己的牌面數字，彼此互不知情。
攤牌時勝負判定：
- 數字較大者獲勝，贏走底池。
- 若數字相同則平手，雙方拿回各自的下注。
下注流程：
- 設定每次下注金額為 \(B\) 元。
- Player A（先手）：可以選擇 下注 (Bet) 或 過牌 (Check)。
- 若 Player A 選擇 過牌 (Check)，則輪到 Player B 行動，B 同樣可以選擇下注或過牌。
- 若 Player A 選擇 下注 (Bet)，則輪到 Player B 行動，B 可以選擇 跟注 (Call) 或 棄牌 (Fold)。

Figure 1: Full Game Tree: Player B can Bet after A Checks

有了之前的經驗，我們知道 Player A 的策略會變成兩個函數 \(a_1(x), a_2(x)\)，Player B 的策略也是兩個函數 \(b_1(y), b_2(y)\)，

\(a_1(x)\)：Player A 在起始點的策略，決定是否下注 (Bet)。
\(b_1(y)\)：Player B 在面對 Player A 下注 (A Bet) 時的策略，決定是否跟注 (Call)。
\(b_2(y)\)：Player B 在面對 Player A 過牌 (A Check) 時的策略，決定是否偷底 (Bet)。
\(a_2(x)\)：Player A 在面對 Player B 偷底 (B Bet) 時的策略，決定是否跟注 (Call)。

根據這個設定本身，在 \(a_1(x)=1\) 時，\(a_2(x)\) 是多少都不影響結果。所以這本來就是 coupled 的一組策略函數。

Player A 的期望值

遊戲有五種結局，我們寫個表來看看他們分別對 Player A 的 payoff 是多少：

	若 \(x > y\)	若 \(x = y\)	若 \(x < y\)
結局 1 (A bet, B call)	\(P+B\)	\(P/2\)	\(-B\)
結局 2 (A bet, B fold)	\(P\)	\(P\)	\(P\)
結局 3 (A check, B bet, A call)	\(P+B\)	\(P/2\)	\(-B\)
結局 4 (A check, B bet, A fold)	\(0\)	\(0\)	\(0\)
結局 5 (A check, B check)	\(P\)	\(P/2\)	\(0\)

同樣的，我們忽略相等的情況 (機率為零)，然後寫一下機率密度:

\[ \begin{array}{|l|c|c|l|} \hline \textbf{結局路徑} & \textbf{若 } x > y & \textbf{若 } x < y & \textbf{機率密度} \\ \hline \text{1. A Bet, B Call} & P+B & -B & a_1(x) \cdot b_1(y) \\ \hline \text{2. A Bet, B Fold} & P & P & a_1(x) \cdot (1 - b_1(y)) \\ \hline \text{3. A Check, B Bet, A Call} & P+B & -B & (1 - a_1(x)) \cdot b_2(y) \cdot a_2(x) \\ \hline \text{4. A Check, B Bet, A Fold} & 0 & 0 & (1 - a_1(x)) \cdot b_2(y) \cdot (1 - a_2(x)) \\ \hline \text{5. A Check, B Check} & P & 0 & (1 - a_1(x)) \cdot (1 - b_2(y)) \\ \hline \end{array} \]

接著利用這張表，我們將各結局的「機率密度」與「損益」相乘，並對所有可能的牌型 \(x, y\) 積分，即可寫出 Player A 的期望值函數。

我將第 4 項（結局 4）省略了，因為其損益為 0，對積分沒有貢獻。

\[ \begin{aligned} &\mathbb{E}[\text{Payoff}_A] := \mathcal{L}(a_1, a_2, b_1, b_2) \\ &= \int_0^1 \int_0^1 \Bigg[ \\ &\quad a_1(x) \cdot b_1(y) \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) &\qquad\text{(結局 1: A Bet, B Call)} \\ &\quad + a_1(x) \cdot (1 - b_1(y)) \cdot P &\qquad\text{(結局 2: A Bet, B Fold)} \\ &\quad + (1 - a_1(x)) \cdot b_2(y) \cdot a_2(x) \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) &\qquad\text{(結局 3: A Check, B Bet, A Call)} \\ &\quad + (1 - a_1(x)) \cdot (1 - b_2(y)) \cdot P \cdot \mathbb{1}_{x>y} &\qquad\text{(結局 5: A Check, B Check)} \\ &\quad \Bigg] dy \, dx \end{aligned} \]

四個函數的變分

我們從最裡面解回來，也就是說，我們先假設 \(a_1(x), b_1(y), b_2(y)\) 已經定好了，然後我們來找出最佳的 \(a_2(x)\) 來最大化 Lagrangian。

解 \(a_2(x)\):

只需要考慮包含 \(a_2(x)\) 的項: \[ \begin{aligned} &\int_0^1 \int_0^1 (1 - a_1(x)) \cdot b_2(y) \cdot \textcolor{red}{a_2(x)} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) dy \, dx \\ = &\int_0^1 (1 - a_1(x)) \cdot \textcolor{red}{a_2(x)} \cdot \underbrace{ \left( \int_0^1 b_2(y) \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) dy \right)}_{g(x)} dx \\ \end{aligned} \]

符合剛才的直覺，當 \(a_1(x)=1\) 時，\(a_2(x)\) 不影響結果。

這個 \(g(x)\) 的形式跟我們上一篇中的 \(h(y)\) 幾乎一樣。這也很合理，因為我們從最後一步開始解，而上一次就是單純解最後一步。

來快速算一下這個 \(g(x)\): \[ \begin{aligned} g(0) &= -B \cdot \int_0^1 b_2(y) dy \\ g(1) &= (P+B) \cdot \int_0^1 b_2(y) dy \\ g(x)' &= (P + 2B) \cdot b_2(x) \geq 0 \\ \end{aligned} \]

這個 \(g(x)\) 是從負值遞增，然後過零點，最後變成正值的函數。

那麼 \(a_2(x)\) 就是 \[ a_2(x) = \begin{cases} 0, & g(x) < 0 \\ 1, & g(x) > 0 \\ \text{Any}, & (1-a_1(x)) \cdot g(x) = 0 \\ \end{cases} \] 既然其他點可以取任意值，不妨假設 \[ a_2(x) = \mathbb{1}_{x > x_2^*} \tag{1}\label{eq:a2-strategy} \] 其中 \(x_2^*\) 是使 \(g(x_2^*)=0\) 的解。也就是 \[ \frac{\int_0^{x_2^*} b_2(y) dy}{\int_{x_2^*}^1 b_2(y) dy} = \frac{B}{P+B} \tag{2}\label{eq:x2-ratio} \]

解出 \(a_2(x)\) 後，接著解 \(b_1(y)\) 或 \(b_2(y)\) 都可以。因為沒有相依性。

解 \(b_1(x)\):

只需要考慮包含 \(b_1(y)\) 的項: \[ \begin{aligned} &\int_0^1 \int_0^1 a_1(x) \cdot \textcolor{red}{b_1(y)} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} -P \Big) dy \, dx \\ = &\int_0^1 \textcolor{red}{b_1(y)} \cdot \underbrace{ \left( \int_0^1 a_1(x) \Big( B\mathbb{1}_{x>y} - (P+B)\mathbb{1}_{x<y} \Big) dx \right)}_{h(y)} dy \\ \end{aligned} \] 再來一次， \[ \begin{aligned} h(0) &= B \cdot \int_0^1 a_1(x) dx \\ h(1) &= -(P+B) \cdot \int_0^1 a_1(x) dx \\ h(y)' &= -(P+2B) \cdot a_1(y) \leq 0 \\ \end{aligned} \] 而 \(b_1(y)\) 要最小化它，所以存在一個切分點 \(y_1^*\) 使得 \[ b_1(y) = \mathbb{1}_{y > y_1^*} \tag{3}\label{eq:b1-strategy} \] 其中 \(y_1^*\) 是使 \(h(y_1^*)=0\) 的解。也就是 \[ \frac{\int_0^{y_1^*} a_1(x) dx}{\int_{y_1^*}^1 a_1(x) dx} = \frac{B}{P+B} \tag{4}\label{eq:y1-ratio} \] 這邊確實就跟上一篇一模一樣了，因為上一篇也有這個分支。

解 \(b_2(y)\):

考慮包含 \(b_2(y)\) 的項，此時把剛剛解的 \(a_2(x)\) 帶進去: \[ \begin{aligned} &\int_0^1 \int_0^1 (1 - a_1(x)) \cdot \textcolor{red}{b_2(y)} \cdot \Big[ \mathbb{1}_{x > x_2^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) - P\mathbb{1}_{x>y} \Big] dy \, dx \\ = &\int_0^1 \textcolor{red}{b_2(y)} \cdot \left( \int_0^1 (1 - a_1(x)) \cdot \Big[ \mathbb{1}_{x > x_2^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) - P\mathbb{1}_{x>y} \Big] dx \right) dy \\ \end{aligned} \] 這邊稍微複雜一點，因為 \(x_2^*\) 其實是根據 \(b_2(y)\) 決定的 (依照切分比例)。所以不能將 \(x_2^*\) 當成常數來看待。

交換一下順序，我們假設 \(x_2^*\) 是固定的，現在將 \(b_2(y)\) 拆成兩個區間來做變分，但有面積的條件: \[ \int_0^{x_2^*} b_2(y) dy : \int_{x_2^*}^1 b_2(y) dy = B : (P+B) \] 所以上面變成 \[ \begin{aligned} &\int_0^{1} \textcolor{red}{b_2(y)} \cdot \left( \int_0^1 (1 - a_1(x)) \cdot \Big[ \mathbb{1}_{x > x_2^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) - P\mathbb{1}_{x>y} \Big] dx \right) dy \\ = &\int_0^{x_2^*} \textcolor{red}{b_2(y)} \cdot \underbrace{\left( \int_0^1 (1 - a_1(x)) \cdot \Big[ (P+B)\mathbb{1}_{x > x_2^*} - P\mathbb{1}_{x>y} \Big] dx \right)}_{k_1(y)} dy \\ &+ \int_{x_2^*}^{1} \textcolor{red}{b_2(y)} \cdot \underbrace{\left( \int_0^1 (1 - a_1(x)) \cdot \Big[ (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x>x_2^*}\mathbb{1}_{x<y} - P\mathbb{1}_{x>y} \Big] dx \right)}_{k_2(y)} dy \\ \end{aligned} \] 如此一來又變回熟悉的形式了。 \[ \begin{aligned} k_1(0) &= (P+B) \cdot \int_{x_2^*}^1 (1 - a_1(x)) dx - P \cdot \int_0^1 (1 - a_1(x)) dx \\ &= B \cdot \int_{x_2^*}^1 (1 - a_1(x)) dx - P \cdot \int_0^{x_2^*} (1 - a_1(x)) dx \\ k_1(x_2^*) &= B \cdot \int_{x_2^*}^1 (1 - a_1(x)) dx \geq 0 \\ k_1(y)' &= P \cdot (1 - a_1(y)) \geq 0 \\ \end{aligned} \] 以及 \[ \begin{aligned} k_2(x_2^*) &= B \cdot \int_{x_2^*}^1 (1 - a_1(x)) dx \geq 0 \\ k_2(1) &= -B \cdot \int_{x_2^*}^1 (1 - a_1(x)) dx \leq 0 \\ k_2(y)' &= -2B \cdot (1-a_1(y)) \leq 0 \\ \end{aligned} \] 因此， \(k_2(y), k_1(y)\) 這兩個函數，分別是遞增與遞減，而 \(b_2(y)\) 要最小化整個式子，所以 \(b_2(y)\) 是極化的策略 (不妨假設\(k_1(0)<0\)，否則的話就取 \(z_1^*=0\) 即可，我們要解的是形狀): \[ b_2(y) = \mathbb{1}_{y < z_1^*} + \mathbb{1}_{y > z_2^*} \tag{5}\label{eq:b2-strategy} \] 其中 \(z_1^*, z_2^*\) 是使得 \(k_1(z_1^*)=0, k_2(z_2^*)=0\) 的解。

假設確實有 \(k_1(0)<0\)，那麼 \[ \int_{z_1^*}^{x_2^*} (1 - a_1(x)) dx = \frac{B}{P} \cdot \int_{x_2^*}^1 (1 - a_1(x)) dx \tag{6}\label{eq:z1-ratio} \] 以及 \[ \frac{\int_{x_2^*}^{z_2^*} (1 - a_1(x)) dx}{\int_{z_2^*}^1 (1 - a_1(x)) dx} = \frac{k_2(x_2^*)}{-k_2(1)} = \frac{B}{B} = 1 \tag{7}\label{eq:z2-ratio} \] 因此， \(z_1^*, z_2^*\) 是依照 \(a_1(x)\) 定義的。

等等，還有面積的條件需要滿足。但已經沒有自由度可以用了。也就是說最好的 \(b_2(y) = \mathbb{1}_{y < z_1^*} + \mathbb{1}_{y > z_2^*}\) 並不一定滿足面積比是 \(B:P+B\) 這個條件。

但我們現在假設 Player A 固定，所以 \(a_2(x)\) 是固定的。所以理解為，我們猜測 \(a_2(x)\) 的形狀，在這樣條件下來看 \(b_1(y), b_2(y)\) 可以打出的最佳進攻策略是什麼，而不需要滿足面積條件 \(\eqref{eq:x2-ratio}\) 。所以以上的推導依然成立。

解 \(a_1(x)\):

這邊解 \(a_1(x)\) 有兩種視角:

最佳進攻策略: 對於任意固定函數 \(b_1(y), b_2(y)\)，我們來看如何攻擊這組 \(b_1, b_2\) (最大化 Lagrangian)。但上面的討論告訴我們，我們不用解最一般的情形，可以假設它的形狀是 \(\eqref{eq:b1-strategy}\), \(\eqref{eq:b2-strategy}\)。
最佳防守策略: 將上面解出的 \(b_1(y), b_2(y)\) 帶回 Lagrangian，然後解 \(a_1(x)\) 來最大化 Lagrangian，也就是被 Player B 已知 \(a_1(x)\) 的情形之下，要如何防守的概念，因為這裡 \(b_1(y), b_2(y)\) 可以隨著 \(a_1(x)\) 改變而改變。

這兩種視角都挺重要的，也都有意義。但因為 Nash Equilibrium 是在講最佳防守，所以我們先用第二種視角來看。

如果從 Player A 的防守視角來看，當固定 \(a_1(x)\) 和 \(x_2^*\) 且被 Player B 已知的情形下，Player B 對於 \(b_1(y), b_2(y)\) 的最佳攻擊策略是什麼? 利用 \(\eqref{eq:b1-strategy}\), \(\eqref{eq:b2-strategy}\)，我們將期約化為三個變數:

\(y_1^*\): 把 \(a_1(x)\) 底下的面積切成 \(B : (P+B)\) 的比例。
\(z_1^*, z_2^*\): 先從 \(x_2^*\) 切開，然後選擇 \(z_1^*\) 滿足 \(\eqref{eq:z1-ratio}\)，接著選擇 \(z_2^*\) 滿足 \(\eqref{eq:z2-ratio}\)。

這樣確實是 Player B 對 Player A 最嚴厲的攻擊。但有個風險，因為沒有滿足 \(\eqref{eq:x2-ratio}\)，所以如果 Player A 改變 \(x_2^*\)，就可以對 Player B 進行剝削。(至於這一來一往是正的還是負的? 感覺不好估計)

我們換個角度想，Player B 能不能選 \(z_1^*, z_2^*\) 使得就算 Player A 改變 \(x_2^*\) 也不會被剝削?

也就是要把 \(z_1^*, z_2^*\) 選成跟 \(x_2^*\) 無關的形式。回頭看看 \(\eqref{eq:z1-ratio}\), \(\eqref{eq:z2-ratio}\)，我們發現只要滿足下面的條件就可以了: \[ \begin{cases} \displaystyle \int_{\textcolor{red}{z_1^*}}^{\textcolor{red}{z_2^*}} (1 - a_1(x)) dx : \int_{\textcolor{red}{z_2^*}}^1 (1 - a_1(x)) dx = (B + \frac{P}{2}) : \frac{P}{2} \\ \displaystyle \textcolor{red}{z_1^*} : (1 - \textcolor{red}{z_2^*}) = B : (P+B) \end{cases} \tag{8}\label{eq:z1z2-equations} \] 這邊很巧妙把 \(B:P\) 和 \(1:1\)，變成了 \(B + \frac{P}{2} : \frac{P}{2}\)，如此一來就跟 \(x_2^*\) 無關，而多出來的自由度可以讓 Player B 調整 \(z_1^*, z_2^*\) 來滿足面積條件 \(\eqref{eq:x2-ratio}\)。

這邊有點一直交換 Min-Max的順序來論證，應該是對的。

現在我們得到小結論，Player B 只要知道 \(a_1(x)\)，就可以選出一組 \(b_1(y), b_2(y)\) (也就是 \(y_1^*, z_1^*, z_2^*\)) 來攻擊 Player A。

所以問題已經約化到只剩最後一個函數: \(a_1(x)\)，要取多少可以最大化 Lagrangian。

先來看看完整的 Lagrangian，我們先在沒有 \(\eqref{eq:z1z2-equations}\) 約束下解，也就是這邊的等式對於一般的 \(y_1^*, z_1^*, z_2^*\) 都成立 (順便研究 Player A 的攻擊策略): \[ \begin{align} &\mathcal{L}(a_1, a_2, b_1, b_2) \\ &= \int_0^1 \int_0^1 \left[ \begin{aligned} & a_1(x) \cdot \mathbb{1}_{y>y_1^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) \\ + & a_1(x) \cdot (1 - \mathbb{1}_{y>y_1^*}) \cdot P \\ + & (1 - a_1(x)) \cdot (\mathbb{1}_{y < z_1^*} + \mathbb{1}_{y > z_2^*}) \cdot (\mathbb{1}_{x>x_2^*}) \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) \\ + & (1 - a_1(x)) \cdot (1 - \mathbb{1}_{y < z_1^*} - \mathbb{1}_{y > z_2^*}) \cdot P \mathbb{1}_{x>y} \end{aligned} \right] dy \, dx \\ &= \int_0^1 \int_0^1 \underbrace{\Big[ (\mathbb{1}_{y < z_1^*} + \mathbb{1}_{y > z_2^*}) \cdot \mathbb{1}_{x>x_2^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) + (1 - \mathbb{1}_{y < z_1^*} - \mathbb{1}_{y > z_2^*}) \cdot P \mathbb{1}_{x>y} \Big]}_{J(x,y)} dy \, dx \\ &\quad + \int_0^1 \textcolor{red}{a_1(x)} \cdot \underbrace{\left( \int_0^1 \left[ \begin{aligned} & \mathbb{1}_{y>y_1^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) + (1 - \mathbb{1}_{y>y_1^*}) \cdot P \\ & - (\mathbb{1}_{y < z_1^*} + \mathbb{1}_{y > z_2^*}) \cdot \mathbb{1}_{x>x_2^*} \cdot \Big( (P+B)\mathbb{1}_{x>y} - B\mathbb{1}_{x<y} \Big) \\ & - (1 - \mathbb{1}_{y < z_1^*} - \mathbb{1}_{y > z_2^*}) \cdot P \mathbb{1}_{x>y} \end{aligned} \right] dy \right)}_{G(x)} dx \end{align} \] 有些些混亂，我們把大於的符號一律改成小於的方向，看比較清楚。

\[ \begin{align} \mathcal{L}(a_1, a_2, b_1, b_2) &= \int_0^1 \int_0^1 J(x,y) \, dy \, dx + \int_0^1 \textcolor{red}{a_1(x)} \cdot G(x) \, dx \\ \text{其中} \quad J(x,y) &= (\mathbb{1}_{y < z_1^*} + \mathbb{1}_{z_2^* < y}) \cdot \mathbb{1}_{x_2^* < x} \cdot \Big( (P+B)\mathbb{1}_{y < x} - B\mathbb{1}_{x < y} \Big) + \mathbb{1}_{z_1^* \le y \le z_2^*} \cdot P \mathbb{1}_{y < x} \\ G(x) &= \int_0^1 \left[ \begin{aligned} & \mathbb{1}_{y_1^* < y} \cdot \Big( (P+B)\mathbb{1}_{y < x} - B\mathbb{1}_{x < y} \Big) + P \mathbb{1}_{y \le y_1^*} \\ & - \mathbb{1}_{x_2^* < x} \cdot (\mathbb{1}_{y < z_1^*} + \mathbb{1}_{z_2^* < y}) \cdot \Big( (P+B)\mathbb{1}_{y < x} - B\mathbb{1}_{x < y} \Big) \\ & - P \mathbb{1}_{z_1^* \le y \le z_2^*} \cdot \mathbb{1}_{y < x} \end{aligned} \right] dy \end{align} \] 好，雖然有點小複雜，但這都是 indicator function，積分通常可以直接算出來。

我們先假設有 \(z_1^* \leq x_2^* \leq z_2^*\)， \[ \begin{aligned} \int_0^1 \int_0^1 J(x,y) \, dy \, dx &= P\cdot (z_2^* - z_1^*)(1-\frac{z_2^* + z_1^*}{2}) \\ &\quad + (P+B)\cdot \left( \frac{(1-z_2^*)^2}{2} + z_1^*(1-x_2^*) \right) \\ &\quad - B \cdot (1-z_2^*)(\frac{1+z_2^*}{2} - x_2^*) \\ &= P \cdot \left[ \frac{(1-z_1^*)^2}{2} + z_1^*(1-x_2^*) \right] + B \cdot \left[ z_1^*(1-x_2^*) - (1-z_2^*)(z_2^* - x_2^*) \right] \end{aligned} \]

已經有點醜了，再來試試看 \(G(x)\)，注意到積分後半段跟剛才的 \(J(x,y)\) 其實一樣，然後前半段相對簡單。 \[ \begin{align} G(x) &= \underbrace{ \begin{cases} (P+B)y_1^* - B & \text{if } x \le y_1^* \\ (P+2B)x - B(1+y_1^*) & \text{if } x > y_1^* \end{cases} }_{\text{Part 1: } y_1^* \text{ Dependent Terms}} \\ &\qquad + \underbrace{ \begin{cases} 0 & \text{if } x < z_1^* \\ -P(x - z_1^*) & \text{if } z_1^* \le x \le x_2^* \\ -Px + B(1 - z_1^* - z_2^*) & \text{if } x_2^* < x < z_2^* \\ -(P+2B)x + B(1 - z_1^* + z_2^*) & \text{if } x \ge z_2^* \end{cases} }_{\text{Part 2: } z_1^*, x_2^*, z_2^* \text{ Dependent Terms}} \tag{9}\label{eq:Gx-pieces} \end{align} \]

其實還不算是太醜(?)，基本上是由折線線段組成的，但在第二項 \(x=x_2^*\) 有個(可能)不連續的點。而這個點若要連續，就是要滿足面積比例的條件!! \[ z_1^* : (1-z_2^*) = B : (P+B) \]

現在我們使用 \(\eqref{eq:z1z2-equations}\) 的條件，所以以下結果開始基於有面積比例的條件。

\(J(x,y)\) 積分變得好看很多，而 \(G(x)\) 第二項也會連續。因為前後兩段斜率相同，所以會直接變一段。

\[ \int_0^1 \int_0^1 J(x,y) \, dy \, dx = \frac{P}{2}(1-z_1^*)^2 + B(1-z_2^*)^2 \tag{10}\label{eq:Jxy-integral-with-constraints} \] \[ \begin{align} G_1(x) &= \begin{cases} (P+B)y_1^* - B & \text{, if } x \le y_1^* \\ (P+2B)x - B(1+y_1^*) & \text{, if } x > y_1^* \end{cases} \tag{11}\label{eq:G1x} \\ G_2(x) &= \begin{cases} 0 & \text{, if } x < z_1^* \\ P(x - z_1^*) & \text{, if } z_1^* \le x \le z_2^* \\ (P+2B)(x+z_1^*) - 2B & \text{, if } x \ge z_2^* \end{cases} \tag{12}\label{eq:G2x} \\ G(x) &= G_1(x) - G_2(x) \\ \end{align} \] 我們把 \(G\) 拆分成兩個，第二個加了負號，這樣一來斜率都是正的了。還有做了一些簡單的代數代換，讀者可自行驗證。

單純看這個圖，我們就知道如果 \(a_1(x)\) 要最大化 Lagrangian，那就是極化的，在兩端 \(G(x)\) 是正的部分全 1，中間負的部分全 0。

但真的是這樣嗎?

因為 \(G_1(x), G_2(x)\) 在開頭和結尾的斜率都一致，所以會不會 剛好重和。那樣一來 \(G(x)\) 就是零，所以 \(a_1(x)\) 可以是任意值。無差異! Indifference!

但也不一定要取到剛好一樣，如果可以的話，只要讓 \(G(x)\) 一定小於等於 0 就行了。Player B 有辦法辦到嗎? 我們解端點 0 和 1 時的不等式(這邊的 \(G_2(x)\) 我使用沒有帶面積條件的版本 \(\eqref{eq:Gx-pieces}\)): \[ \begin{cases} (P+B)y_1^* - B \leq 0 \\ (P+2B) - B(1+y_1^*) \leq \Big( (P+2B) - B(1 - z_1^* + z_2^*) \Big) \\ \end{cases} \] 也就是 \[ \begin{cases} \displaystyle y_1^* \leq \frac{B}{P+B} \\ \displaystyle z_2^* - z_1^* \leq y_1^* \\ \end{cases} \tag{13}\label{eq:inequalities-from-endpoints} \] 假設可以取到，那麼 \(G(x) \leq 0\) 對所有 \(x \in [0,1]\) 都成立，這樣 Lagrangian 最大值就是 \(J(x,y)\) 的積分值 \(\eqref{eq:Jxy-integral-with-constraints}\)。還是帶有 \(z_1^*, z_2^*\)，所以我們要把它具體解出來。

BTW, 如果 \(G\) 讓出一點點正的部分給 \(a_1(x)\) 可以因此壓低的 \(J\) 的積分值的話，那我這樣就解錯了，但我們猜應該不會，這是這類 Indifference principle 不嚴謹的地方。而且根據該原則，其實上面兩個等號一定會成立，因為那是最讓 Player A 感受到無差異的條件: 所有 \(G(x)=0\) 的地方 \(a_1(x)\) 的取值都不影響結果。如果嚴格小於，那 Player A 在那裡的 \(a_1(x)\) 一定會取 0。而直覺上 Player B 會在另個其他某個地方付出代價。這部分也不嚴謹。

還是來算算看，根據面積條件 \(\eqref{eq:z1z2-equations}\)，假設 \(z_1^* = Bt\)，那麼 \(z_2^* = 1 - (P+B)t\)，所以 \(z_2^* - z_1^* = 1 - (P+2B)t\)，而他最多是 \(B/(P+B)\)，所以 \[ t \geq \frac{P}{(P+B)(P+2B)} \]

另一方面 \[ \begin{align} \mathcal{L}_{max} &= \frac{P}{2}(1 - z_1^*)^2 + B(1 - z_2^*)^2 \\ &= \frac{P}{2}(1 - Bt)^2 + B\Big((P+B)t\Big)^2 \\ &= \frac{P}{2} - PBt + \Big( B(P+B)^2 + \frac{PB^2}{2} \Big) t^2 \\ \end{align} \] 是個開口向上的二次函數，因為 \(t\) 是 Player B 控制的，要選 \(t\) 讓它最小化。而其對稱軸位於 \[ t_{\min} = \frac{PB}{2\Big( B(P+B)^2 + \frac{PB^2}{2} \Big)} = \frac{P}{(2P+B)(P+2B)} < \frac{P}{(P+B)(P+2B)} \leq t \] 所以最佳的 \(t\) 果然是取到等號成立: \[ t^* = \frac{P}{(P+B)(P+2B)} \] 所以 \[ \begin{align} &z_1^* = \frac{BP}{(P+B)(P+2B)} , \quad z_2^* = \frac{2B}{P+2B} \\ &y_1^* = \frac{B}{P+B} \\ \end{align} \tag{14}\label{eq:final-z1z2y1} \]

以上推導應該還要再驗證，若不等式 \(\eqref{eq:inequalities-from-endpoints}\) 不成立，\(a_1(x)\cdot G(x)\) 所增加的量，會比 \(J(x,y)\) 所減少的量還多。這樣才保證 Player B 成功使 Lagrangian 最小化。但其實不太可能，因為如此一來，Player A 就不是針對 Player B 打出最佳攻擊了。但在 Nash Equilibrium 時，雙方都是最佳防守狀態，也都是彼此的最佳攻擊。所以在 Nash Equilibrium 狀態下，以上推導是成立的。

而 Player B 取這個 \(t^*\) 時，Lagrangian 是多少呢? 因為上面 \(\mathcal{L}_{max}\) 的式子中，\(t=0\) 時會是 \(P/2\) 也就是池底的一半，所以在 \([0, 2t_{\min}]\) 之間 \(\mathcal{L}_{max}\) 會小於 \(P/2\)，超過 \(2t_{\min}\) 後就會大於 \(P/2\)。而我們的 \(t^*\) 是小於 \(2t_{\min}\) 的! \[ t^* = \frac{P}{(P+B)(P+2B)} < 2t_{\min} = \frac{2P}{(2P+B)(P+2B)} \] 所以 Player A 的整體期望值是小於池底一半的! 也就是先手劣勢。

如此一來 Game Value 有了，具體來說是: \[ \begin{align} &\max_{a_1, a_2} \min_{b_1, b_2} \mathcal{L}(a_1, a_2, b_1, b_2) \\ &\quad = \frac{P}{2} - t^* B \left(P - \frac{(2P+B)(P+2B)}{2} t^* \right) \\ &\quad = \frac{P}{2} - \frac{P}{(P+B)(P+2B)}\cdot B \left( P - \frac{P(2P+B)}{2(P+B)} \right) \\ &\quad = \frac{P}{2} - \frac{P^2B^2}{2(P+2B)(P+B)^2} \tag{15}\label{eq:game-value-final} \end{align} \] 總結以上的解法，Player B 打出最佳防守 \(\eqref{eq:final-z1z2y1}\) 時，是不需要知道 Player A 的策略的，所以這並非 Player B 的最佳攻擊策略。Player A 此時被無差異化了，所以 \(a_1(x)\) 在 \([z_1^*, z_2^*]\) 是 \(0\)，其他地方可以任意。

但若 Player B 可以根據 Player A 的策略來動態調整，那麼 Player B 的 \(y_1^*, z_1^*, z_2^*\) 就會依照 \(\eqref{eq:z1z2-equations}\) 的面積比例去切分。此時 Player A 要如何選擇 \(a_1(x)\) 才能最大化 Lagrangian?

如果繼續沿用剛才的邏輯，當 Nash Equilibrium 時，Player B 的最佳防守策略 \(\eqref{eq:final-z1z2y1}\) 會是對 Player A 的最佳攻擊，所以其實 \(\eqref{eq:final-z1z2y1}\) 也剛好會把 \(a_1(x)\) 依照 \(\eqref{eq:z1z2-equations}\) 的比例去切分。

所以說，\((1-a_1(x))\) 在 \([z_1^*, z_2^*]\) 部分的面積，比上 \([z_2^*, 1]\) 部分的面積，會是 \((B + \frac{P}{2}) : \frac{P}{2}\) 的比例。而因為 \(a_1(x)\) 在 \([z_1^*, z_2^*]\) 是 \(0\)，所以 \((1-a_1(x))\) 在這區間的面積就是 \(z_2^* - z_1^*\)。所以剩下要算的就是 \(a_1(x)\) 在 \([z_2^*, 1]\) 的部分是多少。 \[ \frac{1 - z_2^* - A_{value}}{z_2^* - z_1^*} = \frac{P}{2B + P} \] 帶 \(\eqref{eq:final-z1z2y1}\) 解出 \[ A_{value} = \frac{P}{P + 2B}\frac{P}{P+B} \] 而 \(a_1(x)\) 在 \([0, z_1^*]\) 的部分面積需要是 \(A\) 的 \(\frac{B}{P+B}\)，所以 \[ A_{bluff} = \frac{B}{P+B} A_{value} = \frac{P^2B}{(P+2B)(P+B)^2} \]

Figure 4: Final \(a_1(x)\) Optimal Strategy

現在算出了 \(a_1(x)\) 在兩邊的面積是多少，那形狀呢? 剛才的 Lagrangian 似乎就被面積決定了，也沒有提到形狀的問題。沒錯，Lagrangian 只跟面積有關，所以形狀可以任意。