賽局論基礎

一句話解釋

在 zero-sum game 中，玩家選策略對抗；pure strategy 若有 saddle point 則遊戲已解，否則需要 mixed strategy。

Zero-Sum Game

基本設定

定義

Zero-sum game（零和賽局）：

兩個玩家：Row Player（R）和 Column Player（C）
R 的收益 = C 的損失（總和為 0）
完全對抗性（adversarial）

Payoff Matrix（報酬矩陣）

$m \times n$ 矩陣 $A$：

R 有 $m$ 個策略（選第 $i$ 列）
C 有 $n$ 個策略（選第 $j$ 行）
$A[i, j]$ = R 的收益（= C 的損失）

範例：剪刀石頭布（簡化版）

	石頭	剪刀	布
石頭	0	1	-1
剪刀	-1	0	1
布	1	-1	0

正數 = R 贏，負數 = C 贏，0 = 平手

Pure Strategy（純策略）

確定性策略

定義

Pure strategy： 每次都選同一個動作（確定性）

R 選第 $i$ 列
C 選第 $j$ 行

Value of the Row (VR)

定義： R 選第 $i$ 列時的**最壞情況**收益（C 會最佳反應） $$ VR_i = \min_j A[i, j] $$ R 的最佳 pure strategy： 最大化最壞情況 $$ VR = \max_i \min_j A[i, j] $$ 稱為 **maxmin value**（最大最小值）。

Value of the Column (VC)

定義： C 選第 $j$ 行時的**最壞情況**損失（R 會最佳反應） $$ VC_j = \max_i A[i, j] $$ C 的最佳 pure strategy： 最小化最壞情況 $$ VC = \min_j \max_i A[i, j] $$ 稱為 **minmax value**（最小最大值）。

基本不等式

Theorem

對任何 zero-sum game： $$ VR \leq VC $$ 即：maxmin $\leq$ minmax 證明： 對任意 $i, j$： $$ \min_k A[i, k] \leq A[i, j] \leq \max_k A[k, j] $$ 取 $\max_i$ 和 $\min_j$： $$ \max_i \min_k A[i, k] \leq \min_j \max_k A[k, j] $$

💡 直覺：

R 先選（被 C 看到）→ 收益最多 $VR$
C 先選（被 R 看到）→ 損失最多 $VC$
後手有優勢 → $VR \leq VC$

Saddle Point（鞍點）

Pure Equilibrium

定義

Saddle point： 位置 $(i^*, j^*)$ 滿足： $$ A[i^*, j^*] = \max_i \min_j A[i, j] = \min_j \max_i A[i, j] $$ 即：$VR = VC$ 等價條件： 1. $A[i^*, j^*] = \max_i A[i, j^*]$ （該行最大） 2. $A[i^*, j^*] = \min_j A[i^*, j]$ （該列最小）

鞍點的意義

若遊戲有 saddle point：

純策略 Nash 均衡
雙方都沒有動機偏離
遊戲已「解決」（solved）

範例：有 Saddle Point 的遊戲

	C1	C2	C3	Row Min
R1	3	2	5	2
R2	1	0	4	0
R3	-1	1	3	-1
Col Max	3	2	5

Row Min 最大：2（R1 列）
Col Max 最小：2（C2 行）
$VR = VC = 2$，位置 $(R1, C2)$ 是 saddle point
最優策略： R 選 R1，C 選 C2，遊戲值 = 2

沒有 Saddle Point

範例：剪刀石頭布（無 Saddle Point）

	石頭	剪刀	布	Row Min
石頭	0	1	-1	-1
剪刀	-1	0	1	-1
布	1	-1	0	-1
Col Max	1	1	1

$VR = \max(-1, -1, -1) = -1$
$VC = \min(1, 1, 1) = 1$
$VR < VC$ → 無 saddle point
需要 mixed strategy（隨機策略）！

為什麼需要 Mixed Strategy？

Pure Strategy 的限制

可預測性問題

如果總是用 pure strategy：

對手可以觀察/預測你的選擇
對手可以完美反制
你的期望收益 $\leq VR$（可能更糟）

例子：配對硬幣

Matching Pennies

	Head	Tail
Head	1	-1
Tail	-1	1

R 想配對成功（收益 +1）
C 想配對失敗（損失 -1）
$VR = -1$，$VC = 1$ → 無 saddle point

Pure strategy 失敗：

若 R 總選 Head → C 選 Tail → R 收益 -1
若 R 總選 Tail → C 選 Head → R 收益 -1

解決： R 隨機選（50% Head, 50% Tail）

C 無論選什麼，R 的期望收益 = 0

Mixed Strategy 的優勢

不可預測性：

對手無法完美反制
保證至少拿到遊戲的「真實價值」

下一篇： von Neumann Minimax Theorem、Yao’s Principle

VR 與 VC 的計算

演算法

計算 VR（maxmin）： ``` VR = -\infty for i = 1 to m: row_min = min_j A[i, j] VR = max(VR, row_min) ``` 計算 VC（minmax）： ``` VC = +\infty for j = 1 to n: col_max = max_i A[i, j] VC = min(VC, col_max) ``` 檢查 Saddle Point： ``` if VR == VC: 找到對應的 (i*, j*) return "Saddle point at (i*, j*), value = VR" else: return "No saddle point, need mixed strategy" ```

複雜度

計算 VR：$O(mn)$
計算 VC：$O(mn)$
總時間：$O(mn)$

總結

賽局論基礎為隨機演算法分析提供框架：

Zero-sum game： 完全對抗，總和為 0
Payoff matrix： 描述所有策略組合的收益
VR (maxmin) 與 VC (minmax)：
- $VR \leq VC$ 恆成立
- 若 $VR = VC$ → 有 saddle point
Saddle point：
- Pure strategy 已足夠
- 遊戲已解決
無 saddle point：
- 需要 mixed strategy（隨機化）
- von Neumann Minimax Theorem 保證解存在

下一步： Mixed strategy、von Neumann 定理、Yao’s Principle

參考資料

von Neumann & Morgenstern, Theory of Games and Economic Behavior
Motwani & Raghavan, Randomized Algorithms, Chapter 2
Osborne, An Introduction to Game Theory