tkenichi の日記

毒舌皮肉系恥さらし日記

Courant の min-max 原理を見直してみる

f:id:tkenichi:20101127124356j:image

n次実対称行列Aの固有値\lambda_1 \geq \lambda_2 \geq \cdots \geq \lambda_nとする。Rayleigh 商をQ_A(x) = \frac{x^{T}Ax}{x^{T}x}とおいたときに、

 \max_{\dim V = k} \min_{x \in V\setminus\{0\}} Q_A(x) = \lambda_{k}

 \min_{\dim V = k} \max_{x \in V\setminus\{0\}} Q_A(x) = \lambda_{n-k+1}

がいわゆる min-max 原理である。ここで最初の最大、最小をとるのは、n次元ベクトル空間のk次元部分空間なので、Grassmann 多様体上の最大、最小と考えてよい。ここではもう少し明示的に、部分空間の正規直交フレームを与えるとして、Stiefel 多様体上の最大、最小と考えてみる。Stiefel 多様体は、k個の正規直交するベクトルを並べて n \times k の行列と考えることができるから、

 V_{n,k} = \{ R \in \mbox{Mat}(n,k) | R^{T} R = 1_k \}

と書ける。このとき、y を k 次元空間のベクトルとして、

 \max_{\dim V = k} \min_{x \in V\setminus\{0\}} Q_A(x) = \max_{R \in V_{n,k}} \min_{y \neq 0} Q_{R^{T}AR}(y)

である。そこで、固有値問題を解くための数値解析法を Stiefel 多様体上の(離散)力学系のように解釈しなおしたら面白いのではないだろうか?