trsing’s diary

勉強、読んだ本、仕事で調べたこととかのメモ。

PRMLメモ 3章 3.3.1

3.3.1 パラメータの分布

(3.10)をwで整理する。 $$ \phi(x_{n})\phi(x_{n})^{T}= \begin{bmatrix} \phi_{0}^{n}\\ \vdots\\ \phi_{M -1}^{n} \end{bmatrix} \begin{bmatrix} \phi_{0}^{n} & \cdots & \phi_{M -1}^{n} \end{bmatrix}= \begin{bmatrix} \phi_{0}^{n}\phi_{0}^{n}&\cdots& \phi_{0}^{n}\phi_{M -1}^{n}\\ \vdots &\ddots&\vdots\\ \phi_{M -1}^{n}\phi_{0}^{n}&\cdots& \phi_{M -1}^{n}\phi_{M -1}^{n} \end{bmatrix} $$ \sum\phi(x_{n})\phi(x_{n})^{T}の(i+1,j+1)成分は\sum\phi_{i}^{n}\phi_{j}^{n}。 これは\Phi^{T}\Phiの(i+1,j+1)成分と同じだから $$ \sum\{w^{T}\phi(x_n)\}^{2}=\sum\{w^{T}\phi(x_{n})\phi(x_{n})^{T}w\}=w^{T}\{\sum\phi(x_{n})\phi(x_{n})^{T}\}w=w^{T}\Phi^{T}\Phi w $$ $$ \sum t_{n}w^{T}\phi(x_{n})=w^{T}\sum t_{n}\phi(x_{n})=w^{T}[\phi_{0}\,\cdots\,\phi_{M -1}]t=w^{T}\Phi^{T}t $$

モード(最頻値):分布が最大になるとこ。ガウス分布の場合平均値。

S_{0}=\alpha^{-1}I,\,\alpha\to0よりS_{0}^{-1}=\alpha I\to0S_{N}=1/\beta(\Phi^{T}\Phi)^{-1}m_{N}=(\Phi^{T}\Phi)^{-1}\Phi^{T}t

(3.53)(3.50):m_{0}=0,\,S_{0}=\alpha^{-1}Iとしたもの。

(3.55):p(w|t)\propto p(t|w)p(w|\alpha)p(t|w)は(3.10)。

前提条件
・元の関数f(x)=a_{0}+a_{1}x=-0.3+0.5x
・訓練データt_{n}=f(x)+noise ・ノイズは標準偏差0.2のガウス分布
・ノイズの分散は既知
・パラメータ\alphaは2.0に固定。
目標
訓練データから秦のパラメータ値\alpha_{0},\,\alpha_{1}を復元する

図3.7
左:尤度関数p(t|x,w)wについてプロットしたもの
中:事前分布(2,3行目は一つ上の)x尤度関数
右:復元した関数(のうちの6個)。青は訓練データ点

(3.56):演習2.43がちょっと参考になる。