3.4 ベイズモデル比較
単純なモデルで得られるデータ集合は多様性に乏しい:例えばであれば得られるデータ集合は (+ランダムノイズ)。であれば得られるデータ集合は直線に乗るもの(+ランダムノイズ)。
複雑なモデルでは多様なデータ集合が得られるがそのため特定のデータ集合が得られる確率は低くなる。
(3.73)は対数を取ったベイズ因子の(モデルに従う)データ集合に関する期待値。。これが>0より平均的に。
3.5 エビデンス近似
エビデンス近似:パラメータwだけに関して積分して周辺尤度関数を得る。これを最大にするように超パラメータの値を決める。
事前分布が平坦→定数として扱う→を最大にするでの最大値が得られる。
・に関して周辺化して予測分布を得る(3.74)
・を固定してを周辺化して予測分布を得る(3.75)
・事後分布を最大にするを得たい。→(3.76)からを最大にすることで得られる。(は比較的平坦とする)
比は正則化パラメータと同様の働きをする:(3.55)参照
3.5.1 エビデンス関数の評価
エビデンス関数(3.77)の対数表現は(3.86)。導出はおおむね演習問題で。
(3.83):より
(3.86)は(3.72)に対応(とtが対応?)
3.5.2 エビデンス関数の最大化
が変化しないのでの固有ベクトルも変化しない。
より
3.5.3 有効パラメータ数
なら。が無限なら0。は間にある。
がと比較して十分大きいならの要素は0に近くなる。
(3.21):
(3.95):
図3.16:交点がとなる点。
(3.92)
(3.95)
の時(3.98),(3.99)