next up previous
Next: 加速定数 Up: ブートストラップ法の幾何学とスケール変換 Previous: 不偏検定


マルチスケール・ブートストラップ法

数値例1. 正規モデル $ Y\sim N_p(\eta,\tau^2I_p)$ .球体 $ {\cal R}=\{\eta
: \Vert\eta\Vert^2 \le n \}$ .ただし$ p=4,n=10$ .観測データを $ \Vert y\Vert^2=26.80$ と すると, $ y\not\in{\cal R}$ である. $ \Vert y\Vert-\sqrt{n}=5.177-3.162=2.015$ が仮説 $ \eta\in{\cal R}$ を棄却するほど十分に大きいといえるか?

このとき $ n_1=3,6,10,15,21$ とサンプルサイズを変化させるとスケール $ \tau_1=\sqrt{n/n_1}$ のブートストラップ確率は

$\displaystyle \tilde\alpha_1(y,\tau_1)=0.0359,\, 0.0205,\, 0.0085,\, 0.0028,\,
0.0008
$

と変化する.特に $ \hat\alpha_0(y)=0.0085$ は1%以下であり,仮説を棄 却する十分な証拠があると判断する.

この簡単な例では$ \Vert Y\Vert^2$ が非心カイ二乗分布に従うことを利用して厳密に不 偏な確率値が計算できる.この値は $ \hat\alpha_\infty(y) =
\Pr\{\Vert Y\Vert\ge\Vert y\Vert;\eta\in\partial {\cal R}\} = 0.05$ であり,先ほどの $ \hat\alpha_0(y)$ の値は厳密値から大きく異なっていたことになる.

一般に$ \alpha$ 値から$ z$ $ =-\Phi^{-1}(\alpha)$ を定義する.ただし $ \Phi^{-1}(\cdot)$ は標準正規分布関数の逆関数である. 11節の議論によって, $ \tilde
z_1(y,\tau_1)=-\Phi^{-1}(\tilde \alpha_1(y,\tau_1)) $$ \tau_1$ の関係は 次式で表現されることが示される.

$\displaystyle \tilde z_1(y,\tau_1) \approx \hat v/ \tau_1 + \hat c \tau_1
$

ただし$ \approx$ は両辺の誤差が $ O(n^{-3/2})$ であることを表す.係数は幾何学 的な量を反映しており,$ \hat v$$ y$ $ \partial{\cal R}$ の距離を表し,$ \hat c$ $ \partial{\cal R}$ の曲率を表す.この理論式を実際に得られたブートストラップ確 率に当てはめて,$ \hat v$$ \hat c$ を回帰係数として推定すると, $ \hat v=2.002,\hat c = 0.385$ が得られる.

実は不偏な確率値の$ z$ $ \hat z_\infty(y)=-\Phi^{-1}(\hat
\alpha_\infty(y))$

$\displaystyle \hat z_\infty(y) \approx \hat v- \hat c
$

を満たすことが示せるので, $ \hat z_1(y)=\hat v- \hat c$ $ \hat\alpha_1(y)=\Phi(-\hat z_1(y))$ と定義して,先ほど推定した $ \hat v,\hat c$ を代入すると,

$\displaystyle \hat\alpha_1(y) = \Phi(-2.002 + 0.385) =
0.0529
$

が得られる.以上のようにスケールを変化させた複数個のブートストラップ確率 から高精度の確率値を計算する手続きをマルチスケール・ブートストラップ法と いう(Shimodaira 2002).正規モデルを仮定すると,任意の$ {\cal R}$ に対して $ \hat\alpha_1(y)$ は3次の精度になる.

$ \tilde z_1(y,\tau)$ を縦軸,$ 1/\tau$ を横軸にプロットすると,次式に示され るように,$ \tau=1$ における曲線の傾きが $ \hat z_1(y)$ になる.

$\displaystyle \frac{\partial \tilde z_1(y,\tau)}{\partial
(1/\tau)}\Bigr\vert _{\tau=1} \approx \hat z_1(y)
$

したがって,この方法はスケールを変化させたときのブートストラップ確率の変 化率から高精度確率値を計算しているといえる.




平成16年7月12日