next up previous
Next: 確率モデル Up: ブートストラップ法の幾何学とスケール変換 Previous: はじめに


ブートストラップ法

データ $ x_1,\ldots,x_n$ の各要素は独立同分布に従う確率変数の実現値とする. その期待値$ \mu$ の推定値は平均 $ \bar x=(x_1+\cdots+x_n)/n$ によって与えられ る.$ \bar x$ のバラツキを調べるために,データと同じ確率分布に従う確率変数 の実現値を擬似乱数を使って生成したものを,複製データ $ x^*_1,\ldots,x^*_n$ とする.ただし$ \mu$ は未知なので,$ \mu$ の役割を$ \bar x$ で置き換えて生成す る.この手続きを多数回繰り返し実行して, $ \bar x^*=(x^*_1+\cdots+
x^*_n)/n$ のバラツキを観測することにより,$ \bar x$ のバラツキが推測できる.

ここではデータの確率モデルを仮定してそれを利用しているので,この手法は パラメトリック・ブートストラップ法と呼ばれる.一方,通常のブートストラッ プ法はモデルを仮定せずに, $ x_1,\ldots,x_n$ からランダムに重複を許して$ n$ 個の要素を取り出して $ x^*_1,\ldots,x^*_n$ を生成する.以降の議論はすべてパ ラメトリック・ブートストラップ法を用いるが,これは現実のデータ解析に通常 のブートストラップ法を適用する一連の手続きを,簡略にモデル化していると考 える.




平成16年7月12日