③ t分布による検定（１つの平均値） | 統計・確率の基本を理解したい！

１つの平均値の検定（t分布・母分散未知）

小標本と大標本のサンプルサイズｎの境界線は、どこにあるのかは厳密には計算によって算出するが、だいたいの目安はどこにあるのだろう？

「はじめての統計学（鳥居泰彦著）」では、概ねサンプルサイズｎ＝30に置いている。

t分布表の自由度＝∞を標準正規分布と見なしたときに、その時のtの臨界値、例えば有意水準（両側検定）＝0.05時の臨界値：1.960と各自由度の臨界値を較べてみると、以下のようになる。

こう見ると、自由度30で4％のズレと言うのは若干中途半端な感じもする。ただ、有意水準の「5％」という数字に合わせるならば、この辺の数字が妥当ということだろうか？

帰無仮説　\(\mu=50\)
対立仮説　\(\mu\neq50\)（両側検定）

\(X～N(\mu,\sigma^2)\)

\(\bar X～N(\mu,\frac{\sigma^2}{n})\)

\(Z=\frac{\bar X-\mu}{\sigma/\sqrt{n}}\)の\(\sigma\)が不明

そこで母分散\(\sigma^2\)の代わりに不偏分散\(\hat{\sigma^2}\)（シグマハット二乗）を使う。そうしてできた検定統計量tは、t分布に従う。

\(t=\frac{\bar X-\mu}{\hat{\sigma/}\sqrt{n}}\)

\(t=\frac{\bar X-\mu}{s/\sqrt{n-1}}\)

\(\alpha=0.05\)つまり５％とする。

平均\(\mu\)、不偏分散\(\hat{\sigma^2}\)が分かっているので、そこから標準偏差\(\hat{\sigma}\)を計算し、確率変数\(t\)を算出する。

有意水準\(\alpha\)とt分布表から臨界値を割り出し、棄却・採択の決定を行う。