1つの平均値の検定(t分布・母分散未知)
特徴
- 母分散:未知
- 標本数:小標本
- 目的:標本平均と母平均との間に統計的に有意な差があるかとうかを検定する。
大標本と小標本のサンプルサイズの境界はどこに?
小標本と大標本のサンプルサイズnの境界線は、どこにあるのかは厳密には計算によって算出するが、だいたいの目安はどこにあるのだろう?
「はじめての統計学(鳥居泰彦著)」では、概ねサンプルサイズn=30に置いている。
t分布表の自由度=∞を標準正規分布と見なしたときに、その時のtの臨界値、例えば有意水準(両側検定)=0.05時の臨界値:1.960と各自由度の臨界値を較べてみると、以下のようになる。
- 自由度:20⇒臨界値:2.086(93.9%)
- 自由度:30⇒臨界値:2.042(96.0%)
- 自由度:40⇒臨界値:2.021(97.0%)
- 自由度:60⇒臨界値:2.000(98.0%)
- 自由度:120⇒臨界値:1.980(99.0%)
こう見ると、自由度30で4%のズレと言うのは若干中途半端な感じもする。ただ、有意水準の「5%」という数字に合わせるならば、この辺の数字が妥当ということだろうか?
帰無仮説と対立仮説の設定
帰無仮説 \(\mu=50\)
対立仮説 \(\mu\neq50\)(両側検定)
検定統計量の選択
- 対象母集団は、平均\(\mu\)、分散\(\sigma^2\)の正規分布に従う確率変数\(X\)で表される。
\(X~N(\mu,\sigma^2)\)
- 対象母集団から無作為に標本を抽出した標本平均の標本分布も正規分布に従い、確率変数\(\bar X\)で表される。
\(\bar X~N(\mu,\frac{\sigma^2}{n})\)
- しかし、今回は\(\sigma^2\)が不明なので、帰無分布として標準正規分布を使うことができない。
- なぜならば、\(\sigma\)も不明なので、標準正規分布に従う確率変数\(Z\)が計算できない。
\(Z=\frac{\bar X-\mu}{\sigma/\sqrt{n}}\)の\(\sigma\)が不明
- そこで母分散\(\sigma^2\)の代わりに不偏分散\(\hat{\sigma^2}\)(シグマハット二乗)を使う。そうしてできた検定統計量tは、t分布に従う。
\(t=\frac{\bar X-\mu}{\hat{\sigma/}\sqrt{n}}\)
- 不偏分散\(\hat{\sigma^2}\)が不明の時は、標本分散\(s^2\)を用いて計算する。
\(t=\frac{\bar X-\mu}{s/\sqrt{n-1}}\)
有意水準の決定
\(\alpha=0.05\)つまり5%とする。
統計検定量の実現値を算出する。
平均\(\mu\)、不偏分散\(\hat{\sigma^2}\)が分かっているので、そこから標準偏差\(\hat{\sigma}\)を計算し、確率変数\(t\)を算出する。
帰無仮説の棄却・採択を決定する。
有意水準\(\alpha\)とt分布表から臨界値を割り出し、棄却・採択の決定を行う。
2つの平均値の比較(独立、t分布、母分散未知)
コメント