「外れ値」の版間の差分
削除された内容 追加された内容
編集の要約なし |
|||
5行目:
==検定==
外れ値かどうか[[仮説検定|検定]]したい標本について、[[偏差]]を不偏[[標準偏差]]で割った[[検定統計量]]
:<math>
を求め(''x''{{sub|1}} は標本値、''μ'' は[[平均]]、''σ'' は標準偏差)、この値([[両側検定]]をする場合はこの[[絶対値]])が有意点より大きいかどうかで検定する。
簡単な方法では、2または3を有意点とする。つまり、''μ'' ± 2–3 ''σ'' の外なら外れ値とする。
===スミルノフ・グラブス検定===
より精密には、[[正規分布]]を仮定して、スミルノフ・グラブス ({{en|Smirnov‐Grubbs}}) 検定を使う。標本数を ''n''、所要の[[有意水準]]を ''α''、[[自由度]] ''n'' - 2 の[[t分布]]の ''α'' / ''n'' × 100 [[パーセンタイル]]を ''t'' として、 :<math> \tau = \frac{ (n - 1) t } \sqrt{ n(n - 2 + t ^ 2 ) } </math>
を有意点とする。この式は[[再帰的]]に使う。つまり、最も外れた1標本のみを検定し、それが外れ値と判定されたら、それを除外した ''n'' - 1 個の標本を使って2番目に外れた標本を検定し、以下、外れ値が検出されなくなるまで繰り返す。
===トンプソン検定===
トンプソン ({{en|Thompson}}) 検定では、
:<math>t = \frac{ \tau \sqrt{n - 2} } \sqrt{ n - 1 - \tau ^ 2 } </math>
を使う。計算式の都合上、スミルノフ・グラブス検定とは逆に、標本値の検定統計量 ''τ''{{sub|1}} から ''t''{{sub|1}} を経て有意水準 ''α''{{sub|1}} を求めることが多い。''n'' が十分大きければスミルノフ・グラブス検定と同じ結果になる。
==外部リンク==
|