現在位置 : 統計WEB | コラム | 2010年1-2月

コラム 『統計備忘録』 バックナンバー

2009年 | 2010年 1-2月 | 3-4月 | 5-9月 | 10-11月 | 2011年 

第83話 「幾つデータが必要か? - 比率の差の検定」

前回は2群の平均値の差の検定についてサンプルサイズ(n)を幾つにするか計算式を紹介しましたが、今回は比率の差の検定のときに n を幾つ以上にしたらよいかを求めてみましょう。

計算式は次の通りです。この式も、有意水準を5%としたときに、対立仮説が正しい(2群の比率は等しくない)ときは80%の検出力で有意判定を行えるよう n を求めています。P1、P2 は事前に想定する各群の比率です。式中の P は P1 と P2 を足して 2 で割った値です。



必要なサンプルサイズ

pの計算


例えば、逆上がりの授業で、飯田・根本式段階別さか上がり練習法を取り入れてその効果を検証するといった場合にあてはめてみましょう。

飯田・根本式により逆上がりをマスターする子供が 80%以上、従来の練習法ではマスターする子供が 40%以内に留まると想定しているのなら、P1 に 0.8、P2 に 0.4 を、P には 0.6 を式に代入します。計算すると n は 24 です。




必要なサンプルサイズ2



したがって、検証実験を行うには、逆上がりをできない子供を 48人集めて無作為に 24人ずつの2つのグループに振り分けます。片方のグループは飯田・根本式で、もう一方のグループは従来の練習法で指導します。練習後に、各グループの逆上がりをマスターした子供の比率を調べて2グループの比率の差を検定すれば良いのです。


2010.1.8



第84話 「幾つデータが必要か? - 相関係数の有意性検定」

相関係数の統計的有意性の検定は「無相関の検定」と呼ばれています。相関係数がゼロである(=無相関)ことを帰無仮説としていることからこの名前が付いています。この検定についても、必要なサンプルサイズ(n)をざっくり計算できます。式は次の通りです。



必要なサンプルサイズ



r は相関係数です。|r| は相関係数の絶対値を表します。


母相関係数が 0.4以上と想定している場合に、80%以上の確率で有意判定ができるような n を計算すると 24 になります。24組のデータが必要ということです。




相関係数が0.4なら


2010.1.19



第85話 「幾つデータが必要か? - 測定の信頼性による補正」

昨年末から3回に亘って必要なサンプルサイズの計算式を紹介してきましたが、この式で求められた n だけデータを集めれば良いということではなく、多少上積みをしておきます。

通常、どんな測定方法を用いても、測定対象の真の値から幾らかのずれがあります(体重測定の結果や、テストの点数など思い浮かべてみてください)。そのため、標本を測定して得たデータから求めた分散は、真の値の分散に測定誤差の分散が加わったものになります。平均値の差の検定では、差を標準誤差で割り t値を求めて有意判定を行っています。分散が膨らむということは、標準誤差が大きくなるということですから、結果として t 値を下げ、有意差が検出力されにくくなります。

測定値の分散に占める真の値の分散の比率を、信頼性の級内相関係数 intraclass correlation coefficient of reliability と言います。この値で、必要なサンプルサイズの計算式で得られた n を割り、新たに n' を求めます。n' をサンプルサイズをとして実験計画を組めば、測定の誤差による信頼性の低下を補うことことができます。

測定値の分散、真の値の分散、測定誤差の分散、3つの分散のうち2つが決まれば、測定の信頼性を評価することができます。3つ目の測定誤差の分散については、簡単な実験で推定してみましょう。まず、同じ対象を何度か測定し平均値を求めます。測定の誤差が正規分布に従うなら、平均値は真の値に近いものになります。したがって、測定値と平均値の差は測定の誤差と考えることができます。次に、対象を変えて同じように誤差を求めます。これを繰り返して誤差データを蓄積すれば測定誤差の分散が求まります。


2010.2.23


「幾つデータが必要か?」で参考にした書籍
8284話]
ジェフリー・R. ノーマン , デビッド・L. ストレイナー(中野正孝, 宮崎有紀子 , 本多正幸 , 野尻雅美訳), 2005,
論文が読める!早わかり統計学』, メディカルサイエンスインターナショナル
[85話]
J.L.フライス(KR研究会訳), 2004, 『臨床試験のデザインと解析』, アーム

必要なサンプルサイズに詳しい本
永田靖, 2003, 『サンプルサイズの決め方』, 朝倉書店
豊田秀樹編著, 2009, 『検定力分析入門』, 東京図書


追記 2010.3.24

必要なサンプルサイズに詳しい本 2
山口拓浩, 2010, 『サンプルサイズの設計』, 健康医療評価研究機構(iHope)


追記 2011.5.16


第86話 「無相関の検定 - 相関係数の有意性を検定する」

第84話をアップして以来、「相関係数の有意性検定」を調べている方のアクセスが増えているので、Excelを利用した検定の方法についても書いておきます。

相関係数の有意性検定は、「母相関係数が 0 である」を帰無仮説としています。「母相関係数が 0 」ということは2つの変数が独立している、「無相関」ということです。このことから相関係数の有意性検定のことを「無相関の検定」と言います。 計算の結果、P値が有意水準を下回れば、帰無仮説が棄却され、無相関では無いだろうということになります。

検定方法はいたって簡単です。

1) correl関数を使って相関係数(r)を求める。
2) 相関係数(r)とサンプルサイズ(n)から、検定統計量(t)を求める。
3) tdist関数を使って P値を求める。

次の例では、A,B、2つの変数について無相関の検定を行っています。無相関の検定のサンプルサイズは対の数ですから、n は 8 になります。


無相関の検定


相関係数が 0.785 もあると、サンプルサイズがたったの 8 でも、P値は 0.021 と 5%の有意水準で有意判定ができます。

さて、Excelで検定を行う場合の注意すべきは欠損値の有無です。Excelは関数によって欠損値の対応が異なります。correl関数は対になっていないケースを自動的に外して計算するので、欠損値があってもエラーになりません。Excelで検定する際は、欠損が無い有効な対だけ数えておいて n とします。エクセル統計を使うなら、欠損値の対応がプログラムに組み込まれているので、こういう気遣いは無用です。







2010.2.23



次のコラムへ

最新のコラムへ

タイトル一覧へ  タイトル一覧(カテゴリー別)へ

統計WEB

主催:社会情報サービス統計調査研究室

Google
ウェブ検索
サイト内検索