エクセル統計やMicrosoft(R)Excel を使って、実際にデータ分析を行うための知識やアイデアを紹介します。
現在位置 : 統計WEB|統計Tips|必要なサンプルサイズ|対応のない2群の母平均の差の区間推定
これから集める2つのサンプルにおいて、 何らかの測定値の平均値の2サンプル間の差が、 ある程度の範囲内で収まるために必要なサンプルサイズ(n)を 誤差、信頼度、標準偏差を指定することで求めることができます。 ただし、2つの母集団の母分散は等しく、かつ2つのサンプルのサンプルサイズは等しい(n1=n2=n)とします。
入力には半角数字を用いて、それぞれの範囲内の値で指定してください。 入力した値によっては計算に時間がかかる場合があります。 その場合はブラウザの「読み込み中止」を選択後、ページ最下部にある Excel ファイルをダウンロードしてお試し下さい。 → 最下部へ移動
参考文献
2群の母平均の差が、上下にどの程度の範囲内に収まって欲しいかを表します。 例えば2群の母平均の差を5程度としているなら、母平均の差が5±δの範囲内に収まることを目標とします。
例えば、2群の母平均の想定している差をd、誤差を5、信頼度を90%としたとき、 これは100回中90回は2群の母平均の差がd±5の範囲内に収まることを意味します。
今、母集団の分散はわかりませんが、母集団の分散がわからないからと言って その値を設定せずにサンプルサイズを設計することはできません。 標準偏差の値は、予備調査のデータや過去に行われた類似調査のデータ、 または何らかの情報に基づく予測値を用います。
母分散がわからない場合の対応のない2群の母平均の差の区間推定は以下の式で行われます。

ここで、μ1、μ2は群1と群2の母平均、 x1、x2は各サンプル平均、 αは1−信頼度、n1、n2は各サンプルサイズ、 Vは不偏分散、 t(n, P)は自由度nのt分布の両側100P%点を表します。 (μは「ミュー」と読みます。)
n1=n2=nとすると、区間幅は
であり、この式には確率変数Vが含まれていることから、 区間幅の期待値が一定値2δ以下となるようにサンプルサイズを設計します。
(1)

と変形することができます(参考文献を参照)。 σは母標準偏差、Γ(・)はガンマ関数で、このときφ(ファイ)はφ=2n-2です。
これを(1)式に戻し、さらにフォームに入力した標準偏差σ0を用いてσ=σ0とすると、
(2)
となります。ここで、
とおきます。zPは標準正規分布の上側100P%点です。 これを用いて(2)式をnについて解くと、

となります。この式の右辺を初期値としてnを1ずつ大きくしていき、(2)式を満たす最小のnが必要なサンプルサイズとなります。
誤差を変化させたときのサンプルサイズの変化
信頼度と標準偏差の値を固定して誤差の値を変化させてみると、 右のグラフのように誤差を小さくするほど必要なサンプルサイズが増えることが見て取れます。
信頼度を変化させたときのサンプルサイズの変化
誤差と標準偏差の値を固定して信頼度の値を変化させてみると、 右のグラフのように信頼度を高くするほど必要なサンプルサイズが増えることが見て取れます。
標準偏差を変化させたときのサンプルサイズの変化
誤差と信頼度の値を固定して標準偏差の値を変化させてみると、 右のグラフのように標準偏差を大きくするほど必要なサンプルサイズが増えることが見て取れます。
この統計TipのExcelファイルのダウンロードはこちらから → cgi_3.xls
※ このファイルはサンプルサイズを計算するためのマクロを含んでいます。
→ トップに戻る