エクセル統計やMicrosoft(R)Excel を使って、実際にデータ分析を行うための知識やアイデアを紹介します。
以下の索引をクリックするとその行の用語とその説明が表示されます。
:このマークは、Excel に用意された関数により計算できることを示しています。
:このマークは、エクセル統計2006以降に解析手法が搭載されていることを示しています。
:このマークは、秀吉Dplusに解析手法が搭載されていることを示しています。
※「エクセル統計」、「秀吉Dplus」は株式会社社会情報サービスのソフトウェア製品です
→ 赤池情報量基準
重回帰分析
工程を欠点数によって管理するための管理図。検査する群の大きさが一定の場合に用いる。
cf. u管理図
信頼区間を意味する。95%信頼区間なら「95%CI」と表記できる。
→ 管理線
Cox比例ハザードモデル(2008以降)
生存時間分析のためのノンパラメトリックな手法のひとつで、比例ハザードモデルともいう。生存時間データのほかに年齢や性別などの共変量を用いることで、共変量が生存時間に与える影響を調べることができる。
Cox比例ハザードモデル(2008以降)
F分布を用いた検定の総称。等分散性の検定や分散分析で用いられる。
FDIST, FTEST
カイ二乗分布に従う2変数の比であり、分散の分析に用いられる。自由度(m1, m2)のF分布は次の式で表される。Γ()はガンマ関数。

⇒ F分布のグラフの作り方(Excel ファイルのダウンロード)
FDIST, FINV
→ 偽陰性率
→ 偽陽性率
→ 四分位範囲
→ 管理線
もっとも規模の小さい直交表で、2水準の要因が3つあるときの実験に適用される。表内の数字は各要因の水準を表していて、任意の2要因間の水準の組み合わせが均等になるように配置されている。
| 列番号 | 1 | 2 | 3 |
|---|---|---|---|
| 実験1 | 1 | 1 | 1 |
| 実験2 | 1 | 2 | 2 |
| 実験3 | 2 | 1 | 2 |
| 実験4 | 2 | 2 | 1 |
2水準系の直交表のひとつで、2水準の要因を最大7つまで適用できる。表内の数字は各要因の水準を表していて、任意の2要因間の水準の組み合わせが均等になるように配置されている。
| 列番号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
|---|---|---|---|---|---|---|---|
| 実験1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
| 実験2 | 1 | 1 | 1 | 2 | 2 | 2 | 2 |
| 実験3 | 1 | 2 | 2 | 1 | 1 | 2 | 2 |
| 実験4 | 1 | 2 | 2 | 2 | 2 | 1 | 1 |
| 実験5 | 2 | 1 | 2 | 1 | 2 | 1 | 2 |
| 実験6 | 2 | 1 | 2 | 2 | 1 | 2 | 1 |
| 実験7 | 2 | 2 | 1 | 1 | 2 | 2 | 1 |
| 実験8 | 2 | 2 | 1 | 2 | 1 | 1 | 2 |
3水準系の直交表のひとつで、3水準の要因を最大4つまで適用できる。表内の数字は各要因の水準を表していて、任意の2要因間の水準の組み合わせが均等になるように配置されている。
| 列番号 | 1 | 2 | 3 | 4 |
|---|---|---|---|---|
| 実験1 | 1 | 1 | 1 | 1 |
| 実験2 | 1 | 2 | 2 | 2 |
| 実験3 | 1 | 3 | 3 | 3 |
| 実験4 | 2 | 1 | 2 | 3 |
| 実験5 | 2 | 2 | 3 | 1 |
| 実験6 | 2 | 3 | 1 | 2 |
| 実験7 | 3 | 1 | 3 | 2 |
| 実験8 | 3 | 2 | 1 | 3 |
| 実験9 | 3 | 3 | 2 | 1 |
中央値(Median)の管理図と範囲(R)の管理図を組み合わせた管理図。長さや重さなどの計量値が対象から複数得られる場合に用いる。x-R管理図やx-s管理図に比べて現場で使いやすいが、異常を発見する力は劣る。
絶対リスク減少率(APR)の逆数。日本語では要治療数などと訳される。ある治療法を採用しない場合の死亡率が25%、採用した場合の死亡率が20%のとき、絶対リスク減少率は5%、NNTは1/0.05=20となる。これは、今までより1人多く命を救うためには、さらに20人の患者を治療する必要があることを示している。したがって、NNTが小さいほど効果は高い。
工程を不良個数によって管理するための管理図。検査する群の大きさが一定の場合に用いる。
cf. p管理図
Not signihicant(有意ではない)の略語
工程を不良率によって管理するための管理図。検査する群の大きさが一定でないため、不良個数では管理できない場合に用いる。
cf. np管理図
統計的仮説検定において、帰無仮説の元で検定統計量がその値となる確率のこと。P値が小さいほど、検定統計量がその値となることはあまり起こりえないことを意味し、一般的にP値が5%または1%以下の場合に帰無仮説を偽として棄却し、対立仮説を採択する。
検査や診断薬の性能を2次元のグラフに表したもの。当該検査で異常と正常を区別するカットオフポイントごとに真陽性率(=TPF)と偽陰性率(=FPF)を計算し、縦軸にTPF、横軸にFPFをとった平面にプロットして線で結んで表す。

ROC曲線(2008以降)
統計的方法を応用した品質管理のこと。特定の統計手法を指す言葉ではない。抜き取り検査を行い管理図を作成して品質が安定しているかをチェックしたり、実験計画法やタグチ・メソッドに則った実験によって品質の改善ポイントを究明したりなど多岐にわたる。
統計的仮説検定のうち、t分布を用いる検定の総称。ただし、一般的に2群の平均値の差の検定を指すことが多い。
⇒ 統計解析事例 | 対応のない2群の平均値の差の検定
⇒ 統計解析事例 | 対応のある2群の平均値の差の検定
TDIST, TTEST
対応のない2群の差の検定(2006/2008) / 2群の母平均の差の検定(2010), 対応のある2群の差の検定(2006/2008) / 2群の母平均の差の検定(2010)
→ 偏差値(T得点)
PERCENTRANK, STANDARDIZE
データ変換(2008以降)
正規分布に似ているが、正規分布は定義の中で母数を用いるのに対してt分布は不偏推定量を用いる。自由度を大きくすると正規分布に近付く。自由度mのt分布は次の式で表される。Γ()はガンマ関数。

⇒ t分布のグラフの作り方(Excel ファイルのダウンロード)
TDIST, TINV
→ 真陰性率
→ 真陽性率
工程を単位あたりの欠点数によって管理するための管理図。検査する群の大きさが一定でないため、欠点数では管理できない場合に用いる。
cf. c管理図
→ 管理線
独立変数間の多重共線性を検出するための指標のひとつ。独立変数間の相関係数行列の逆行列の対角要素であり、値が大きい場合はその変数を分析から除いた方がよい。10を基準とすることが多い。
重回帰分析(2008以降)
平均値(x)の管理図と範囲(R)の管理図を組み合わせた管理図。長さや重さなどの計量値が対象から複数得られる場合に用いる。
平均値(x)の管理図と標準偏差(S)の管理図を組み合わせた管理図。長さや重さなどの計量値が対象から複数得られる場合に用いる。
各測定値(X)の管理図と移動範囲(Rs)の管理図を組み合わせた管理図。長さや重さなどの計量値が対象から1つしか得られない場合に用いる。
→ 標準得点
STANDARDIZE
基準値と偏差値(2006) / データ変換(2008)
→ 偏差値(Z得点)
STANDARDIZE
基準値と偏差値(2006) / データ変換(2008)