現在位置 : 統計WEB | 統計用語集 | ハ行

統計用語集

以下の索引をクリックするとその行の用語とその説明が表示されます。

Excel の関数が用意されています:このマークは、Excel に用意された関数により計算できることを示しています。

エクセル統計2006以降に搭載しています:このマークは、エクセル統計2006以降に解析手法が搭載されていることを示しています。

秀吉Dplusに搭載しています:このマークは、秀吉Dplusに解析手法が搭載されていることを示しています。

「エクセル統計」「秀吉Dplus」株式会社社会情報サービスのソフトウェア製品です



パーセンタイル
percentile

データを小さい順に並べたとき、初めから数えて全体の100α%に位置する値を100αパーセンタイルと言う(0 ≤ α ≤ 1)。65パーセンタイルであれば、最小値から数えて65%に位置する値を指す。第一四分位数は25パーセンタイル、中央値は50パーセンタイル、第三四分位数は75%パーセンタイルである。

Excel の関数が用意されていますPERCENTILE, QUARTILE

このページのトップに戻る

パーセンタイル順位
percentile rank

データを小さい順に並べたとき、値の順位を百分率で表したもの。最小値の順位を0、最大値の順位をデータ数-1としたとき、パーセンタイル順位は(その値の順位) / (データ数-1)で求めることができる。

Excel の関数が用意されていますPERCENTRANK

エクセル統計2006以降に搭載していますデータ変換(2008以降)

このページのトップに戻る

バートレットの検定
Bartlett's test

等分散性の検定の一つ。帰無仮説「複数の正規母集団のグループの母分散が互いに等しい」についての検定。

統計解析事例 | 一元配置分散分析と多重比較

エクセル統計2006以降に搭載しています一元配置分散分析・多重比較(2006) / 分散分析・多重比較(2008以降)

このページのトップに戻る

バイアス
bias

母集団から抽出した標本の分布が、母集団の分布と比べて偶然ではないずれを起こしているとき、バイアスがあると言う。バイアスは標本抽出の方法や測定の方法によって生じることが多く、前者は選択バイアスに、後者は情報バイアスに分類される。

このページのトップに戻る

バイコーティマックス法
bi-quartimax method

因子分析の因子軸の回転におけるオーソマックス法の1つ。

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

バイコーティミン法
bi-quartimin method

因子分析の因子軸の回転におけるオブリミン法の1つ。

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

箱ひげ図
box plot / box-and-whisker plot

データの分布やばらつきをわかりやすく表現するためのグラフ。長方形の箱とその両端から伸びるひげで表現される。分布上の5つの統計量を示すことができ、一般的には最小値、第一四分位数中央値第三四分位数、最大値を表すことが多い。

箱ひげ図

統計Tips | 箱ひげ図の作り方(株価チャート編)

統計Tips | 箱ひげ図の作り方(棒グラフ編)

統計解析事例 | 箱ひげ図

エクセル統計2010に搭載しています箱ひげ図

このページのトップに戻る

ハザード
bias

ある時点まで生存した条件下で、次の極めて微小な時間で死亡する確率のこと。瞬間死亡率ともよばれる。ハザードは下式のハザード関数で表すことができる。(Tは生存時間を表す確率変数、tを任意の時間を表す)

ハザード

エクセル統計2010に搭載していますCox比例ハザードモデル(2008以降)

このページのトップに戻る

外れ値
outlier

得られた観測値の中で、真の値の推定値からの残差が異常に大きい値のこと。外れ値の原因や理由が分かっている場合はその外れ値を異常値と言うことがある。

統計解析事例 | 外れ値検定

エクセル統計2006以降に搭載しています外れ値検定

このページのトップに戻る

パネル調査
panel research

調査対象者を一定期間固定し、同じ調査票で継続的に何度か実施する調査のこと。時系列変動を把握できるのが特徴。

アドホック調査

このページのトップに戻る

バリマックス法
varimax method

因子分析の因子軸の回転におけるオーソマックス法の1つ。

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

パレート図
Pareto chart

度数の多い項目から順に並べた縦棒グラフに累積相対度数を表した折れ線グラフを図示した複合グラフ。品質管理や在庫管理等で用いられる。

パレート図

エクセル統計2006以降に搭載しています数量データ 度数分布(2006 / 2008) / 度数分布とヒストグラム(2010以降)

このページのトップに戻る

範囲
range

レンジ。観測値の最大値と最小値の差。

統計解析事例 | 記述統計量

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006 / 2008) / 記述統計量(2010以降)

このページのトップに戻る

判別的中率
percentage of correct classifications

全観測値数に占める、観測値とモデルの予測結果が一致した数の割合。(一致したデータの個数 / 全体のデータ個数)×100(%)で求められる。

エクセル統計2010に搭載しています判別分析, 多項ロジスティック回帰分析(2012以降), 条件付きロジスティック回帰分析(2012以降)

エクセル統計2010に搭載しています順序回帰分析(2015), 数量化2類(2012以降)

このページのトップに戻る

判別得点
discriminant score

判別分析により得られた判別関数式に説明変数をあてはめた値。

エクセル統計2010に搭載しています判別分析

このページのトップに戻る

判別分析
discriminant analysis

あらかじめどのサンプルがどの群に属するのかというデータをもとに、どの群に属するのかわからないサンプルがどの群に属するのかを判別する関数を求める手法。p個の説明変数xがあるとき、各説明変数に対する推定された係数をa-hat、その線形結合の値をzとすると、以下の式から群の判別を行うことができる。

判別分析

統計解析事例 | 2群の判別分析

統計解析事例 | 多群の判別分析

エクセル統計2006以降に搭載しています判別分析

秀吉Dplusに搭載しています多変量解析 | 判別分析

このページのトップに戻る

ピアソンの積率相関係数
Pearson product-moment correlation coefficient

2つの量的変数間の直線的関連の程度を表す係数で、いわゆる相関係数のことを示す。n組のデータ (x1, y1), (x2, y2), …, (xn, yn) があり、それぞれの平均をx, yとしたとき、ピアソンの積率相関係数rxyは以下の式で表される。

ピアソンの積率相関係数

ここでsxはxの標準偏差を、syはyの標準偏差を、sxyはxとyの共分散を表す。

統計解析事例 | 相関行列・偏相関行列

Excel の関数が用意されていますCORREL, PEARSON, RSQ

エクセル統計2006以降に搭載しています相関行列・偏相関行列(2012以前) / 相関行列と偏相関行列(2015)

秀吉Dplusに搭載しています多変量解析 | 相関分析

このページのトップに戻る

比尺度
ratio scale

名義尺度順序尺度間隔尺度の性質に加えて、絶対原点が存在する尺度。比例尺度とも言う。身長や体重、時間、速度などは比尺度である。比尺度では、比尺度間の比になんらかの意味が存在する。(例:距離 / 時間 = 速度)

このページのトップに戻る

ヒストグラム
histogram

量的データ度数分布をグラフで表したもの。縦軸は度数、横軸は階級を表した縦棒グラフで、各棒の間隔は詰めて表現される。

ヒストグラム

統計Tips | ヒストグラムの作り方

統計解析事例 | 正規確率プロットと正規性の検定・度数分布とヒストグラム

統計解析事例 | 度数分布とヒストグラム

エクセル統計2006以降に搭載しています数量データ 度数分布(2006 / 2008) / 度数分布とヒストグラム(2010以降)

秀吉Dplusに搭載していますクイック統計 | 度数分布 | NA

このページのトップに戻る

被説明変数
dependent variable

目的変数

このページのトップに戻る

標準化
standardization

平均が0、分散が1となるようにデータを変換すること。正規化、基準化とも言う。サンプルデータの任意の値xは、サンプルの平均値(x)と標準偏差(s)を用いて以下の式により標準化される。

標準化

Excel の関数が用意されていますSTANDARDIZE

エクセル統計2006以降に搭載しています基準値・偏差値(2006) / データ変換(2008以降)

このページのトップに戻る

標準誤差
standard error

標本から測定された統計量の標準偏差であり、標本統計量の精度を表す。その中でも特に標本平均の標準偏差を指すことが多い。この標本平均の標準誤差(standard error of the mean / SEM)は、標準偏差をサンプルサイズの平方根で割ることで求められる。

統計解析事例 | 記述統計量

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

標準正規分布
standard normal distribution

平均が0、分散が1の正規分布のこと。標準正規分布は以下の式で表される。

標準正規分布

統計Tips | 正規分布曲線のグラフの作り方

Excel の関数が用意されていますNORMSDIST, NORMSINV

このページのトップに戻る

標準得点
standard score

標準化した値のこと。z得点、基準値とも言う。

Excel の関数が用意されていますSTANDARDIZE

エクセル統計2006以降に搭載しています基準値と偏差値(2006) / データ変換(2008以降)

このページのトップに戻る

標準偏差
standard deviation

分布の拡がりを表す統計量の一つで、分散の正の平方根に等しい。n個のデータxの平均をxとしたとき、標準偏差は以下の式で求められる。また、その単位は観測値の単位に等しいので、観測値と同じ単位で分布の拡がりを見積もりたい場合に用いられる。

母標準偏差

統計解析事例 | 記述統計量

Excel の関数が用意されていますSTDEVP, STDEVPA

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

表側

クロス集計表における左側の項目のこと。

cf. 表頭

統計解析事例 | クロス集計表の作成

エクセル統計2006以降に搭載していますクロス集計表の作成(2010以前) / クロス集計表の作成と分析(2012以降)

このページのトップに戻る

表頭

クロス集計表の上部の項目のこと。

cf. 表側

統計解析事例 | クロス集計表の作成

エクセル統計2006以降に搭載していますクロス集計表の作成(2010以前) / クロス集計表の作成と分析(2012以降)

このページのトップに戻る

標本
sample

母集団から抽出したデータの集まりのこと。サンプルとも言う。

このページのトップに戻る

標本数
sample size

サンプルサイズ

このページのトップに戻る

標本標準偏差
sample standard deviation

母集団標準偏差不偏推定量不偏分散の正の平方根で、n個のデータxの平均をxとしたとき、標本標準偏差sは以下の式で表される。

標本標準偏差

統計解析事例 | 記述統計量

Excel の関数が用意されていますSTDEV, STDEVA

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

非類似度
dissimilarity

クラスター分析において値が小さいほど類似度が高いことを示す指標のこと。

エクセル統計2006以降に搭載していますクラスター分析

このページのトップに戻る

比例尺度
ratio scale

比尺度

このページのトップに戻る

比例ハザード性
proportional hazard assumption

共変量の2群間において、ハザード比が時間によらず一定であること。Cox比例ハザードモデルではこの比例ハザード性が成り立つことを仮定しているため、Cox比例ハザードモデルを使用する際は、プロットなどから比例ハザード性が満たされているかを確認する必要がある。

エクセル統計2010に搭載していますCox比例ハザードモデル(2008以降)

このページのトップに戻る

比例ハザードモデル
proportional hazard model

Cox比例ハザードモデル

エクセル統計2006以降に搭載していますCox比例ハザードモデル(2008以降)

このページのトップに戻る

ファイ係数(φ係数)
phi coefficient

r行×c列のクロス集計表における行要素と列要素の関連の強さを示す指標。0 ≤ φ ≤ √min(r,c)-1の値をとり、上限に近いほど関連は強い。ただし、集計表の行列のサイズにより上限が異なるので、行列が等しい集計表の間でしか比較する意味が無い。サンプルサイズをn、カイ二乗値をχ2とすると、φは以下の式で表される。

ファイ係数(r×c集計表)

ピアソンの積率相関係数を2行×2列のクロス集計表に適用したものとしてのファイ係数も定義されており、これを特に四分点相関係数(four-fold point correlation coefficient)とも言う。-1 ≤ φ ≤ 1の値をとり、以下の式で表される。

ファイ係数(2×2集計表)
B1B2
A1abr1
A2cdr2
c1c2n

統計Tips | 2行×2列のクロス集計表の統計量

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

このページのトップに戻る

フィッシャーの最小有意差法
Fisher's LSD

最も簡便な多重比較検定。要因の水準が3水準で、各水準のサンプルサイズが等しい場合にのみ有効である。

フィッシャーの最小有意差法の計算方法(Excel ファイルのダウンロード)

エクセル統計2006以降に搭載しています一元配置分散分析・多重比較(2006) / 分散分析・多重比較(2008以降)

このページのトップに戻る

フィッシャーの正確検定(正確確率 / 直接確率)
Fisher's exact test

2行×2列のクロス集計表における行要素と列要素の関連の強さを示す指標。行の合計と列の合計を一定とみなし、起こりうる全てのケースのうち観測度数より稀なケースが発生する確率を直接計算して求める。

2行×2列のクロス集計表の各セルの値を以下のようにa, b, c, d, nを用いて表したとき、この組み合わせが得られる確率pは超幾何分布を用いて下式から求めることができる。

フィッシャーの正確検定(クロス集計表) フィッシャーの正確検定(計算式)

統計Tips | 2行×2列のクロス集計表の統計量

エクセル統計2006以降に搭載していますフィッシャーの直接確率, クロス集計表の作成と分析(2012以降), 中央値検定(2015)

エクセル統計2006以降に搭載しています多層の2×2表の検定(2012以前) / コクラン=マンテル=ヘンツェル検定(2015)

このページのトップに戻る

フォレストプロット
forest plot

メタ分析で使われるグラフで、様々な実験の結果を一つのグラフ内で比較することができる。2群の平均値に差があるかどうかの分析の場合、バー中央の■が平均値の差を、左右に伸びた線分が平均値の差の95%信頼区間を、■の大きさがサンプルサイズの相対的な大きさを表す。また、統合された平均値の差は◆で表される。

フォレストプロット

エクセル統計2006以降に搭載しています母平均の差のメタ分析(2015)

エクセル統計2006以降に搭載しています多層の2×2表の検定(2012以前) / コクラン=マンテル=ヘンツェル検定(2015)

このページのトップに戻る

不確定性係数
uncertainty coefficient

2つの質的変数間の相関を表す。

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

このページのトップに戻る

不規則変動
irregular variation

時系列データにおける周期変動のうち、傾向変動、循環変動、季節変動以外の変動のこと。観測誤差など諸要因による変化が含まれる。

エクセル統計2006以降に搭載していますEPA法(乗法モデル)

このページのトップに戻る

不均一分散の検定
heteroscedasticity test

重回帰分析において、誤差項の分散が不均一かどうか確認するための検定。Whiteの方法や Breusch-Paganの方法などがある。

エクセル統計2006以降に搭載しています重回帰分析(2012以降)

このページのトップに戻る

複数回答
multiple answer

調査やアンケートにおいて、質問にあてはまる選択肢を2つ以上選ぶ回答形式のこと。回答数に上限がない場合とある場合とがある。MAとも言う。

cf. 単回答, 順位回答, 自由回答

アンケート入力・集計 | 複数回答の集計方法

このページのトップに戻る

符号検定
sign test

ノンパラメトリック検定の1つで、対応のある2変数間で差があるかどうかを調べるための手法。各ケースで変数間の大小を比較し、「+(正:大きい)」「-(負:小さい)」「=(等しい)」の件数を調べ、「+」と「-」の件数に差があるかどうかを二項分布を用いて検定する。

エクセル統計2006以降に搭載しています符号検定(2015)

このページのトップに戻る

不偏推定量
unbiased estimator

標本から測定した推定量の期待値母集団のそれに等しいとき、その推定量を不偏推定量と言う。例えば、標本の平均の期待値母平均に等しいので、標本平均は不偏推定量である。

このページのトップに戻る

不偏分散
unbiased estimate of variance

母集団分散不偏推定量。n個のデータxの平均をxとしたとき、不偏分散u2は以下の式で表される。

不偏分散

統計解析事例 | 記述統計量

Excel の関数が用意されていますVAR, VARA

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

フリードマン検定
Friedman's test

ノンパラメトリック検定の一つで、対応のある2群以上の多群の差を検定する。個体ごと(各行)にデータの順位付けを行い、群(各列)ごとに順位和Riを求めて検定統計量の計算に用いる。

フリードマン検定(表)

群の数をk、群内のデータ数をnとすると、フリードマン検定の統計検定量χ02はk-1のカイ二乗分布に従う。

フリードマン検定(計算式)

エクセル統計2006以降に搭載していますフリードマン検定

このページのトップに戻る

プロビット
probit

標準正規分布の累積確率密度がpとなるようなxのことをpのプロビットと言う。ただし、0 < p < 1である。

プロビット

エクセル統計2006以降に搭載していますデータ変換(2008以降), プロビット回帰分析(2015)

このページのトップに戻る

プロビット回帰分析
probit regression analysis

目的変数をプロビット変換した値を回帰分析する手法。反応確率pのプロビットは、下式のように、標準正規分布の累積確率密度が反応確率pとなるようなzのことを示す。

プロビット回帰分析1

反応確率pのプロビットzに対して以下のように回帰式を定義し、最尤法により各偏回帰係数を推定する。(b0は定数項、b1,b2,…,bqは偏回帰係数、xは説明変数を表す)

プロビット回帰分析2

エクセル統計2006以降に搭載していますプロビット回帰分析(2015)

このページのトップに戻る

プロビット変換
probit transformation of data

標準正規分布の累積確率密度がxとなるようなx'へ変換すること。

プロビット変換

エクセル統計2006以降に搭載していますデータ変換(2008以降), プロビット回帰分析(2015)

このページのトップに戻る

プロマックス法
promax method

因子分析の因子軸の回転における斜交回転の方法の1つ。

統計解析事例 | 因子分析

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

分割表
contingency table

クロス集計表

このページのトップに戻る

分散
variance

分布のひろがりを表す統計量の一つで、標準偏差の2乗に等しい。n個のデータxの平均をxとすると分散s2は以下の式で表され、その単位は観測値の単位の2乗となる。

分散

また、比率pの分散s2は以下の式で表される。

比率の分散

統計解析事例 | 記述統計量

Excel の関数が用意されていますVARP, VARPA

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

分散分析表
analysis of variance table

分散分析において、結果をわかりやすく表現するために作成される表のこと。各要因の平方和、自由度、平均平方のほか、分散比がまとめられる。

このページのトップに戻る

分散拡大要因
variance inflation factor

VIF

統計解析事例 | 重回帰分析

エクセル統計2006以降に搭載しています重回帰分析(2008以降)

このページのトップに戻る

分散共分散行列
variance covariance matrix

多変数データから求めた各変数の分散と2変数間の共分散を要素とする行列。

エクセル統計2006以降に搭載しています分散共分散行列

このページのトップに戻る

分散分析
ANOVA / analysis of variance

1つまたは複数の因子の異なる水準が特性値の平均にもたらす差の有無を調べる分析手法。分散の分析ではなく、分散を用いた平均値の分析である。因子が1つの場合を一元配置分散分析、2つの場合を二元配置分散分析と言う。その他、データの取り方に応じて、反復測定による分散分析、共分散分析多変量分散分析などがある。「ANOVA(アノバまたはアノーバ)」と呼ばれることもある。

統計解析事例 | 一元配置分散分析と多重比較

統計解析事例 | 二元配置分散分析と多重比較

エクセル統計2006以降に搭載しています分散分析・多重比較

このページのトップに戻る

分類表
classification table

観測値とモデルの予測結果をクロス集計表にまとめたもの。この表を元に判別的中率を算出することができる。

エクセル統計2006以降に搭載しています多重ロジスティック回帰分析(2010以前) / 二項ロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています多項ロジスティック回帰分析(2012以降), 条件付きロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています順序ロジスティック回帰分析(2015)

このページのトップに戻る

平均
average

量的データの代表値の一つ。平均値(mean)としては、算術平均(相加平均)、幾何平均(相乗平均)、調和平均の3種類がある。一般に、調和平均幾何平均算術平均という関係がある。

統計解析事例 | 記述統計量

Excel の関数が用意されていますAVERAGE, AVERAGEA, GEOMEAN, HARMEAN

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

ベイズの定理
Bayes' theorem

P(B)を事象Aが起きる前の事象Bが起きる確率(事前確率)、P(B|A)を事象Aが起きた後で事象Bが起きる確率(事後確率)とする。このときP(B|A)は下式で表される。これをベイズの定理と言う。

ベイズの定理1

また、ベイズの定理は下のような形に展開されて使われる。

ベイズの定理2

このページのトップに戻る

平方根変換
square root transformation of data

平方根を求めること。開平変換とも言う。ポアソン分布に従う変数に対し平方根変換を行うことで、変換後の分布を正規分布に近付け、分散を安定化することができる。

平方根変換

Excel の関数が用意されていますSQRT

エクセル統計に搭載していますデータ変換(2008以降)

このページのトップに戻る

ベルヌーイ試行
Bernoulli trial

コイン投げのように結果が2通りにしかならない確率実験のこと。試行を繰り返したとき、どの試行においても結果が起こる確率は同じであり、各試行の結果は互いに独立である。

このページのトップに戻る

ベルヌーイ分布
Bernoulli distribution

ベルヌーイ試行によって得られる確率分布。n = 1 の場合の 二項分布に等しい。

このページのトップに戻る

偏回帰係数
partial regression coefficient

回帰分析において得られる回帰方程式の各説明変数の係数のこと。

統計解析事例 | 重回帰分析

統計解析事例 | 二項ロジスティック回帰分析

統計解析事例 | 2群の判別分析

統計解析事例 | 多群の判別分析

エクセル統計2006以降に搭載しています重回帰分析, 多重ロジスティック回帰分析(2010以前) / 二項ロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています多項ロジスティック回帰分析(2012以降), 条件付きロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています順序ロジスティック回帰分析(2015), 判別分析

秀吉Dplusに搭載しています重回帰分析

このページのトップに戻る

偏差
deviation

母集団の各値と、母集団の平均値との差のこと。「○○からの偏差」という言い方で用いられ、「○○との差」を表す。例えば、観測値と平均値との差は「平均値からの偏差」と言う。「平均値からの偏差」を単に「偏差」と言うこともある。

Excel の関数が用意されていますAVEDEV, DEVSQ

このページのトップに戻る

偏差値(Z得点)
deviation score(Z score)

平均が50、標準偏差が10となるように変換した値のこと。標準化した値を10倍して50を足すことで求められる。分布の形状が異なる2つのデータがあるとき、Z得点が同じであるからといって順位も同じであるとは限らない。

偏差値(Z得点)

Excel の関数が用意されていますSTANDARDIZE

エクセル統計2006以降に搭載しています基準値と偏差値(2006) / データ変換(2008以降)

このページのトップに戻る

偏差値(T得点)
deviation score(T score)

平均が50、標準偏差が10の正規分布に近似するように変換した値のこと。パーセンタイル順位を標準化した値を10倍して50を足すことで求められる。分布の形状が異なる2つのデータがあるとき、T得点が同じであれば順位も同じである。

Excel の関数が用意されていますPERCENTRANK, STANDARDIZE

エクセル統計2006以降に搭載していますデータ変換(2008以降)

このページのトップに戻る

変数選択
variable selection procedure

回帰分析や判別分析を行う際に、複数の説明変数の中から効率的に目的変数を説明できる説明変数を何らかの基準に従って選択する方法。基準を満たす変数がなくなった時点で、変数選択は終了となる。変数選択には以下のような方法がある。

減少法
説明変数をすべて含むモデルからスタートし、1つずつ変数を減少させていく方法。
増加法
説明変数を含まないモデルからスタートし、1つずつ変数を増加させていく方法。
減増法
説明変数をすべて含むモデルからスタートし、1つずつ変数を増加させたり減少させたりする方法。
増減法
説明変数を含まないモデルからスタートし、1つずつ変数を増加させたり減少させたりする方法。

エクセル統計2006以降に搭載しています重回帰分析, 多重ロジスティック回帰分析(2010) / 二項ロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています判別分析(2010以降), Cox比例ハザードモデル(2008以降)

このページのトップに戻る

偏相関係数
partial correlation coefficient

2つの変数の相関が第3の変数によって高められる、または低められる場合に、2変数から第3の変数の影響を取り除いて求めた相関係数

3つの変数をx, y, zとし、zの影響を除去したxとyの相関を偏相関係数をrxy∙zとする。xとyの相関をrxy、yとzの相関をryz、zとxの相関をrxzとすると、偏相関係数rxy∙zは下式で表される。

偏相関係数

統計解析事例 | 相関行列・偏相関行列

エクセル統計2006以降に搭載しています相関行列・偏相関行列(2012以前) / 相関行列と偏相関行列(2015)

秀吉Dplusに搭載しています多変量解析 | 相関分析

このページのトップに戻る

変動係数
coefficient of variance

標準偏差を平均値で割った値。この値に100をかけてパーセントで表すこともある。ピアソンの変動係数とも言う。キリンの体長のばらつきと猫の体長のばらつきを比較するときのように、スケールの異なるデータのバラツキを絶対値ではなく相対値で比較しようとする場合に用いられる。

変動係数

統計解析事例 | 記述統計量

エクセル統計2006以降に搭載しています数量データ 記述統計量(2006/2008) / 記述統計量(2010以降)

このページのトップに戻る

ポアソン分布
Poisson distribution

二項分布において、nが非常に大きく、pが極めてまれな現象であるときに従う確率分布で、単位時間あたりにある事象が平均してλ回起こる場合に、その事象がx回起こる確率を示す。ポアソン分布は以下の式で表される。

ポアソン分布

確率変数Xがポアソン分布に従っているとき、Xの期待値はE(X)=λ、分散はV(X)=λとなる。

このページのトップに戻る

訪問面接調査
door-to-door survey

対象者を直接訪問し、その場で対象者にインタビューしたり対象者に回答を記入してもらったりすることで回答を得る調査のこと。質問の意図を伝達したり、質問の順序を確認したり、回答のモチベーションを維持したりできるため、精度の高いデータが得られる。

このページのトップに戻る

母集団
population

調査や研究の対象となるものの全体。標本を抽出するための母体となる統計量の集まり。

このページのトップに戻る

母数
parameter

母平均母分散など、母集団が持つ固有の統計量のことを母数、またはパラメーターと言う。一般に未知であり、点推定区間推定によってその値を推定することが多い。

このページのトップに戻る

ボックス=コックス変換
Box-Cox transformation

データの分布を正規分布に近づけるための変換。べき正規変換とも言う。ボックス=コックス変換は以下の式で表される。ただし、xは正である。

ボックス=コックス変換

エクセル統計2006以降に搭載していますデータ変換(2008以降)

このページのトップに戻る

ボックスのM検定
Box's M test

複数の正規母集団のグループにおける分散共分散行列の同質性・相等性を検定する方法の一つ。帰無仮説は「各グループの分散共分散行列は等しい」である。

統計解析事例 | 2群の判別分析

統計解析事例 | 多群の判別分析

エクセル統計2006以降に搭載しています多変量分散分析(2008以降), 判別分析

秀吉Dplusに搭載しています多変量解析 | 判別分析

このページのトップに戻る

母比率
population proportion

母集団の比率のこと。

エクセル統計2006以降に搭載しています母比率の推定, 母比率の検定

このページのトップに戻る

母分散
population variance

母集団分散のこと。一般的にσ2(シグマ2乗)として表されることが多い。

Excel の関数が用意されていますVAR, VARA

エクセル統計2006以降に搭載しています母分散の推定, 母分散の検定

このページのトップに戻る

母平均
population mean

母集団の平均のこと。一般的にμ(ミュー)で表されることが多い。

Excel の関数が用意されていますAVERAGE, AVERAGEA

エクセル統計2006以降に搭載しています母平均の推定, 母平均の検定

このページのトップに戻る

ボンフェローニの多重比較検定
Bonferroni's multiple comparison test

多重比較検定の一つで、すべての対比較を行う。対比較の数に応じて有意水準を調整するため、対比較の数が多くなると検出力が低くなる。また、各群のサンプルサイズは等しくなければならない。

エクセル統計2006以降に搭載しています一元配置分散分析・多重比較(2006) / 分散分析・多重比較(2008以降)

このページのトップに戻る

統計WEB

主催:社会情報サービス統計調査研究室

Google
ウェブ検索
サイト内検索