現在位置 : 統計WEB | 統計用語集 | カ行

統計用語集

以下の索引をクリックするとその行の用語とその説明が表示されます。

Excel の関数が用意されています:このマークは、Excel に用意された関数により計算できることを示しています。

エクセル統計2006以降に搭載しています:このマークは、エクセル統計2006以降に解析手法が搭載されていることを示しています。

秀吉Dplusに搭載しています:このマークは、秀吉Dplusに解析手法が搭載されていることを示しています。

「エクセル統計」「秀吉Dplus」株式会社社会情報サービスのソフトウェア製品です

カ行



回帰診断
regression diagnostics

重回帰分析や二項ロジスティック回帰分析において、回帰モデルが適切かどうか検討する方法。予測値と観測値との残差の分析として、「残差」、「標準化残差」、「スチューデント化残差」等が、影響力の分析として、「Cookの距離」と「てこ比」等が使用される。

エクセル統計2006以降に搭載しています重回帰分析(2012以降), 二項ロジスティック回帰分析(2012以降)

このページのトップに戻る

回帰分析
regression analysis

分析対象の変数(目的変数 / 従属変数)を他の1つまたは複数の変数(説明変数 / 独立変数)により説明し予測しようとする手法。

統計解析事例 | 重回帰分析

統計解析事例 | 二項ロジスティック回帰分析

統計解析事例 | 2群の判別分析

統計解析事例 | 多群の判別分析

Excel の関数が用意されていますFORECAST, INTERCEPT, LINEST, SLOPE, STEYX, TREND

エクセル統計2006以降に搭載しています重回帰分析, 多重ロジスティック回帰分析(2010以前) / 二項ロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています多項ロジスティック回帰分析(2012以降), 条件付きロジスティック回帰分析(2012以降), 判別分析

エクセル統計2006以降に搭載しています順序ロジスティック回帰分析(2015), プロビット回帰分析(2015)

秀吉Dplusに搭載しています多変量解析 | 重回帰分析

このページのトップに戻る

回帰方程式
regression equation

回帰分析において目的変数の理論値を表した方程式。

統計解析事例 | 重回帰分析

統計解析事例 | 二項ロジスティック回帰分析

統計解析事例 | 2群の判別分析

統計解析事例 | 多群の判別分析

Excel の関数が用意されていますFORECAST, INTERCEPT, LINEST, SLOPE, STEYX, TREND

エクセル統計2006以降に搭載しています重回帰分析, 多重ロジスティック回帰分析(2010以前) / 二項ロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています多項ロジスティック回帰分析(2012以降), 条件付きロジスティック回帰分析(2012以降), 判別分析

エクセル統計2006以降に搭載しています順序ロジスティック回帰分析(2015), プロビット回帰分析(2015)

秀吉Dplusに搭載しています多変量解析 | 重回帰分析

このページのトップに戻る

カイ二乗検定
chi-square test

統計的仮説検定のうち、カイ二乗分布を用いる検定の総称。ただし、一般的にはクロス集計表における行要素と列要素が独立かどうかを評価する検定(独立性の検定)を指すことが多い。

k行m列のクロス集計表のi行j列の観測度数をOij、期待度数をEij、i行の合計をni・、j列の合計をn・j、全データの合計をnとおくと、カイ二乗値χ02は下式から求められる。

カイ二乗分布

LaTex ソースコードLaTex をハイライトする

ただし、期待度数は下式から求める。

期待値

LaTex ソースコードLaTex をハイライトする

k行m列のクロス集計表の場合、このカイ二乗値は自由度(k-1)×(m-1)のカイ二乗分布に従うことを利用して検定を行う。

統計解析事例 | 独立性の検定

Excel の関数が用意されていますCHIDIST, CHITEST

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降), 独立性の検定

秀吉Dplusに搭載していますクイック統計 | クロス集計 | SA×SA

このページのトップに戻る

カイ二乗分布
chi-square distribution

正規分布に従ういくつかの変数があるとき、それらの二乗和が従う分布である。自由度mのカイ二乗分布は以下の式で表される。Γ( )はガンマ関数

カイ二乗分布を表す式

LaTex ソースコードLaTex をハイライトする

統計Tips | カイ二乗分布曲線のグラフの作り方

Excel の関数が用意されていますCHIDIST, CHIINV

このページのトップに戻る

階層型クラスター分析 / 階層的クラスター分析
hierarchical cluster analysis

階層型クラスター分析の結果は樹形図(デンドログラム)によって表されることが多い。個体(枝)からクラスター(幹)へ階層構造を成すため階層型クラスター分析とよばれる。凝集的方法では、個体間の類似度行列(距離行列を用いることが多い)からスタートし類似度の高いもの同士を順に合併していく。合併後の類似度の計算方法により合併過程が異なる。エクセル統計の凝集法は、最短距離法最長距離法メディアン法重心法群平均法ウォード法をまとめたものとなっている。

エクセル統計2006以降に搭載していますクラスター分析

秀吉Dplusに搭載しています多変量解析 | クラスター分析(凝集法)

このページのトップに戻る

開平変換
extraction of square root

平方根変換

Excel の関数が用意されていますSQRT

エクセル統計に搭載していますデータ変換(2008以降)

このページのトップに戻る

拡張マンテル検定
Mantel-extension test

表頭に反応の有無、表側に傾向のある水準を配置したk行×2列のクロス集計が多層ある場合に、層別要因の影響を調整した上で全体としての傾向-反応関係のカイ二乗検定を行うこと。

エクセル統計2006以降に搭載しています多層のk×2表の検定(2012以前)/ 拡張マンテル検定(2015)

このページのトップに戻る

角変換
arcsine transformation of data

比率pに対して以下の式の値を求めることを角変換と言う。角変換により、比率pの分布を正規分布に近付け、分散を安定化することができる。

角変換

LaTex ソースコードLaTex をハイライトする

Excel の関数が用意されていますASIN, SQRT, DEGREES

エクセル統計に搭載していますデータ変換(2008以降)

このページのトップに戻る

確率分布
probability distribution

確率変数の値に対して、その確率変数をとる確率の分布を表現するもの。代表的な確率分布に以下のようなものがある。

離散型確率分布:確率変数が離散的である場合
ポアソン分布二項分布幾何分布一様分布
連続型確率分布:確率変数が連続的である場合
一様分布正規分布指数分布

このページのトップに戻る

確率変数
random variable

ある現象がいろいろな値を取り得るとき、取り得る値全体を確率変数Xとして表す。どのような値をとるかは決まっていないが、取りうる値、もしくは取りうる値の範囲とその値をとる確率が決まっている数のこと。一般に離散型と連続型の二つが用いられる。

<離散型の例>例えば、一つのさいころを振り、出てくる目の値について考える。この時、確率変数はX=1,2,3,4,5,6となり、すべてのXについてP(X)=1/6となる。偶数の目が出る場合については、P(X=2,4,6)=1/2と表される。

このページのトップに戻る

確率密度関数
probability density function

連続型確率変数Xについて、ある関数y=f(x)が下式を満たすとき、f(x)はXについての確率密度関数となる。

確率密度関数_1

LaTex ソースコードLaTex をハイライトする

このとき、確率変数Xについて、下のように表現できる。

確率密度関数_2

LaTex ソースコードLaTex をハイライトする

このページのトップに戻る

片側検定
one-sided test

帰無仮説がH0:μABのときに、対立仮説がH1:μA>μBまたはH2:μA<μBであるときに行う検定のこと。一方の群に対して大小関係が予想できる場合に用いることができる。

このページのトップに戻る

カッパ係数
kappa coefficient

ある現象を2人の観察者が観察した場合の結果がどの程度一致しているかを表す統計量。カッパ統計量や一致率とも言う。0から1までの値をとり、値が大きいほど一致度が高いといえる。

統計Tips | 2行×2列のクロス集計表の統計量

統計解析事例 | カッパ係数

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降), カッパ係数(2008以降)

このページのトップに戻る

カテゴリーデータ / カテゴリカルデータ
categorical data

質的データ

このページのトップに戻る

カプラン=マイヤー法
Kaplan-Meier method

生存時間分析の手法の一つで、生存率曲線を描くことで生存時間の推定を行う。各時点i におけるイベント総数をdi、全観察対象者数をniとしたとき、時点tにおける生存関数生存率関数は下式から算出される。

カプラン=マイヤー法

生存率関数はあるイベントが時間t以下では起こらない確率を示す。横軸に時間を、縦軸に生存率をプロットしたグラフを生存率曲線と呼ぶ。

LaTex ソースコードLaTex をハイライトする

統計解析事例 | カプラン=マイヤー法

エクセル統計2006以降に搭載していますカプラン・マイヤー法(2012以前) / カプラン=マイヤー法(2015)

このページのトップに戻る

間隔尺度
interval scale

名義尺度順序尺度の性質に加えて、等間隔性の性質も併せ持つ尺度。例えば、温度で0℃、1℃、2℃には大小関係があり、かつ等間隔でもある。しかし、摂氏と華氏の2種類の温度単位があるように、原点と単位の大きさの取り方は自由であり、間隔尺度同士の掛け算や割り算は意味をなさない。

このページのトップに戻る

頑健性
robustness

ある統計的手法が、必要としている条件または仮定を少々満たしていないようなデータにおいてもほぼ妥当な結果を与えるとき、この統計的手法は頑健性があると言う。

このページのトップに戻る

完全平等線
complete equality line

ローレンツ曲線における対角線の直線のこと。分配が完全に均等な場合、ローレンツ曲線は完全平等線に一致する。

ローレンツ曲線

エクセル統計2010以降に搭載していますローレンツ曲線とジニ係数(2010以降)

このページのトップに戻る

感度
sensitivity

検査の性能を表す指標の一つ。検査で検出したい信号や疾患を有するもののうち、検査が正しく陽性と判断したものの割合。真陽性率のこと。

感度
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

cf. 特異度

統計Tips | 2行×2列のクロス集計表の統計量

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

このページのトップに戻る

ガンマ関数
gamma function

カイ二乗分布t分布F分布の確率密度関数の定義に利用される関数。以下の式で表される(x>0)。x=1のときは指数分布となる。

ガンマ関数

LaTex ソースコードLaTex をハイライトする

Excel の関数が用意されていますGAMMALN

このページのトップに戻る

ガンマ分布
gamma distribution

以下の式で表される確率分布のこと(α>0)。

ガンマ分布

Γ(x)はガンマ関数を表す。確率変数Xがガンマ分布に従っているとき、確率変数Xの期待値はE(X)=α/λ、分散はV(X)=α/λ2となる。

LaTex ソースコードLaTex をハイライトする

このページのトップに戻る

管理図
control chart

工場、事務、販売、営業などにおける作業工程が安定な状態にあるかどうかを調べるため、または工程を安定な状態に保持するために用いる図。

管理図

cf. 管理線, 管理特性, x-R管理図, x-s管理図, Me-R管理図, X-Rs管理図, np管理図, p管理図, c管理図, u管理図

エクセル統計2006以降に搭載していますXbar-R管理図, Xbar-s管理図, Me-R管理図, X-Rs管理図, np管理図, p管理図, c管理図, u管理図

このページのトップに戻る

管理線
control line

管理特性が安定な状態にあるかどうかを判断するために管理図の上に引かれる線のこと。中心線(CL)、上部管理限界(UCL)、下部管理限界(LCL)がある。

管理図

cf. 管理図, 管理特性

エクセル統計2006以降に搭載していますXbar-R管理図, Xbar-s管理図, Me-R管理図, X-Rs管理図, np管理図, p管理図, c管理図, u管理図

このページのトップに戻る

管理特性
control characteristics

管理の対象が安定な状態にあるかどうかを判断するために選んだ特性を数値で表したもの。例えば健康を管理する場合、管理特性として体重や体脂肪率を選ぶことができるが、健康状態に左右されない身長は管理特性にはならない。

cf. 管理図, 管理線

エクセル統計2006以降に搭載していますXbar-R管理図, Xbar-s管理図, Me-R管理図, X-Rs管理図, np管理図, p管理図, c管理図, u管理図

このページのトップに戻る

関連
association

連関

このページのトップに戻る

偽陰性率
false negative fraction / false negative rate

検査の性能を表す指標の一つ。検査で検出したい信号や疾患を有するもののうち、検査が誤って陰性と判断したものの割合。FNFと表すこともある。1-(感度)として計算される。

偽陰性率
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

このページのトップに戻る

幾何分布
geometric distribution

ベルヌーイ試行を何回か繰り返すときに、初めて成功するまでの回数を確率変数X、各試行の成功確率をpとしたときの確率分布のこと。幾何分布の期待値と分散は以下の式で表される。

幾何分布(期待値) 幾何分布(分散)

LaTex ソースコードLaTex をハイライトする

LaTex ソースコードLaTex をハイライトする

このページのトップに戻る

幾何平均
geometric mean

n個の正数の観測値の積のn乗根。相乗平均とも言う。比率を平均する場合に有用である。

幾何平均

LaTex ソースコードLaTex をハイライトする

Excel の関数が用意されていますGEOMEAN

エクセル統計2010以降に搭載しています記述統計量(2012以降)

このページのトップに戻る

棄却域
rejection region

帰無仮説を棄却する統計量の値の集合。

このページのトップに戻る

記述統計
descriptive statistics

データを整理し、そのデータの持つ特徴をできるだけ簡潔で明確に記述する方法を研究するもの。推測統計と対比して用いられることが多い。数値や表、グラフ、図などを用いてデータの特徴を表現する。

このページのトップに戻る

基準化
standardization / normalization

標準化

Excel の関数が用意されていますSTANDARDIZE

エクセル統計2006以降に搭載しています基準値と偏差値(2006) / データ変換(2008以降)

このページのトップに戻る

基準値
standardized value / normalized value

標準得点

Excel の関数が用意されていますSTANDARDIZE

エクセル統計2006以降に搭載しています基準値と偏差値(2006) / データ変換(2008以降)

このページのトップに戻る

基準変数
criterion variable

目的変数

このページのトップに戻る

季節指数
seasonal index

時系列分析において、季節による売上変動のデータなどを用いてデータの持つ変動傾向を表したもの。例えば、季節指数を用いて年間の売上計画を各月の売上計画に落とし込むことができる。

エクセル統計2010以降に搭載しています連環比率法

このページのトップに戻る

季節変動
seasonal variation

時系列データにおける周期変動のうち、12ヶ月間で繰り返す周期変動のこと。

エクセル統計2010以降に搭載していますEPA法(乗法モデル)

このページのトップに戻る

期待値
expected value

確率変数のとりうる値にそれが起こる確率を掛けた値の総和のこと。平均値は(相加平均の場合)観測値全体の和を観測度数で割った値を指すが、期待値は1回の観測で期待される値のことを指す。

このページのトップに戻る

期待度数
expected frequency

クロス集計表における期待度数とは、行要素の合計や列要素の合計の比率から逆算して期待される度数のことを指す。期待度数に対し、実験、調査、観察などによって得られたデータに基づく度数を、実測度数、観測度数、観察度数などと言う。

統計解析事例 | 独立性の検定

統計解析事例 | カッパ係数

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降), 独立性の検定, カッパ係数

このページのトップに戻る

期別指数
seasonal index

時系列分析において、12ヶ月、四半期、7曜日、時間などにより一定の周期変動を繰り返すデータに対して期別の平均をとったときの、通期平均に対する比。

エクセル統計2006以降に搭載しています期別平均法

このページのトップに戻る

期別平均法

時系列データの季節指数を計算する最も簡単な手法。

期別平均法の計算方法(Excel ファイルのダウンロード)

エクセル統計2006以降に搭載しています期別平均法

このページのトップに戻る

帰無仮説
null hypothesis

統計的仮説検定の際にとりあえず立てる仮説のことで、対立仮説の方が重要であることが多い。記号「H0」として表されることが多い。例えば、帰無仮説として「差がない」という仮説が立てられた場合、これが棄却されることにより、対立仮説の「差がある」を結論とする。

このページのトップに戻る

逆行列
inverse matrix

正方行列Aに対して、AX=XA=Iを満たす行列Xが存在するとき、XAの逆行列であると言う。このときI単位行列である。

統計Tips | Excel による行列の計算方法

Excel の関数が用意されていますMINVERSE

エクセル統計2006以降に搭載しています逆行列の計算

このページのトップに戻る

逆数変換
reciprocal transformation of data

データxを、任意の値aを用いて1/(x+a)に変換すること。

逆数変換

LaTex ソースコードLaTex をハイライトする

エクセル統計に搭載していますデータ変換(2008以降)

このページのトップに戻る

逆正弦変換
arcsine transformation of data

角変換

エクセル統計に搭載していますデータ変換(2008以降)

このページのトップに戻る

級内相関係数
intraclass correlation coefficient

評価者が対象に対する評価を行った際、評価者内もしくは評価者間におけるデータの一致度・安定性(=信頼性)を示すための指標。評価者内信頼性とは同一評価者による2回以上の繰り返し評価データの一致度である。また、評価者間信頼性とは2人以上の異なる評価者によって同じ対象を評価した時の一致度である。級内相関係数は1から-1の値をとり、0に近づくほど信頼性は低く、1に近いほど信頼性は高い。負の相関がある場合マイナスの値をとる。

エクセル統計に搭載しています級内相関係数(2015)

このページのトップに戻る

凝集法によるクラスタリング
agglomerative clustering

階層型クラスター分析において、似たものを1つずつ逐次的にまとめていく方法を凝集法によるクラスタリングと言う。

エクセル統計2006以降に搭載していますクラスター分析

秀吉Dplusに搭載しています多変量解析 | クラスター分析(凝集法)

このページのトップに戻る

偽陽性率
false positive fraction / false positive rate

検査の性能を表す指標の一つ。検査で検出したい信号や疾患を有さないもののうち、検査が誤って陽性と判断したものの割合。FPFと表すこともある。1-(特異度)として計算される。

偽陽性率
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

cf. 真陽性率, 偽陰性率, 真陰性率, ROC曲線

統計解析事例 | ROC曲線

エクセル統計2006以降に搭載していますROC曲線(2008以降)

このページのトップに戻る

共分散
covariance

2変数の関係の強さを表す指標の一つ。データの単位の影響を受けるので値の大きさで単純に比較できない。n組のデータ (x1, y1), (x2, y2), …, (xn, yn) があるとき、これらの平均x, yと2変数の差の積和をサンプルサイズ-1で割った値が共分散sxyで、以下の式で表される。

共分散を各変数の標準偏差で割った値は相関係数である。

共分散

LaTex ソースコードLaTex をハイライトする

共分散の計算方法(Excel ファイルのダウンロード)

Excel の関数が用意されていますCOVAR

エクセル統計2006以降に搭載しています分散共分散行列

このページのトップに戻る

共分散分析
analysis of covariance / ANCOVA

分散分析において要因間の差を探るとき、量的データを持つ補助的な変数(体重や年齢など)の影響も考慮した分析手法。なお、このとき分析に加えた補助的な変数のことを共変量と言う。分散分析回帰分析を合わせたような分析手法と考えることができる。

エクセル統計2006以降に搭載しています共分散分析(2008以降)

このページのトップに戻る

行列
matrix

m×n個の数字を縦にm行、横にn列並べたもの。下図の例は2行3列の行列。

行列

LaTex ソースコードLaTex をハイライトする

このページのトップに戻る

距離関数
distance function

クラスター分析で、クラスター間の距離を定義する際の関数。

エクセル統計2006以降に搭載していますクラスター分析

このページのトップに戻る

距離行列
distance matrix

クラスター分析で、クラスター間の距離を行列に並べたもの。

エクセル統計2006以降に搭載していますクラスター分析

このページのトップに戻る

寄与率
contribution ratio

データの全情報の中で、各要素のもつ情報が占める割合。例えば主成分分析では、各主成分の固有値をその総和で割ったものを寄与率とよぶ。主成分分析における寄与率は各主成分が全体の中でどれだけの変動の割合を占めるかを示し、値が大きいほど相対的に説明力が高い主成分であることを表す。

エクセル統計2006以降に搭載しています主成分分析, 判別分析, 因子分析, 数量化3類, 双対尺度法, 正準相関分析(2015)

このページのトップに戻る

均質性の検定
statistical test for heterogeneity

メタ分析などにおいて、各研究の効果量が均質(共通の平均値等が存在する)か、均質ではない(平均値等が研究によって異なる)かを検定すること。

エクセル統計2006以降に搭載しています母平均の差のメタ分析(2015)

このページのトップに戻る

区間推定
interval estimation

平均値などの統計量の母数をある程度の幅を持たせて推定する方法。

エクセル統計2006以降に搭載しています母平均の推定, 母比率の推定, 母分散の推定

このページのトップに戻る

グッドマン=クラスカルのガンマ(γ)
Goodman and Kruskal's gamma

順位相関係数の一種。対応する2つの変量(xi, yi)(ただし、i=1,2,・・・,n)があるとき、その中から取り出した(xs, ys)と(xt, yt)(ただし、s<t)において、

P = (xsとxt、ysとytの大小関係が同じ向きである組の数)
Q = (xsとxt、ysとytの大小関係が異なる向きである組の数)

とおくと、グッドマン=クラスカルのガンマは以下の式で表される。

グッドマン=クラスカルのガンマ

グッドマン=クラスカルのガンマは-1から1までの値をとる。xs=xtやys=ytがない(同順位がない)場合はケンドールの順位相関係数のτaおよびτbに等しい。また、行のカテゴリーと列のカテゴリーのいずれにも順序が存在するようなクロス集計表においてもガンマを定義することができる。2行×2列クロス集計表の場合のガンマをユールのQと呼ぶこともある。

LaTex ソースコードLaTex をハイライトする

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

エクセル統計2006以降に搭載していますグッドマン・クラスカルのγ(2012以前) / グッドマン=クラスカルのガンマ(2015)

このページのトップに戻る

グッドマン=クラスカルのタウ(τ)
Goodman and Kruskal's tau

r行×c列のクロス集計表における行要素と列要素の関連の強さを示す指標。0から1までの値をとり、1に近いほど関連が強い。行を従属変数、列を独立変数としたとき、クロス集計表にない新しい観測値が行のどの水準に属するかを予測した場合の誤差が、その観測値の列の水準がわかることによってどの程度減少するかを求めたもの。行を従属変数とした場合と列を従属変数とした場合の2種類定義できる。

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

エクセル統計2006以降に搭載していますグッドマン・クラスカルのτ(2012以前) / グッドマン=クラスカルのタウ(2015)

このページのトップに戻る

グッドマン=クラスカルのラムダ(λ)
Goodman and Kruskal's lambda

名義尺度間の類似度を表す指標。

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

このページのトップに戻る

クラスカル=ウォリス検定
Kruskal-Wallis test

順位を用いたノンパラメトリック検定の一つで、対応のない3つ以上のグループ間の差の有無を調べたいときに用いられる。H検定とも言う。

k群のデータをひとまとめにして小さいデータより順位をつけ、同順位の場合は該当する順位の平均値を割り当てる。次に群ごとに順位和Riを求め、このRiと各群のサンプルサイズniを用いて下式からクラスカル=ウォリスの統計量Hを計算する(Nは全データ数を表す)。Hは近似的に自由度k-1のカイ二乗分布に従うことを用いて検定を行う。

クラスカル=ウォリス検定

LaTex ソースコードLaTex をハイライトする

統計解析事例 | クラスカル=ウォリス検定と多重比較

エクセル統計2006以降に搭載していますクラスカル・ウォリス検定と多重比較(2012以前) / クラスカル=ウォリス検定と多重比較(2015)

このページのトップに戻る

クラスター分析
cluster analysis

クラスター分析には複数の手法があり、大きくは階層型と非階層型の2種類に分かれる。
階層型では、得られた標本において、距離や相関係数によってケース間の類似度を求め、類似度の近いものから順にクラスターに結合していく。最初はケースの数だけクラスターがあるが、結合するたびにクラスターの数は1つずつ減っていく。この結合の過程をグラフにしたものがデンドログラムである。
非階層型ではクラスター内ではできるだけ均一に、クラスター間はできるだけ異なるように分類する。非階層型クラスター分析の代表的手法の1つにk-means法がある。

エクセル統計2006以降に搭載していますクラスター分析

秀吉Dplusに搭載しています多変量解析 | クラスター分析(凝集法), 多変量解析 | クラスター分析(K-means法)

このページのトップに戻る

グラブスの検定
Grubbs' test

スミルノフ=グラブスの検定

エクセル統計2006以降に搭載しています外れ値検定

このページのトップに戻る

クラメールのV
Cramer's V

r行×c列のクロス集計表における行要素と列要素の関連の強さを示す指標。0≤V≤1の値をとり、1に近いほど関連が強い。クラメールの連関係数(Cramer's coefficient of association)とも言う。サンプルサイズをn、カイ二乗値をχ2とすると、クラメールのVは以下の式で表される。

クラメールのV

LaTex ソースコードLaTex をハイライトする

エクセル統計2006以降に搭載しています独立性の検定, フィッシャーの直接確率 / クロス集計表の作成と分析(2012以降)

エクセル統計2006以降に搭載していますコクラン・アーミテージ検定(2012以前) / コクラン=アーミテージ検定(2015)

秀吉Dplusに搭載していますクイック統計 | クロス集計 | SA×SA

このページのトップに戻る

グループインタビュー
group interview

集団面接法

このページのトップに戻る

クローズドアンケート

特定の対象者にのみ実施されるアンケートのこと。クローズド調査も同意。

cf. オープンアンケート

このページのトップに戻る

クロス集計表
cross table

n個のデータをr個とc個のカテゴリーを持つ2つの属性により分類し、次のような度数表が得られたとき、この度数表をクロス集計表と言う。

クロス集計表

統計解析事例 | クロス集計表の作成

エクセル統計2006以降に搭載していますクロス集計表の作成(2010以前) / クロス集計表の作成と分析(2012以降)

秀吉Dplusに搭載していますアンケート集計, クイック統計 | クロス集計

このページのトップに戻る

クロンバックのアルファ(α)
Cronbach's alpha

性格検査の質問項目のように、ある特性に対して複数の質問項目を設け、回答の合計値(尺度得点)を特性尺度として用いるときに、各質問項目(変数)が全体として同じ概念や対象を測定したかどうか(内的整合性)を評価する信頼係数。0から1までの値をとり、1に近いほど信頼性が高いと言える。

mは質問の項目数、σiは各質問項目の分散、σxは各質問項目を合計した尺度得点の分散としたとき、下式からアルファ係数を求められる。

クロンバックのアルファ

LaTex ソースコードLaTex をハイライトする

クロンバックのαの計算方法(Excel ファイルのダウンロード)

エクセル統計2006以降に搭載していますクロンバックのα(2012以前) / クロンバックのアルファ(2015)

このページのトップに戻る

群平均法
group average method

クラスター分析で使用される、クラスター間の距離算出方法の一つ。2つのクラスター間で可能な全ての組み合わせにおける非類似度の平均からクラスターを形成する方法。クラスター(u)と(v)を統合して新しいクラスター(w)をつくるとき、クラスター(w)と別の任意のクラスター(t)との間の非類似度Dwtを、統合する前のクラスター(u)、(v)と(t)との非類似度Dut、Dvtを用いて表すと以下のようになる(nu、nvはクラスター(u)、(v)に含まれるデータ数)。

群平均法

LaTex ソースコードLaTex をハイライトする

エクセル統計2006以降に搭載していますクラスター分析

このページのトップに戻る

傾向性の検定
trend test

ヨンクヒール=タプストラ検定

エクセル統計2006以降に搭載していますヨンクヒール・タプストラ検定(2012以前) / ヨンクヒール=タプストラ検定(2015)

このページのトップに戻る

傾向変動
secular trend

時系列データにおける周期変動のうち、長期にわたる持続的な変化のこと。

エクセル統計2006以降に搭載していますEPA法(乗法モデル)

このページのトップに戻る

系統抽出
systematic sampling

母集団に通し番号をつけ、それ以下の通し番号を持つ点から無作為に一点目の標本を抽出する。その点から等間隔で(抽出間隔ごとに)標本を抽出するような方法。

このページのトップに戻る

系列相関
serial correlation

回帰分析において、誤差項(残差、実測値と理論値の差)に自己相関がある場合、系列相関が認められる、または自己相関が認められると言う。

cf. ダービン=ワトソン比

このページのトップに戻る

欠損値
missing value

取得データのうち、ある項目の値が欠けているもの。

このページのトップに戻る

決定係数
coefficient of determination

回帰分析において、目的変数の観測値に対する目的変数の予測値の説明力を表す指標。寄与率とも言う。0から1までの値をとり、1に近いほど分析が有効である。

この決定係数R2は観測値yと推定値yhatとの相関を表す重相関係数の2乗に等しくなる。重回帰分析では変数が増えるほど決定係数は1に近づくため、変数の数が多い場合は自由度修正済み決定係数を使用する。

決定係数

LaTex ソースコードLaTex をハイライトする

ただしSRは回帰変動、STは全体変動、yiはn個のデータがあるときのi番目の実測値、yは実測値yの平均、Yiは推定値を表す。

回帰変動 全体変動

LaTex ソースコードLaTex をハイライトする

LaTex ソースコードLaTex をハイライトする

統計Tips | 決定係数の計算方法

統計解析事例 | 重回帰分析

統計解析事例 | 二項ロジスティック回帰分析

Excel の関数が用意されていますLINEST

エクセル統計2006以降に搭載しています重回帰分析, 多重ロジスティック回帰分析(2010以前) / 二項ロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています多項ロジスティック回帰分析(2012以降), 条件付きロジスティック回帰分析(2012以降)

エクセル統計2006以降に搭載しています曲線のあてはめ

秀吉Dplusに搭載しています多変量解析 | 重回帰分析

このページのトップに戻る

検査後オッズ
post-test odds

検査結果が陽性と出た人の中で非患者に対する患者の比。

検査後オッズ
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

cf. 検査前オッズ

このページのトップに戻る

検査前オッズ
pre-test odds

検査の対象となる人のなかで非患者に対する患者の比。

検査前オッズ
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

cf. 検査後オッズ

このページのトップに戻る

検査後確率
post-test probability

検査後確率には陽性的中度陰性的中度の2つがあるが、主に陽性的中度を指す。

cf. 検査前確率

このページのトップに戻る

検査前確率
pre-test probability

検査の対象となる人のうち疾患を有する人の割合。有病率とも言う。

検査前確率
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

cf. 検査後確率

このページのトップに戻る

検出力
power

統計的仮説検定において、帰無仮説が偽であるときに誤らずに帰無仮説を棄却する確率のこと。第二種の過誤を犯す確率をβ(ベータ)とおくと、検出力は1-βで表される。検定力とも言う。検出力は効果量の大きさとサンプルサイズと有意水準αを設定することで求めることができる。

統計解析事例 | 2群の母平均の差の検定

統計解析事例 | 2群の母平均の差の検定(対応あり)

エクセル統計2006以降に搭載しています2群の母平均の差の検定(2012以前) / 母平均の差の検定(2015)

エクセル統計2006以降に搭載しています2群の母平均の差の検定(対応あり)(2012以前) / 母平均の差の検定(対応あり)(2015)

エクセル統計2006以降に搭載しています2群の等分散性の検定(2012以前) / 等分散性の検定(2015)

このページのトップに戻る

ケンドールの一致係数
Kendall's coefficient of concordance

評価者間の評価一致度の指標。個体ごとにデータの順位付けを行い、群ごとの順位和を用いて算出を行う。0から1までの値をとり、1に近いほど一致度が高いということを示す。

エクセル統計2006以降に搭載していますフリードマン検定(2015)

このページのトップに戻る

ケンドールの順位相関係数
Kendall's rank correlation coefficient

順位相関係数の一種で、タウa(τa)、タウb(τb)、タウc(τc)の3種類が定義される。対応する2つの変量(xi, yi)(ただし、i=1,2,・・・,n)があるとき、その中から取り出した(xs, ys)と(xt, yt)(ただし、s<t)において、

P = (xsとxt、ysとytの大小関係が同じ向きである組の数)
Q = (xsとxt、ysとytの大小関係が異なる向きである組の数)
Tx = (xs=xtである組の数)
Ty = (ys=ytである組の数)
N = (組の総数) = n(n-1)/2

とおくと、ケンドールの順位相関係数タウaとタウbは以下の式で表される。

ケンドールの順位相関係数τa
ケンドールの順位相関係数τb

LaTex ソースコードLaTex をハイライトする

LaTex ソースコードLaTex をハイライトする

TxとTyがともに0である(同順位がない)場合、タウaとタウbとグッドマン=クラスカルのガンマは同じ値をとる。また、行のカテゴリーと列のカテゴリーのいずれにも順序が存在するr行×c列のクロス集計表があるとき、m=min(r, c)とおくと、ケンドールの順位相関係数タウcは以下の式で表される。

ケンドールの順位相関係数τc

LaTex ソースコードLaTex をハイライトする

なお、エクセル統計により出力されるケンドールの順位相関係数はタウbである。

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降), ケンドールの順位相関係数

エクセル統計2006以降に搭載していますグッドマン・クラスカルのγ(2012以前) / グッドマン=クラスカルのガンマ(2015)

このページのトップに戻る

コーティマックス法
quartimax method

因子分析の因子軸の回転におけるオーソマックス法の1つ。

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

コーティミン法
quartimin method

因子分析の因子軸の回転におけるオブリミン法の1つ。

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

効果量
effect size

群間での平均値の差の程度、変数間の関連の強さなどを、データの単位に左右されないよう標準化したもの。平均値の差なら、標準偏差を基準としたコーエンの標本効果量(Cohen's d)やヘッジズの効果量(Hedges' g)、量的変数の相関の強さならピアソンの積率相関係数などが効果量として用いられている。差の大きさを表す効果量をd族の効果量、関連の強さを表す効果量をr族の効果量と言う。

統計的有意性の検定においては、効果量が大きいほど検出力が高くなる。したがって、大きな効果量が想定されるときはサンプルサイズを小さくできる。

エクセル統計2006以降に搭載しています2群の母平均の差の検定(2012以前) / 母平均の差の検定(2015)

エクセル統計2006以降に搭載しています2群の母平均の差の検定(対応あり)(2012以前) / 母平均の差の検定(対応あり)(2015)

エクセル統計2006以降に搭載しています2群の等分散性の検定(2012以前) / 等分散性の検定(2015)

このページのトップに戻る

交互作用
interactioin

2つの主効果があるときに、主効果を組み合わせたときにだけ現れる作用。

このページのトップに戻る

交差相関
cross correlation

2組の時系列データにおいて、データを1期、2期、…とずらしたときに求める個々の相関を交差相関と言う。またこのときのデータのずれのことをラグ(lag)と言う。2組のデータにおいて、どちらがのデータが、何期、先行しているかを検討する際に用いる。

エクセル統計2006以降に搭載しています交差相関

このページのトップに戻る

交絡
confound

ある結果について2つ以上の原因が考えられ、それぞれの原因が、どの程度結果に影響しているか区別できないとき、交絡していると言う。

このページのトップに戻る

交絡因子
confounding factor / confounder

交絡を発生させる要因のこと。
例えば、飲酒者と非飲酒者では飲酒者の肺癌発生率が高くなる。これは交絡因子である喫煙の影響によるもので、飲酒者に喫煙者が多いことによる。喫煙の有無で分けてから、飲酒者と非飲酒者の肺癌発生率を比べると違いは無くなり、飲酒は肺癌の発症と関連の無いことが分かる。

このページのトップに戻る

コクラン=アーミテージ検定
Cochran-Armitage test

r行×2列のクロス集計表において、行要素のr種類の水準が薬剤の投与量のような順序尺度で、列要素の2水準はある現象が起こるか起こらないかを定義しているとき、行要素のr種類の水準に応じた傾向性があるかどうかの検定を行うこと。

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

エクセル統計2006以降に搭載していますコクラン・アーミテージ検定(2012以前) / コクラン=アーミテージ検定(2015)

このページのトップに戻る

コクランのQ検定
Cochran's Q test

ノンパラメトリック検定の一つ。0か1の2値型で対応のあるデータがあるとき、処理間の比率の差を検定する。対応のある2群の比率の差の検定(マクネマー検定)を拡張したもの。

エクセル統計2006以降に搭載していますコクランのQ検定

このページのトップに戻る

コクラン=マンテル=ヘンツェル検定
Cochran-Mantel-Haenstzel method

2行×2列のクロス集計表が多層に積まれたデータにおいて、層別要因の影響を調整した全体としての独立性の検定と、同じく層別要因の影響を調整した全体としてのリスク比オッズ比の推定を行う。

層がn個あるとき、n個の層間のオッズ比は等しいと仮定し、下式から共通オッズ比を推定することができる。

MH表 共通オッズ比

LaTex ソースコードLaTex をハイライトする

また、共通のカイ二乗値χMH2は下式から求められるので、このカイ二乗値を用いて独立性の検定を行う。

MHのカイ二乗値

LaTex ソースコードLaTex をハイライトする

エクセル統計2006以降に搭載しています多層の2×2表の検定(2012以前)/ コクラン=マンテル=ヘンツェル検定(2015)

このページのトップに戻る

コックス回帰
Cox regression

Cox比例ハザードモデル

エクセル統計2006以降に搭載していますCox比例ハザードモデル(2008以降)

このページのトップに戻る

コックス比例ハザードモデル
Cox proportional hazard model

Cox比例ハザードモデル

エクセル統計2006以降に搭載していますCox比例ハザードモデル(2008以降)

このページのトップに戻る

コバリミン法
covarimin method

因子分析の因子軸の回転におけるオブリミン法の1つ。

エクセル統計2006以降に搭載しています因子分析

秀吉Dplusに搭載しています多変量解析 | 因子分析

このページのトップに戻る

誤判別率
error rate

モデルから予測を行ったときに、実際の観測値と異なる予測をした件数が、全予測件数に占める割合。

エクセル統計2006以降に搭載しています二項ロジスティック回帰分析(2010以降)

このページのトップに戻る

誤分類率
classification error rate

検査の性能を表す指標の一つ。全観測値(被検者)のうち、検査結果と疾患の有無が一致しなかった割合。

誤分類率
疾患合計
ありなし
検査陽性a (真陽性)b (偽陽性)a+b
陰性c (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

LaTex ソースコードLaTex をハイライトする

エクセル統計2006以降に搭載していますクロス集計表の作成と分析(2012以降)

このページのトップに戻る

コホート研究 / コーホート研究
cohort study

異なる特性を持つ複数の患者群(コホート)を時間の流れに沿って観察し、その特性と疾患との関係を調べようとする研究方法のこと。例えば喫煙群と非喫煙群を一定期間観察し、喫煙と肺癌の関係を調べる場合など。前向きコホート研究後向きコホート研究とがある。

このページのトップに戻る

固有値
eigen value

n次の正方行列Aにおいて、Axxを満たす定数λ(ラムダ)とn次ベクトルx(≠0)が存在するとき、λを行列Aの固有値、xを固有ベクトルと言う。固有値はn次の正方行列の場合、重複を含めてn個存在する。

エクセル統計2006以降に搭載しています固有値分解 / 正準相関分析(2015)

このページのトップに戻る

固有ベクトル
eigen vector

固有値

エクセル統計2006以降に搭載しています固有値分解

このページのトップに戻る

固有方程式
eigen equation

Aをn次の正方行列、λを固有値、xを固有ベクトルとしたとき、Axxという式ができ、変形して(A-λIx=0となる。さらに、x0であるので、|A-λI|=0と言える。この式を固有方程式と言う。I単位行列である。

エクセル統計2006以降に搭載しています固有値分解

このページのトップに戻る

コルモゴロフ=スミルノフ検定
Kolmogorov-Smirnov test

2つの標本についてそれぞれの母集団の確率分布が一致しているかどうか、またはある標本の母集団の確率分布が帰無仮説で提示した確率分布と一致しているかどうかを検定すること。KS検定とも言う。

正規性の検定
データの累積確率分布と正規分布の累積確率の差の絶対値の最大値を検定統計量Dとし検定を行う。
コルモゴロフ=スミルノフ検定(正規性)

LaTex ソースコードLaTex をハイライトする

ノンパラメトリック検定
2標本全体のデータを階級下限値として各標本について度数分布を作成し、累積相対度数を求める。同階級における標本間の累積相対度数を比較し、累積相対度数の差の最大値をDとする。このDと2標本のサンプルサイズ(n1,n2)を用いて、下式から統計量KSを求め検定を行う。
コルモゴロフ=スミルノフ検定(ノンパラ)

LaTex ソースコードLaTex をハイライトする

統計解析事例 | 正規確率プロットと正規性の検定・度数分布とヒストグラム

エクセル統計2006以降に搭載しています正規確率プロットと正規性の検定(2008以降) / 2標本コルモゴロフ=スミルノフ検定(2015)

このページのトップに戻る

コレスポンデンス分析
correspondence analysis

クロス集計表の行要素と列要素の2変数の全てのカテゴリーの中から似かよったカテゴリーをまとめることなどを目的とする。対応分析とも言う。1960年代にベンゼクリ(Benzecri)によって提案された。数量化3類双対尺度法、コレスポンデンス分析、最適尺度法、等質性分析はほぼ同じ内容の統計手法である。

エクセル統計2006以降に搭載していますコレスポンデンス分析

このページのトップに戻る

コレログラム
correlogram

異なるラグについて自己相関係数を算出し、横軸にラグ、縦軸に自己相関係数をとったグラフのこと。

エクセル統計2006以降に搭載しています自己相関(2010以降), 交差相関(2010以降)

このページのトップに戻る

コンジョイント分析
conjoint analysis

被験者に商品やサービスのスペックを複数呈示して、スペックに対する選好を尋ねる。その結果からスペックを構成する各要素(機能、デザイン、価格など)が選好にどの程度影響しているかを調べる。スペック組み、スペックの呈示と選好度の計測、部分効用(各要素の選好への影響度合い)の推定の3つのステップからなる。各ステップにおいて様々な方法が考案されており、コンジョイント分析専用のソフトウェアも開発されている。Sawtooth社のACAのように、実験から部分効用の推定、部分効用を用いたマインドシェアのシミュレーションまでパッケージ化されたソフトウェアもある。

このページのトップに戻る

統計WEB

主催:社会情報サービス統計調査研究室

Google
ウェブ検索
サイト内検索