現在位置 : 統計WEB統計解析事例|エクセル統計2012 - ROC曲線

ROC曲線

※ このコンテンツは「エクセル統計2012」を用いた解析事例です。

分析データ

下図は、45人の患者を対象に行った2種類の検査の結果と疾患の有無のデータです。エクセル統計を用いてROC曲線を作成することで、2つの検査の性能を比較します。

2種類の検査の性能比較データ

ダイアログの設定

下図のようにセル範囲「B3:C3」を選択後、[Ctrl]キーを押しながらセル「D3」を選択します。メニューより[エクセル統計]−[管理図・ROC曲線]−[ROC曲線]を選択します。

データ範囲の先頭行を選択

ダイアログが表示される際、セル範囲「B3:C48」が[検査データ範囲]に、セル範囲「D3:D48」が[状態データ範囲]に自動で指定されます。今回のデータは有病患者が低い検査値となる傾向があるので、[検査データの分布]を[信号あり < 信号なし]とします。[OK]を選択して結果を出力します。

[ROC曲線]ダイアログ

基本統計

各検査ごとに疾患ありのデータと疾患なしのデータのそれぞれについて、サンプルサイズ、平均不偏分散標準偏差、最小値、最大値が出力されます。

基本統計

ROC曲線

以下のようなROC曲線が出力されます。縦軸のTPF(True Positive Fraction)は真陽性率であり、感度を表します。横軸のFPF(False Positive Fraction)は偽陽性率であり、1−特異度を表します。

ROC曲線

ROC曲線下の面積

各検査のROC曲線下の面積が出力されます。AzまたはAUC(Area Under the Curve)で表され、値が1に近いほど判別の性能が良いことを表します。今回のデータでは、検査Aは「0.909」、検査Bは「0.751」となり、検査Aは検査Bよりも性能が良さそうです。

ROC曲線下の面積

ROC曲線データ

ROC曲線の各基準点ごとのFPFTPFオッズ比が出力されます。ROC曲線のグラフ用データとして用いられています。

ROC曲線データ

各基準点で以下のようなクロス集計表を作成し、TPFFPFオッズ比を計算します。

TPFとFPFとオッズ比を求める数式
疾患合計
ありなし
検査値基準点より小さいa (真陽性)b (偽陽性)a+b
基準点より大きいc (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

左上隅から最も近い点

ROC曲線において左上隅の座標(0, 1)から最も近い点が出力されます。カットオフ値の候補となります。

左上隅から最も近い点

斜線から最も離れた点

ROC曲線において斜線から最も離れた点が出力されます。カットオフ値の候補となります。

斜線から最も離れた点


※ 掲載している画像は、エクセル統計による出力後に一部書式設定を行ったものです。

ダウンロード

この解析事例のExcel ファイルのダウンロードはこちらから → example_25.xls

関連リンク



トップに戻る

統計解析事例一覧に戻る

最終更新日:2012.8.8

統計WEB

主催:社会情報サービス統計調査研究室

Google
ウェブ検索
サイト内検索