正規確率プロットと正規性の検定 : Plotting the Normal Probability and Testing for the Normality
概要
正規確率プロットと5種類の正規性の検定を出力します。
正規確率プロットは、データの分布が正規分布を示しているかどうかを視覚的に判断するための散布図です。X軸に元データまたは標準化した元データ、Y軸に期待値を使用した正規Q-Qプロットと、X軸に元データの累積確率、Y軸に期待値の累積確率を使用した正規P-Pプロットを作成します。データが正規分布に近いほど、直線的にプロットされます。
正規性の検定として、「歪度によるダゴスティーノ検定」、「尖度によるダゴスティーノ検定」、「歪度と尖度によるオムニバス検定」、「コルモゴロフ=スミルノフ検定」、「シャピロ=ウィルク検定」を出力します。コルモゴロフ=スミルノフ検定は、リリフォースによる修正を適用しており、コルモゴロフ=スミルノフ=リリフォース検定とも言われます。
なお、本製品の基本統計量に出力される歪度と尖度は、Excel のワークシート関数が出力する値とは異なります。これは、正規性の検定で用いる歪度と尖度の定義に合わせているためです。データが正規分布しているとき、本製品で出力される歪度は0、尖度は3になります。
注意事項
ワークシートに計算式を出力するため、Excelの「計算方法」が「手動」の場合は「自動」に変更されます。
分析例ファイルのダウンロード
正規確率プロットと正規性の検定を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
「データベース形式」のデータを計算することができます。
- 先頭行を変数のラベルとして扱います。
- 2行目以降を各変数の観測値として計算に用います。
- 列ごとに欠損値を除いて計算を行います。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ
- 行数3~60,000行
- 列数1~100列
データ内容
- 数値○:処理可
- 文字列欠損値として除く
- 空白欠損値として除く
正規性の検定のサンプルサイズの制限
歪度によるダゴスティーノ検定 | 8~60,000件 |
---|---|
尖度によるダゴスティーノ検定 | 20~30,000件 |
歪度と尖度によるオムニバス検定 | 20~30,000件 |
コルモゴロフ=スミルノフ検定 | 5~30,000件 |
シャピロ=ウィルク検定 | 3~5,000件 |
出力内容
基本統計量 | 「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「最小値」、「最大値」、「歪度」、「尖度」 |
---|---|
正規性の検定 | 「歪度によるダゴスティーノ検定」、「尖度によるダゴスティーノ検定」、「歪度と尖度によるオムニバス検定」、「コルモゴロフ=スミルノフ検定」、「シャピロ=ウィルク検定」の結果がそれぞれ出力されます。シャピロ=ウィルク検定は、サンプルサイズが5,000を超える場合は計算できません。 |
正規確率プロット | 元データを使用した「正規Q-Qプロット」、標準化した元データを使用した「正規Q-Qプロット[標準化]」、「正規P-Pプロット」のそれぞれのグラフ用データ |
【グラフ】正規確率プロット | 元データを使用した「正規Q-Qプロット」、標準化した元データを使用した「正規Q-Qプロット[標準化]」、「正規P-Pプロット」 |
※:複数の変数(列)を選択した場合、変数(列)ごとに新しいワークシートが追加され、結果が出力されます。
参考文献
- Gerard E. Dallal, Leland Wilkinson, An Analytic Approximation to the Distribution of Lilliefors's Test Statistic for Normality, The American Statistician, Vol. 40, No. 4. (Nov., 1986), pp. 294-296.
- Hubert W. Lilliefors, On the Kolmogorov-Smirnov Test for Normality with Mean and Variance Unknown, Journal of the American Statistical Association, Vol. 62, No. 318. (Jun., 1967), pp. 399-402.
- N. L. Jonson, Tables to facilitate fitting Sv frequency curves, Biometrika, Vol. 52, No. 3/4 (Dec., 1965), pp. 547-558.
- 柴田 義貞, "正規分布―特性と応用", 東京大学出版会, 1981.