母比率の差の検定(1標本): Hypothesis Testing for the difference of Population Proportions for One sample
概要
サンプルサイズ( \(n\) )と1標本に含まれるカテゴリ1、2のサンプルサイズを元にカテゴリ1の比率( \(p_1\) )と、カテゴリ2の比率( \(p_2\) )が等しいという帰無仮説:「\(p_1 = p_2\)」を統計的に検定します。片側検定の対立仮説はカテゴリ1の母比率がカテゴリ2の母比率より大きい「\(p_1 > p_2\)」、あるいは、小さい「\(p_1 < p_2\)」です。 両側検定とするか片側検定とするかは検定を行う前に分析者が決定します。片側検定の場合、カテゴリ1の母比率の方が大きいという対立仮説を立てていながら、観測して得られたカテゴリ1の母比率の方が小さかったというように対立仮説に反する結果が得られたときは、P値に関わりなく統計的有意ではなかったと判断します。
この手法を用いるケースとして例えば、あるクラスの中で血液型がA型の人とB型の人の比率を比較する場合、A型かつB型の人はいません。このようなケースを「排反」と呼びます。一方、カレー好きの人とラーメン好きの人の比率を比較する際、両方を好む人がいれば、このようなケースを「重複」と呼びます。
分析例ファイルのダウンロード
母比率の差の検定(1標本)を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
「データベース形式」、「要約データ形式」のデータを計算することができます。
データベース形式
- 先頭行を変数のラベルとして扱います。
- ラベル行を除いて各列に1件以上のデータを含みます。
- 「空白」や「文字」のデータは「ケースワイズ」で計算から除かれます。
- 値は0又は1である必要があります。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ
- 行数1~60,000行
- 列数2列
データ内容
- 数値○:処理可
- 文字列欠損値として除く
- 空白欠損値として除く
要約データ形式
- 先頭行を変数のラベルとして扱います。
- 2行目を「サンプルサイズ」として計算に用います。
- 欠損値がある場合は計算を行いません。
- 「サンプルサイズ」が0または負の場合は計算を行いません。
- 3列の場合は重複の比率を0(排反)として扱います。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ
- 行数1行
- 列数3~4列
データ内容
- 数値○:処理可
- 文字列×:処理不可
- 空白×:処理不可
設定項目
Excelの[エクセル統計]タブから、[1標本の推定と検定]→[母比率の差の検定(1標本)]を選択すると以下のダイアログが表示されます。
- データ入力範囲 必須
- 2列の実データまたは3列~4列の要約データの範囲を指定します。
- 実データの場合、ラベル行を除いて各列に1件以上のデータが必要です。「空白」や「文字」のデータは「ケースワイズ」で計算から除かれます。要約データの場合は、変数(列)ごとにサンプルサイズの数値が必要です。
- 先頭行をラベルとして使用
- 入力範囲の先頭行が変数ラベルの場合、このチェックボックスをオンにします。初期設定はオンになっています。
- データ内容 必須
- データの内容に合わせて[実データ]と[要約データ]のいずれかを選択します。
出力内容
nと比率 | 有効なサンプルサイズとその比率 |
---|---|
母比率の差の95%信頼区間 | 2つの比率の差の95%信頼区間の下限値と上限値 |
母比率の差の検定(1標本) | 帰無仮説「1標本内の2カテゴリの比率は等しい」について、正規分布に従う統計量を用いて検定した結果 |