シロート統計学講座 其の15
其の14ではEZRで「対応のある2群間の連続変数を比較する」統計解析で、ノンパラメトリック検定のWilcoxon符号付順位和検定を実践しました。
▼其の14がまだの方は▼

今回は「独立した2群間の比率を比較する」統計解析の1つであるFisherの正確検定を行う方法を説明します。
「独立した」とか「比率の比較」などの用語のイメージが沸きにくいという方は「其の4」で確認してくださいね。またEZRのダウンロードがまだの方はWindows・Macとも無料でダウンロードできますので、ぜひどうぞ。


デモデータ
デモ用のExcelファイルをダウンロードできます。時間のある方はデモデータを使って一緒にEZRを操作してみてくださいね。
今回のデモデータはA群(20人)とB群(20人)で男女比を調べた仮想データです。
研究で2群間の背景因子を比較する場合、性別の比較はほぼ必須ではないでしょうか。ぱっと見た感じA群は女性が多くて、B群は男性が多いようですが、これは統計学的な有意差があるのでしょうか。実際にEZRでFisherの正確検定を行って比較してみましょう。
データの取り込み
まずはデータをEZRに取り込みます。ここはもうお馴染みの手順ですね。
Excelでデータを囲った状態で「右クリック」→「コピー」(ctrl+Cでも可)。
Rコマンダーのウィンドウで「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからテキストデータを読み込む」。
データセット名は「sex」にして「クリップボード」と「タブ」にチェックを入れて「OK」。
データセットが「sex」になったことを確認し、表示をクリックしてきちんとデータが表示されれば取り込み完了です。
Fisherの正確検定を行う
では実際にFisherの正確検定を行って、A群とB群で男女比に差があるのか解析してみましょう。
「統計解析」→「名義変数の解析」→「分割表の作成と群間の比率の比較(Fisherの正確検定)」
行の変数を「Sex」、列の変数を「category」とします。
「パーセントの計算」にチェックをいれておくと、結果に男女比(%)も表示されます。
仮説検定は「フィッシャーの正確検定」にチェックして「OK」。
するとFisherの正確検定が実行され、結果が表示されます。
少し上の方にA群、B群の男女内訳が表示されます。
そして次にA群、B群の男女比が表示されます。
A群は女性が60%、B群では35%ですね。
最後にP値が記されています。
P値が0.05未満の場合に「有意差あり」となりますので、今回は「有意差なし」でした。つまり「A群とB群の男女比には有意差は認められなかった」となります。
まとめ
以上、EZRでFisherの正確検定を行う方法を説明しました。ちなみに、独立した2群間の比率を比較するもう一つの統計解析は「カイ2乗検定」ですね。
比率の比較を行うのは基本的にはFisherの正確検定で問題ありませんが、極端に大きなサンプル(n≧100程度)の場合にはカイ二乗検定を選択します。
【Fisherの正確検定とカイ二乗検定の使い分けについて】
>>>比率の比較と多変量解析の検定名
>>>期待数の計算方法
カイ二乗検定を行う際は、仮説検定で「カイ二乗検定」にチェックを入れておけばOKですよ。
独立した2群間での比率の比較は、研究を行う際の背景因子の比較などで何度も使用すると思います。今回は男女比でしたが、名義変数のデータであれば基本的に何でも検定できます。「男性・女性」の2種類でなくても「A型・B型・O型・AB型」のように数種類でも比較可能です。ぜひ、色々と比較してみてください。
さて、今回はFisherの正確検定・カイ二乗検定について紹介できましたので、次回は「対応のある2群間の比率を比較する」統計解析であるMcnemar(マクネマー)検定を行います。
▼其の16に続く▼

《シロート統計学講座 in YouTube》
EZRでFisherの正確検定を行う方法を動画にしてみました。ブログを読んだあと、実際にEZRを操作している所をこちらで見てみてください。
コメント