EZRでWilcoxon符号付順位和検定を行う方法

EZRの使い方

2018.04.202021.12.07

シロート統計学講座其の14

其の13では「対応のある2群間の連続変数を比較する」統計解析で、パラメトリック検定である対応のあるt検定を実践しました。

▼其の13がまだの方はこちら▼

EZRで対応のあるt検定を行う方法

シロート統計学講座「其の13」

今回は同じく「対応のある2群間の連続変数を比較する」統計解析で、ノンパラメトリック検定であるWilcoxon符号付順位和検定をやってみます。

改めて伝えておきたいのですが、色々と出てくる検定名を覚える必要はないですからね。あくまでどんな統計解析なのかを理解しておくことが大事です。今回で言うと対応のある2群間の連続変数を比較する統計解析で、ノンパラメトリック検定である、ということですね。

逆に「対応のある」や「連続変数」、「ノンパラメトリック」などの用語はしっかりと理解しておく必要があるので、忘れた方は↓で再度ご確認ください。

統計学で理解すべき用語①

シロート統計学講座「其の４」

連続変数を比較する統計解析の選択方法

シロート統計学講座「其の７」

スポンサーリンク

目次

デモデータ
データの取り込み
データを要約する
Wilcoxon符号付順位和検定を行う
まとめ

デモデータ

今回もEZRを一緒に操作して学べるよう、デモデータをダウンロードできますので必要な方はどうぞ。

デモデータ（wilcoxon符号付順位和検定）

今回は20人を対象として手術前（pre）と手術後（post）で6分間歩行後の修正ボルグスケールを調べた仮想データとなります。修正ボルグスケールとは、患者の自覚的なつらさを0～10（0.5を含む12段階）で表す評価です。

スコアリングした値（順序変数）を比較する場合にはノンパラメトリック検定でしたね。その他、連続変数であってもn数が30以下（目安）で、正規分布に従わない場合はノンパラメトリック検定を使用しますよ。

では、はじめましょう。

データの取り込み

まずはデータをEZRに取り込みますね。

データを囲った状態で「右クリック」→「コピー」（Ctrl＋Cでも可）。

Rコマンダーの画面で「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからテキストデータを読み込む」

データセット名は「borg」、あとは「クリップボード」と「タブ」にチェックを入れて「OK」

データセット名が「borg」になったことを確認し、「表示」をクリックしてきちんとデータが表示されれば取り込み完了です。

データを要約する

検定を行う前に、取り込んだデータがどんなデータなのか眺めてみましょう。

「統計解析」→「連続変数の解析」→「連続変数の要約」

変数は「pre」「post」の両者を選択して「OK」。
（ctrlキーを押しながらクリックすると複数選択できます）

すると両群の要約が表示されます。

今回はスコアリングした値（順序変数）を見ていますので、右側の%で記載された部分に注目します。まず0％は最小値、100％は最大値を示していますね。

50％は中央値です。中央値は、データを並べてその真ん中にくる値でしたよね。スコアリングした値（順序変数）の代表値は中央値で表します。

25％は25パーセンタイル値と呼ばれ「全サンプルの25％がその値以下である」ことを示します。75パーセンタイル値も同様に「全サンプルの75％がその値以下である」ことを表しますね。

今回のデータは、preでは中央値2.5(0-8)に対して、postでは中央値5.0(2-9)となっていますので、なんとなくpostの方が高そうですね。

Wilcoxon符号付順位和検定を行う

では、実際にWilcoxon符号付順位和検定を行ってみましょう。

「統計解析」→「ノンパラメトリック検定」→「対応のある2群間の比較（Wilcoxon符号付順位和検定）」

第1の変数「pre」、第2の変数「post」を選択して「OK」。

するとWilcoxon符号付順位和検定が実行され、結果が表示されます。

P値は0.05未満になっていますから「有意差あり」ですね。よって今回は「術後は術前と比較して有意にボルグスケールが増加した」となります。

まとめ

以上、EZRでWilcoxon符号付順位和検定を行う方法を紹介しました。

私は呼吸器分野の研究をよく行うので、修正ボルグスケールの比較で割とお世話になっている検定です。対応のあるt検定と同様、初期評価と最終評価での比較などを行うことができますね。

ノンパラメトリック検定では平均値ではなく中央値をみる、というのもポイントです。学会発表の抄録や論文を書く際には中央値〇（最小値-最大値）というような書き方をします。中央値は外れ値に引っ張られることが少ないので、バラツキの大きいデータを表す際に有用です。

中央値についてもう少し知りたい方は>>>平均値と中央値

さて、次回は「独立した2群間の比率を比較する」統計解析であるFisherの正確検定を実施します。この検定は、研究で2群間の性別を比較する時などに使用する検定となります。

▼其の15に続く▼

EZRでFisherの正確検定を行う方法

シロート統計学講座「其の15」

>>>シロート統計学講座のTOPへ戻る

《シロート統計学講座 in YouTube》

EZRでWilcoxon符号付順位和検定を行う方法を動画にしてみました。ブログを読んだあと、実際にEZRを操作している所をこちらで見てみてください。

コメント

タイトルとURLをコピーしました