こんにちは。管理人のハルです。
今日は、論文などで重回帰分析の結果を記載する際によく使用される「偏回帰係数(B)」と「標準化偏回帰係数(β)」についてまとめておきます。
偏回帰係数(B)と標準化偏回帰係数(β)はどう違うのか、簡潔に書いておきます。
まずはおさらい
まずは多変量解析のおさらいです。
多変量解析とは
ある結果を表す変数をその他の変数によってどの程度説明(予測)できるか
参考 フリー統計ソフトEZRで誰でも簡単統計解析(P151)
というものでした。
言い換えると、「ある結果」に対して「他の因子」がどれくらい影響を与えているのかを調べることができるわけです。
そして「ある結果」は「従属変数(または目的変数)」、「他の因子」は「独立変数(または説明変数)」と呼ばれていました。
多変量解析のうち、従属変数(目的変数)が連続変数となる場合に行う多変量解析が重回帰分析となります。
詳しくは過去記事⇩でまとめています。
EZRで重回帰分析を行う方法については⇩です。
偏回帰係数(B)とは?
重回帰分析を実行すると、以下のような予測式が得られます。
これは式で表すと
偏回帰係数1×独立変数A+偏回帰係数2×独立変数B+偏回帰係数3×独立変数C・・・+切片
となります。
このように独立変数の前には係数がつきます。この係数のことを「偏回帰係数(B)」と呼びます。偏回帰係数×独立変数(連続変数ならその数値を、名義変数なら0か1などを代入)の値と切片を足し算することで従属変数を予測しようとしているわけですね。
標準偏回帰係数(β)とは?
しかし、偏回帰係数(B)は、係数同士を比較して影響の大きさを比べることはできません。
…というのも偏回帰係数(B)は独立変数の大きさや単位に依存していますので、異なる独立変数同士の係数を比較しても全く当てになりません。
そこで、独立変数の大きさや単位が異なっても比較できるように標準化したものが「標準化偏回帰係数(β)」と呼ばれるものです。
具体的には
=偏回帰係数(B)×独立変数の標準偏差÷従属変数の標準偏差
で計算されます。
標準化を行うことで独立変数の大きさや単位が異なっていても、相対的な係数の大きさを調べることができます。つまり標準化偏回帰係数(β)同士を比較することで、従属変数に与える影響を比較することも可能になるということです。
まとめ
かなり簡潔ですが、偏回帰係数(B)と標準化偏回帰係数(β)の違いをまとめました。
EZRで重回帰分析を行う場合、実は偏回帰係数(B)しか表示されません。そのため、標準化偏回帰係数(β)を求めるためには少しだけコマンド入力が必要となります。その方法についてはまた別の機会にまとめようと思います。
※2020/02/13追記
「EZRで標準化偏回帰係数(β)を計算する方法」についてはnoteに書きました。こちらは300円の有料記事となっていますが、ご興味のある方はぜひご覧ください。
それでは、また!
コメント
変数を標準化する方法ですが、標準メニュー→データ→アクティブデータセット内の変数の管理→変数の標準化ではだめなのでしょうか。
ご教示いただけると幸いです。
EZR使いたて さま
コメントありがとうございます。
「標準メニュー」からの「変数の標準化」はいわゆる「(データ – 平均値)/ 標準偏差」を計算してくれるものかと思います。
βの場合ですと「(偏回帰係数×独立変数の標準偏差)/ 従属変数の標準偏差」となるので難しいように感じるのですが、もし出来そうな方法があれば教えて頂きたいです。