こんばんは。管理人のハル(@haru_reha)です。
シロート統計学講座では変数の分類として名義変数・順序変数・連続変数の3つを覚えておくとよい、と説明しております。データ解析時には上記の分け方で、私は特に困ったことはないです。
しかし、統計学の教科書をみていると「間隔尺度」「比例尺度」の説明が出てきますよね。
今回はこれについて少し書いておきたいと思います。
変数の分類
日本統計学会(編)の統計学基礎では、変数を以下の4つに分類しています。
①名義尺度、②順序尺度、③間隔尺度、④比例尺度 の4つです。
名義尺度は「性別」「好きな色」「職業」といった名義で表されるデータでしたね。教科書では「同じ値かどうかのみ意味がある」と説明されています(なるほど!)
そして順序尺度は、いわゆるスコアリングされた値のように、無限ではないが順序に意味があるデータでした。理学療法の世界ではMMTやHDS-R、がんステージなどがそれに当たります。教科書では「値の大小関係に意味がある」データとされています。
間隔尺度・比例尺度に関しては、シロート統計学講座で「連続変数」として扱っていた変数をより細かく分けたような感じになりますね。
順番に見てみましょう。
間隔尺度とは
間隔尺度は「値の大小関係と値の差の大きさに意味があり、値0は相対的な意味しかもたない」と説明されています。
これだけだと分かりにくいですよね。
間隔尺度の代表例は「気温」です。
まず「値の大小関係」というのは、値を比べた時にどちらの方が大きい(小さい)かが分かるということですよね。名義尺度の場合は値の大小関係がありませんでしたね。間隔尺度は値の大小関係があり、例えば気温が10℃と30℃では後者の方が「気温が高い」と判断できますよね。
次に「値の差の大きさ」というのはどうでしょうか。気温で言うと10℃と30℃であれば、前者よりも後者の方が「20℃高い」という風に値の差に意味があります。順序尺度は値の大小関係には意味がありましたが、値の差の大きさには意味がありませんでした(例えばMMTなら2と4で、後者の方が2大きいという解釈には意味がない)。
最後に「値0は相対的な意味しかもたない」というのは、0が「ない」ということを示さないということです。例えば体重は0kgであれば「体重がない(存在しない)」ことを表しますが、気温0℃は「気温がない」とはなりません。気温はマイナスの場合もありますので、0℃というのは相対的な意味を持つことになります。
気温のようなデータを間隔尺度と言います。
比例尺度とは
次に比例尺度についてです。
比例尺度は「値の大小関係と値の差の大きさ・比に意味があり、値0が絶対的な意味をもつ」と説明されています。
比例尺度の代表例は身長、体重、年齢などです。
例えば身長であれば、150cmと180cmでは「値の大小関係」も分かり、「値の差の大きさ」も30cmと意味があります。また100cmと200cmであれば、「後者は前者の2倍」であると解釈でき、比にも意味を持ちます。間隔尺度は比に意味はなく、例えば気温は5℃と10℃で2倍になったとは言えません。
そして身長が0cmであれば「身長がない(存在しない)」との解釈になるので0が絶対的な意味を持ちます。つまり、0が原点になり、間隔と比に意味を持つことになります。
身長、体重、年齢などのようなデータを比例尺度と呼びます。
まとめ
以上、間隔尺度と比例尺度についてを説明しました。
基本的にデータ解析時には間隔尺度と比例尺度を区別せずに「連続変数」として捉えても大きな問題はないように思いますが、より厳密にみると尺度の違いがあります。
ちなみに尺度は名義尺度<順序尺度<間隔尺度<比例尺度の順で上位の尺度と捉えることができます。上位の尺度は下位の尺度の意味も持ち合わせています。つまり比例尺度は、場合によっては名義尺度と捉えることも、順序尺度と捉えることも可能です。
上位の尺度の方が情報量を多く持っていると言えるので、臨床でデータを集める際などは、メインのアウトカムはなるべく上位の尺度に設定した方が融通がききやすくなるかもしれませんね。
では、また。
コメント