こんにちは。管理人のハル(@haru_reha)です。今回は、EZRで連続変数を因子(名義変数)に変換する方法をご紹介します。
この方法が必要となる場面としては、因子を0, 1で表している場合や、順序変数を名義変数として扱いたい時などです。数値を因子として扱うようEZRに指定することができます。
例えば↓のデータをみてください。
Ageは年齢、Sexは性別を表しています。Ageは連続変数ですので数値で問題はありませんが、性別は0=男、1=女と定義して数値化してあります。データ管理に慣れてくると、このように名義変数も数値で表した方がシンプルになります。
しかしデータをEZRにインポートすると、EZRはSexをint(整数)として認識します。変数の種類はデータセット内の変数を一覧することで確認できます。
0, 1のような二値変数であればint(整数)のまま色々な検定をかけてもあまり問題はないのですが、0, 1, 2のように三値以上の場合は多変量解析を行う時などに解釈が異なってきますので因子への変換が必要となります。
では実際に連続変数を因子に変換してみましょう。
「アクティブデータセット」→「変数の操作」→「連続変数を因子に変換する」を選択します。
そして変数は「Sex」、因子水準は「数値で」を選択してOKを押します。
これで数値が因子として扱われるようになります。再度データセット内の変数を一覧してみると、SexがintからFactor(因子)に変わっています。
以上が連続変数を因子(名義変数)に変換する方法になります。シロート統計学講座では初心者の方を基本的な統計解析が実施できるレベルまで導きます。統計学を学びたいという方は是非覗いてみてくださいね。>>シロート統計学講座TOPへ
コメント