研究計画に統計解析の知識が必須である理由

統計雑学

みなさんこんにちは。管理人のハル(@haru_reha)です。今回は研究計画を立てる上で統計解析の知識が必須である理由について書きました。研究初心者の方で、これから研究を始めたい、という方に読んでもらいたい記事になります。

スポンサーリンク

研究計画は大事

「研究計画」は研究を行う上で非常に重要になる部分です。家を建てる前に綿密な設計図を作るように、研究を始める前にも設計図を作っておく必要があるわけです。

良い研究というのは必ず事前に良い研究計画が立てられています。偶然から生まれる研究もあるとは思いますが、やはり研究計画がないとどこかに足りないデータがあったり、バイアスが大きなデータになってしまいます(良い研究が偶然から生まれる可能性はかなり低い)。

研究計画では、研究で明らかにしたい目的を達成するために、どのようなアウトカムを設定すれば良いのかを考えます。

アウトカムの設定には統計解析の知識が必要

どのようなアウトカムをとって、それをどのように比較するのかを考える際、統計解析の知識が必要となってきます。

というのも、統計解析を使ってどのようなデータでどのような比較ができるのかを知っておかなければ、そもそもアウトカムをどう設定してよいかも分かりません。

私も統計解析の知識が少ないときに、研究計画なしでとりあえずデータを集めていたことがあったのですが、行き当たりばったり感が強く、データを見ても結局なにも明らかにできないという状況になったことがあります。

「初めに目的があって、それを明らかにするためにデータを収集する」というのが正しい流れであって「初めにデータありきで、そこからなにかを明らかにできないか」と考えるのはやはり順序が逆なんですよね。

研究で明らかにしたい目的を達成するために、どのようなデータを収集して、どのような比較を行うのかを事前に考えておく必要があります。

統計解析の種類を把握しておく

シロート統計学講座の方でも説明していますが、医学研究で使われる統計解析はある程度決まっています。まずはその基本的な統計解析の種類を知っておくことで、どのようにアウトカムを比較できるのかを考えることができるようになります。

統計解析にはどんな種類があるのか
シロート統計学講座「其の3」

「独立した群」か「対応のある群」のどちらを作るのか、また「連続変数を比較する」のか「比率を比較する」のか、などを考えていくわけですね。

たとえば「治療Aと治療Bの効果の違いをみたい」というclinical questionを持っていたとすると、A群とB群の独立した2群を作って治療後の血液データを連続変数として比較することができるなーとか、陽性・陰性などの名義変数でアウトカムをとれるなら治療後にその比率が変化するかをみてもいいなー、という具合です。

また治療前と治療後でデータをとって「対応のある2群」と考えて、それをA群とB群で群別して変化率を比較してもいいなー、とかいう感じです。

先にどんな比較をすることができるかを考えておいて、目的を達成するためにはどのアウトカムを比較するのが最も適しているかを決めていきます。

交絡因子の補正についても考えておく

また、ただ比較をするのみだと沢山の交絡因子が出てくることが予想されますので、治療前の背景因子で治療後の状態に影響を与えそうな因子をピックアップしておき、後で多変量解析で補正することを考えておきます。

そして多変量解析を行うためには相応のサンプル数が必要となりますので、補正したい因子を投入するためにどの程度のサンプル数が必要になるのかも決めておきます。

多変量解析における独立(説明)変数の選び方
シロート統計学「其の26」

まとめ

このように、医学研究で使われる統計解析にはどのような種類があるのかを知っておくことで、事前に研究計画を立てることが可能になります。

研究したい気持ちが高まってくると、とりあえず早くデータを集めたいという衝動が出てくることもあろうかと思いますが、まずはきっちりと研究計画を立てることが先決です。

みなさんも楽しい研究ライフをお過ごしください。ではまた。

コメント