ある産婦人科医の備忘録

産婦人科医の臨床、研究、考えについて

アウトカムが連続変数かつ説明変数も連続変数のときに、説明変数にカットオフ値を設けるには?

アウトカムが連続変数かつ説明変数も連続変数のときに、説明変数にカットオフ値を設けるにはどうしたらいいんだろう?と数年前に悩んだことがあったので記録しておく.

 

例えば、

・アウトカム 出血量 (連続変数)

・説明変数 体重 (連続変数)

この2変数で散布図を書いたときに,きれいな線形性の関係がなく

ある体重の値の前後で明らかに出血量が違いそうな場合

(やっつけ図↓)

 

カットオフの決め方

図からだいたいのこの値だろう! とするのは恣意的であり問題.

 

そんなときは,体重(説明変数)をカテゴリーする

このカテゴリー化も恣意性を無くすために等間隔 10kg毎に分割などとする

 

そして説明変数がカテゴリー化できたら分散分析を行う.

カットオフで有意ならそれを提示することができる.

 

 

他には非線形な回帰を行う方法もあるが,これはカットオフを提示するものではないし,

説明可能性が下がることもある.

 

 

まとめ:

アウトカムが連続変数かつ説明変数も連続変数のときに、説明変数にカットオフ値を設けるにはどうしたらいいんだろう?

→ 説明変数をカテゴリー化して分散分析を行う!