アウトカムが連続変数かつ説明変数も連続変数のときに、説明変数にカットオフ値を設けるにはどうしたらいいんだろう?と数年前に悩んだことがあったので記録しておく.
例えば、
・アウトカム 出血量 (連続変数)
・説明変数 体重 (連続変数)
この2変数で散布図を書いたときに,きれいな線形性の関係がなく
ある体重の値の前後で明らかに出血量が違いそうな場合
(やっつけ図↓)
カットオフの決め方
図からだいたいのこの値だろう! とするのは恣意的であり問題.
そんなときは,体重(説明変数)をカテゴリーする
このカテゴリー化も恣意性を無くすために等間隔 10kg毎に分割などとする
そして説明変数がカテゴリー化できたら分散分析を行う.
カットオフで有意ならそれを提示することができる.
他には非線形な回帰を行う方法もあるが,これはカットオフを提示するものではないし,
説明可能性が下がることもある.
まとめ:
アウトカムが連続変数かつ説明変数も連続変数のときに、説明変数にカットオフ値を設けるにはどうしたらいいんだろう?
→ 説明変数をカテゴリー化して分散分析を行う!