我有一个要求,需要根据分类变量(具有超过 5 个类别值)与连续变量的关联将其分为 5 组。为了实现这一目标,我正在使用rpart with "annova“ 方法。
例如我的分类变量是type有代码1,2,3,4,5,6,7,8,9,10,11,12,13,14,15所以我想要有 5 组这个变量。运行树后为了只有 5 个组,我需要修剪树。我尝试的一种方法是使用nsplit from cptable但是, 5 的 nsplit 可能会给我 7-8 个叶子,类似地nsplit4 片可能会给我 5-6 片叶子。
我正在寻找一种选择,当我修剪时,我只得到 5 片叶子,这将作为我的 5 组。
有人可以建议我如何使用 rpart 来实现这一目标吗?
谢谢 !!
None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)