有人可以帮助我解释别名函数输出,以测试多元回归模型中的多重共线性。我知道我的模型中的一些预测变量是高度相关的,我想使用别名表来识别它们。
Model :
Score ~ Comments + Pros + Cons + Advice + Response + Value + Recommendation
+ 6Months + 12Months + 2Years + 3Years + Daily + Weekly + Monthly
Complete :
(Intercept) Comments Pros Cons Advice Response Value1
UseMonthly1 0 0 0 0 0 0 0
Recommendation1 6Months1 12Months1 2Years1
UseMonthly1 0 1 1 1
3Years1 Daily1 Weekly1
UseMonthly1 1 -1 -1
值、推荐、6 个月、12 个月、2 年、3 年、每日、每周和每月是二元分类变量。
分数、评论、优点、缺点、建议和响应是数值变量。
我可以假设 UseMonthly 与 6 个月、12 个月、2 年、3 年、每日、每周高度相关吗?别名输出中的 1 和 -1 值有什么区别?是正相关还是负相关?
“完整”矩阵中的非零项表明这些项线性依赖于UseMonthly
。这意味着它们高度相关,但项可以高度相关而不线性相关。
如果您的目的是识别并删除相关变量,则应该删除UseMonthly
,但您可能还想删除其他的。识别可能存在多重共线性问题的变量的一种常见方法是搜索大方差膨胀因子(例如通过计算)car::vif
).
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)