我对运行如下代码时获得的不同结果感到困惑:
set.seed(100)
test1<-randomForest(BinaryY~., data=Xvars, trees=51, mtry=5, seed=200)
predict(test1, newdata=cbind(NewBinaryY, NewXs), type="response")
和这段代码:
set.seed(100)
test2<-randomForest(BinaryY~.,data=Xvars,trees=51, mtry=5,seed=200,xtest=NewXs, ytest=NewBinY)
我认为由于相同的种子设置,两个森林的混淆矩阵是相同的,但它们的不同之处在于预测值和投票。起初我以为这只是关系被打破的方式,所以我将树的数量更改为奇数,这样就不再有关系了。
任何人都可以阐明我希望是一个简单的疏忽吗?我只是不明白为什么这两个森林应用于 NewBinaryYs 和 NewX 数据集的预测结果会不同。
另外,我注意到当我只使用一棵树时,结果是相同的。
感谢您的任何提示和帮助。
我相信 xtest 和 ytest 指定了随机森林运行本身的测试集,以便它使用它而不是随机选择的 OOB 样本。如果是这种情况,那么您的两次运行将使用不同的测试数据集,从而产生不同的结果。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)