我在用着这个LDA包 https://cran.r-project.org/web/packages/lda/对于 R。具体来说,我正在尝试做监督潜在狄利克雷分配(slda) https://www.cs.princeton.edu/~blei/papers/BleiMcAuliffe2007.pdf。在链接的包中,有一个slda.em
功能。然而令我困惑的是它要求提供 alpha、eta 和方差参数。据我了解,我认为这些参数在模型中是未知的。所以我的问题是,该包的作者是否想说这些是对参数的初步猜测?如果是,似乎没有办法从运行结果中访问它们slda.em
.
除了在算法中编码额外的 EM 步骤之外,是否有建议的方法来猜测这些参数的合理值?
由于您正在尝试生成监督模型,因此典型的方法是使用交叉验证以确定模型参数。因此,您保留一些数据作为测试集,在剩余数据上训练模型,并评估模型性能,重复 k 次。然后,您继续使用不同的模型参数进行重复,以确定哪个参数可以产生最佳模型性能。
在 slda 的具体情况下,我会运行demo(slda)
看看作者的实现。当你运行演示时,你会看到他设置alpha=1.0
, eta=0.1
, and variance=0.25
。我建议使用这些作为您的起点,然后如果您需要提高模型性能,请使用交叉验证来确定更好的参数。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)