我们是否可以更新spark-ml/spark-mllib中的现有模型?

2023-11-30

我们使用 Spark-ml 根据现有数据构建模型。新数据每天都会出现。

有没有一种方法可以让我们只读取新数据并更新现有模型,而不必每次都读取所有数据并重新训练?


这取决于您使用的模型,但对于某些 Spark 来说,它完全按照您的方式执行want。你可以看看流式KMeans, 带 SGD 的流式线性回归, 使用 SGD 进行流式逻辑回归更广泛地说流式线性算法.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我们是否可以更新spark-ml/spark-mllib中的现有模型? 的相关文章

随机推荐