HDFS 不是必需的,但在某些地方会出现建议。
为了帮助评估运行 HDFS 所花费的精力:
将 HDFS 用于 Spark 工作负载有哪些好处?
最短的答案是:“不,你不需要它”。即使没有 HDFS,您也可以分析数据,但当然您需要在所有节点上复制数据。
长答案是相当违反直觉的,我仍在尝试在 stackoverflow 社区的帮助下理解它。
Spark本地与hdfs性能对比
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)