HBase区域服务器和Hadoop数据节点应该在同一台机器上吗?

2024-02-06

抱歉,我没有资源来设置集群来测试它,我只是想知道:

  1. 我可以将 hbase 区域服务器部署在 hadoop 数据节点计算机之外的单独计算机上吗?我想答案是肯定的,但我不确定。

  2. hbase区域服务器和hadoop数据节点部署在不同的机器上是好是坏?

  3. 当将一些数据放入hbase时,这些数据最终存储在哪里,数据节点还是区域服务器?我猜是数据节点,但是region server中的StoreFile和HFile是什么,不就是存储我们数据的物理文件吗?

谢谢你!


  1. 如果您想要良好的性能,RegionServer 应始终与分布式集群中的 DataNode 一起运行。

  2. 非常糟糕,这将违反数据局部性原则(如果您想了解更多有关数据局部性的信息,请检查以下内容:http://www.larsgeorge.com/2010/05/hbase-file-locality-in-hdfs.html http://www.larsgeorge.com/2010/05/hbase-file-locality-in-hdfs.html)

  3. 实际数据将存储在HDFS(DataNode)中,RegionServers负责服务和管理Region。

有关 HBase 架构的更多信息,请查看 Lars 博客中的这篇优秀文章:http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html

顺便说一句,只要您有一台具有足够 RAM 的 PC,您就可以使用虚拟机设置演示集群。如果没有首先在开发环境中正确测试平台,请勿尝试设置生产环境。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

HBase区域服务器和Hadoop数据节点应该在同一台机器上吗? 的相关文章

随机推荐