抱歉,我没有资源来设置集群来测试它,我只是想知道:
我可以将 hbase 区域服务器部署在 hadoop 数据节点计算机之外的单独计算机上吗?我想答案是肯定的,但我不确定。
hbase区域服务器和hadoop数据节点部署在不同的机器上是好是坏?
当将一些数据放入hbase时,这些数据最终存储在哪里,数据节点还是区域服务器?我猜是数据节点,但是region server中的StoreFile和HFile是什么,不就是存储我们数据的物理文件吗?
谢谢你!
如果您想要良好的性能,RegionServer 应始终与分布式集群中的 DataNode 一起运行。
非常糟糕,这将违反数据局部性原则(如果您想了解更多有关数据局部性的信息,请检查以下内容:http://www.larsgeorge.com/2010/05/hbase-file-locality-in-hdfs.html http://www.larsgeorge.com/2010/05/hbase-file-locality-in-hdfs.html)
实际数据将存储在HDFS(DataNode)中,RegionServers负责服务和管理Region。
有关 HBase 架构的更多信息,请查看 Lars 博客中的这篇优秀文章:http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html
顺便说一句,只要您有一台具有足够 RAM 的 PC,您就可以使用虚拟机设置演示集群。如果没有首先在开发环境中正确测试平台,请勿尝试设置生产环境。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)