无论如何,我可以在 Solr 中创建索引来从 HBase 执行近实时全文搜索。
我不想将整个文本存储在我的 solr 索引中。制成"stored=false"
注意:-请记住,我正在处理大型数据集,并且想要进行近实时搜索。我们正在谈论 TB/PB 的数据。
UPDATED
Cloudera Distribution:5.4.x 与 Cloudera Search 组件一起使用。
索尔:4.10.x
HBase:1.0.x
索引器服务:带有 cloudera morphlines 的 Lily HBase 索引器
是否有任何其他 NRT Indexer 服务或框架可以用来代替 LilyCloudera。只是一个想法。
Cloudera :
please check this article and Hbase-Solr using Cloudera-search which describes how to achieve that. see below screen shot as described by those articles.
Have a look at known issues with Cloudera Search
是的,您可以考虑吗啡啉。它们可用于近实时应用程序以及批处理应用程序。
我对hortonworks平台以及如何实现这一点不太了解。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)