使用 nutch REST api 的 Nutch 弹性索引器中的未知问题

2024-02-23

我试图使用 REST 端点公开 nutch,但在索引器阶段遇到了问题。我正在使用 elasticsearch 索引编写器将文档索引到 ES。我使用了 $NUTCH_HOME/runtime/deploy/bin/nutch startserver 命令。索引时抛出未知异常。

错误: com.google.common.util.concurrent.MoreExecutors.directExecutor()Ljava/util/concurrent/Executor; 16/10/07 16:01:47 INFO mapreduce.Job:映射 100% 减少 0% 16/10/07 16:01:49 信息 mapreduce.Job:任务 ID: attempts_1475748314769_0107_r_000000_1,状态:失败错误: com.google.common.util.concurrent.MoreExecutors.directExecutor()Ljava/util/concurrent/Executor; 2007 年 10 月 16 日 16:01:53 信息 mapreduce.Job:任务 ID: attempts_1475748314769_0107_r_000000_2,状态:失败错误: com.google.common.util.concurrent.MoreExecutors.directExecutor()Ljava/util/concurrent/Executor; 16/10/07 16:01:58 INFO mapreduce.Job:映射 100% 减少 100% 16/10/07 16:01:59 信息mapreduce.Job:作业 job_1475748314769_0107 失败 状态失败,原因是:任务失败 task_1475748314769_0107_r_000000 作业 由于任务失败而失败。失败地图:0 失败减少:1

错误indexer.IndexingJob:索引器:java.io.IOException:作业失败! 在 org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:865) 处 org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:145) 在 org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:228) 在 org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70) 在 org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:237)

失败,退出代码为 255。

任何帮助,将不胜感激。

PS:使用堆栈跟踪进行调试后,我认为问题是由于番石榴版本不匹配造成的。我尝试更改插件的 build.xml(parse-tika 和 parsefilter-naivebayes),但它不起作用。


我已经找到了这个问题的解决方案。这是由于guava依赖的版本兼容性造成的。 Hadoop 使用 guava-11.0.2.jar 作为依赖项。但nutch中的弹性索引器插件需要18.0版本的guava。这就是为什么它在尝试在分布式 hadoop 中运行时抛出异常。所以我们只需要在hadoop libs中将guava版本更新到18.0(可以在$HADOOP_HOME/share/hadoop/common/libs/).

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 nutch REST api 的 Nutch 弹性索引器中的未知问题 的相关文章

随机推荐

  • 为什么使用 WebRequest 发送 post 数据需要这么长时间?

    我目前正在创建一个 C 应用程序来绑定到 php MySQL 在线系统 应用程序需要将发布数据发送到脚本并获取响应 当我发送以下数据时 username test password test 我收到以下回复 Starting request
  • .png 动画在 spritekit 中性能缓慢

    我的项目中有一个 png 动画 包含 700 张图片 尺寸为 150 像素 x 150 像素 它工作正常 但每次动画开始时 整个游戏都会冻结约 0 1 秒 喜欢它的加载 但我在 initWithSize 中实现了 png 数组 像这样 SK
  • Bash 查找并移动名称中带有“[ ]”的文件

    我正在制作的 bash 脚本的一部分涉及 rar 分割文件 然后在完成后将分割文件移动到另一个目录 因此 如果我有一个像 test file txt 这样的文件 它首先会被 rarred 为 test file txt part1 rar
  • NumPy 排序函数返回 None

    我有一个简单的程序如下 import numpy as np arr np random randn 8 new arr sort new1 np sort arr print new print new1 我希望这两个新数组是相同的排序数
  • 计算值出现的次数

    我有一列带有重复值的文本值 我想创建一个新的唯一值列 无重复 和一个包含每个值的频率的列 最简单的方法是什么 由于行数不足 10 000 因此效率并不是太重要 为了得到答案而不是评论 请将列 例如 A 复制到 B 例如 并且仅对于 B 数据
  • 无法调用 UnsafeMutablePointer 类型的初始值设定项

    我正在尝试将字符串转换为 SHA256 哈希值 但出现下一个错误 Cannot invoke initializer for type UnsafeMutablePointer
  • 在 Eclipse 中调试 Playframework

    我刚刚从 Netbeans 迁移到 Eclipse 在 Netbeans 中 我可以开箱即用地调试 Playframework 应用程序 然而 在 Eclipse 中 似乎很难配置它来调试 Web 应用程序 具体来说是 Playframew
  • 如何点击 Selenium WebDriver 中的隐藏元素?

    我有一个显示一些记录的网格 当我单击一条记录并检查该元素时 显示它是隐藏的 但在网格中可见 我的 HTML 是 a href http 192 168 1 6 eprint prod 3 8 settings othercost add a
  • 如何更新到 mingw-gcc 4.8.2?

    我想在 c 11 中使用正则表达式 gcc 4 8 2 支持它 但 MinGW 安装程序最高仅支持 gcc 4 8 1 如何将其更新到 gcc 4 8 2 您可以自己手动安装 有一个 MinGW w64 发行版4 8 2 可在此处获取 ht
  • 赋值语句中的“others=>'0'”是什么意思?

    cmd register process rst n clk begin if rst n 0 then cmd r lt others gt 0 elsif clk event and clk 1 then cmd r lt end if
  • 如何命名 Rails 中的路线

    我有一些看起来像这样的路线 match hotels action id controller gt hotel action gt a z i id gt 0 9 i 我想用类似的东西酒店 不喜欢 路径我的代码中的某处引用了 hotels
  • 如何使用 Javascript 找出短 URL 指向的位置

    我创建了一个短网址 比如说https my short link foo 即指向https my other website bar 如何在浏览器中使用 javascript 方法检索此 url 我使用的是角度 这将取决于如何my shor
  • 删除 Facebook 评论插件下方的空白

    看看这个链接 http www equispot com horses for sale 416 向下滚动一点 您应该会看到一个 Facebook 评论插件 其下方嵌入了 Google 地图 我的问题是 评论插件的底部和地图的顶部之间有大量
  • FileInputStream 如何获取 File 的内容?

    我有一个文件f我需要把它影响成FileInputStream fs File f new File C dir foo txt FileInputStream fs FileInputStream f 但我收到这个错误 Cannot cas
  • 从 1.5 更新到 Android Studio 2.0 后,ndk 语法高亮不起作用或可能被破坏

    编辑器窗口中 C C 代码的语法突出显示在 AS 1 5 中运行良好 但从 AS 1 5 更新到 2 0 后 即使使用示例 HelloJNI 项目也无法正常工作 尝试使用保存的设置 重置默认设置以及全新下载和安装 AS 2 0 但没有任何效
  • 如何将 Assetic 用于 requireJs

    我正在尝试在 synfony2 项目中使用 require js 这是主树枝文件中的代码 文件vendor js require js已正确加载 但对于文件bundles web js main js我收到消息 未捕获的错误 模块加载超时
  • NextJS 动态路由与模态重新加载导致覆盖背景消失

    我有一个非常简单的 NextJS 应用程序 打开页面将更新 URL 但不会触发导航 而是在模式中显示内容 URL 仍然反映实际页面位置 任何刷新都会将用户带到那里 当模式打开时 我仍然希望保留页面上的原始内容在背景中淡出 并且模式应该出现在
  • 可以根据另一个单元格的值锁定单元格范围吗?

    我正在使用跟踪器来测试新的更改以及何时测试 如果新更改不适用 我不想删除它 我想禁用 并变灰 所有可用于选择完成日期的单元格 但仅限于该行 我尝试过使用以下方法 但没有任何运气 工作表上的条件格式 进行更改时执行的 VBA 代码 数据验证
  • BABEL:未知选项:base.Children

    我刚刚做了一个npm update并获得了一些新的软件包版本 这破坏了我的构建 使我无法使用默认值updateSchema js from https github com relayjs relay starter kit blob ma
  • 使用 nutch REST api 的 Nutch 弹性索引器中的未知问题

    我试图使用 REST 端点公开 nutch 但在索引器阶段遇到了问题 我正在使用 elasticsearch 索引编写器将文档索引到 ES 我使用了 NUTCH HOME runtime deploy bin nutch startserv