在 hadoop 中并行运行作业

2023-11-21

我是 hadoop 新手。

我已经设置了一个 2 节点集群。

如何在 hadoop 中并行运行 2 个作业。

当我提交作业时,它们按照 FIFO 顺序一项一项地运行。我必须并行运行这些作业。如何实现这一目标。

谢谢 MRK


Hadoop 可以配置多种调度器,默认是 FIFO 调度器。

FIFO 调度的行为如下。

场景一:如果集群有10个Map Task容量,job1需要15个Map Task,那么运行job1会占用整个集群。当 job1 取得进展并且有可用的空闲插槽但 job1 未使用时,job2 将在集群上运行。

场景二:如果集群有10个Map Task容量,job1需要6个Map Task,那么job1占用6个slot,job2占用4个slot。 job1 和 job2 并行运行。

要从一开始就并行运行作业,您可以配置公平调度程序 or a 容量调度器根据您的要求。必须设置mapreduce.jobtracker.taskscheduler和特定的调度程序参数才能使其在mapred-site.xml.

编辑:根据 MRK 的评论更新了答案。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 hadoop 中并行运行作业 的相关文章

随机推荐

  • 创建 XML DOM 元素,同时保持区分大小写

    我正在尝试创建以下元素节点树
  • BigInteger 还是不是 BigInteger?

    在Java中 大多数基本类型都是带符号的 用一位来表示 因此当我超出类型的限制时 我可能会得到意想不到的结果 比如负数 有没有比使用 BigInteger 更好的解决方案 因为 BigInteger 存在性能问题 并且您需要使用类方法进行基
  • Robolectric 中的 getSystemService 返回具有 null Context 的对象

    在我的活动中onCreate I have AudioManager audioManager AudioManager getSystemService Context AUDIO SERVICE 当使用 Robolectric 测试活动
  • scipy 最小化 SLSQP - 'LSQ 子问题中的奇异矩阵 C'

    我正在尝试使用 SciPy 解决一个非常基本的优化问题 这个问题是受约束的并且具有可变范围 我很确定它是线性的 当我运行以下代码时 执行失败并显示错误消息 LSQ 子问题中的奇异矩阵 C 有谁知道可能是什么问题 提前致谢 编辑 我将在此处添
  • 如何获得动词的过去式? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心以获得指导 获取动词过去式的最有效方法
  • 如何设置 .NET WindowsAuthentication - 当我希望它使用实际用户时,名称始终显示为“IIS APPPOOL\Classic .NET AppPool”

    我使用以下代码通过 Kerberos 进行身份验证 IntPtr logonToken WindowsIdentity GetCurrent Token string authenticationType WindowsAuthentica
  • C# 将 GMT 日期字符串解析为 DateTime

    我在用着http www eyecon ro bootstrap datepicker 插件选择日期 选择日期后我得到例如Fri Nov 01 2013 00 00 00 GMT 0100 1 如果我使用 format 设置插件 为什么我会
  • 覆盖 AngularJS URL 验证器

    AngularJS 接受这个作为有效的 URL var URL REGEXP ftp http https w 0 1 w S 0 9 w Django 接受这一点 regex re compile r http ftp s http or
  • Objective-C 中的字符串常量是如何存储/检索的?

    有人可以解释编译器在何处以及如何存储字符串常量以及运行时如何访问它们吗 首先是强制性的 你不应该关心编译器如何做到这一点 任何基于编译器如何执行此操作的行为都是对无法保证的事物的危险依赖 并且可能会根据编译器的优化方式而改变 不要基于此编写
  • jQuery 未按正确顺序执行?

    我最近开始使用 jQuery 今天注意到它对我的行为有一个奇怪的问题 据我了解 JavaScript 是单线程的 因此它的所有操作都应该以 FIFO 为基础运行 然而 对我来说情况似乎并非如此 请考虑以下事项 设置如下 HTML 3 div
  • IntelliJ 中关于 Groovy 类的“类已存在”错误

    在 IntelliJ 2016 2 及之前版本 中 我们将 Groovy 类标记为红色 并显示错误 类已存在 我认为我们可以排除存根生成的原因 因为它已被停用 可能是我们的星座引起的 我们已将编译的 groovy 和 java 类包含在注册
  • 为什么 Spring AOP 不在运行时编织外部 jar?

    我有一个基于 Spring 3 构建的 java 应用程序 该项目有另一个 jar 作为依赖项 该依赖项包含一个 org aspectj lang annotation Aspect类 可以说 com aspectprovider aspe
  • SonarQube 无法启动 MariaDB 10

    我在 CentOS 7 中使用 yum 安装了 MariaDB SonarQube 抛出此异常 org sonar api utils MessageException Unsupported mysql version 5 5 Minim
  • 正则表达式字边界和特殊字符

    我有一个正则表达式来转义搜索字符串中的所有特殊字符 这很好用 但是我似乎无法让它与单词边界一起工作 例如 用干草堆 add or add 和针 正则表达式 gi匹配 然而正则表达式 b gi没有 关于如何实现这项工作有什么想法吗 Using
  • 无法建立 SSL 连接,如何修复我的 SSL 证书?

    我试图wget到我自己的盒子 它不能是 wget 中的内部地址 另一位开发人员是这么说的 当我得到时 我得到这个 wget http example com 2013 03 01 15 03 30 http example com Reso
  • Java中的正则表达式用于验证用户名

    我正在尝试使用 Java 中的用户名链 规则如下 长度 gt 3 有效字符 a z A Z 0 9 点 破折号和下划线 有人可以帮我解决正则表达式吗 尝试这个正则表达式 a zA Z0 9 3
  • 使用 MVVM 上下文菜单项命令绑定 WPF

    我知道这个问题已经在许多网站和 StackOverFlow 中以不同的方式被问过很多次 但我找到的所有答案都没有帮助我 准确地说 我无法理解它们并在我的应用程序中实现 所以我想从我的应用程序中添加一些代码 以便你们可以更好地帮助我 问题陈述
  • python 中 Burrows-Wheeler 的性能问题

    我试图实施布罗斯 惠勒在Python中进行转换 这是在线课程的作业之一 但我希望我已经做了一些工作才有资格寻求帮助 该算法的工作原理如下 获取一个以特殊字符 在我的例子中为 结尾的字符串 并从该字符串创建所有循环字符串 按字母顺序对所有这些
  • 为什么inline-block会导致这个div有高度呢?

    jsFiddle Demo 我似乎无法弄清楚为什么使用display inline block会导致这个 div 当包含元素被隐藏时 元素以某种方式获得高度 这不会发生在display block html div style displa
  • 在 hadoop 中并行运行作业

    我是 hadoop 新手 我已经设置了一个 2 节点集群 如何在 hadoop 中并行运行 2 个作业 当我提交作业时 它们按照 FIFO 顺序一项一项地运行 我必须并行运行这些作业 如何实现这一目标 谢谢 MRK Hadoop 可以配置多