风暴最大喷口待定

2024-05-13

这是一个关于 Storm 的最大喷口待处理如何工作的问题。我目前有一个 spout,它读取文件并为文件中的每一行发出一个元组(我知道 Storm 不是处理文件的最佳解决方案,但我对此问题没有选择)。

我设置了topology.max.spout.pending到 50k 来限制进入拓扑进行处理的元组数量。但是,我发现这个数字对拓扑没有任何影响。我每次都会看到文件中的所有记录被发出。我的猜测是这可能是由于我在nextTuple()发出文件中所有记录的方法。

我的问题是:Storm 会停止打电话吗nextTuple()对于 Spout 任务,当topology.max.spout.pending到达了?这是否意味着每次调用该方法时我应该只发出一个元组?


确切地! Storm 只能通过下一个命令来限制你的 spout,所以如果你在收到第一个下一个命令时传输所有内容,Storm 就无法限制你的 spout。

Storm 开发人员建议使用单个 next 命令发出单个元组。然后,Storm 框架将根据需要限制您的 spout,以满足“最大 spout 待处理”要求。如果您要发射大量元组,则可以将发射批处理最多为最大 spout 待处理的十分之一,以便 Storm 有机会进行限制。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

风暴最大喷口待定 的相关文章

  • 谁使用实时 Java? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我注意到实时Java https en wikipedia org wiki Real time Java2 2 早在 9 月份就发布了 与我上
  • 为什么在繁忙的旋转暂停后,同一代码块的 JVM 显示出更多的延迟?

    下面的代码演示了这个问题明确地 即 完全相同的代码块在繁忙的旋转暂停后会变得更慢 请注意 我当然没有使用Thread sleep 另请注意 没有条件导致 HotSpot JIT 去优化 因为我使用数学运算而不是更改暂停IF 我想要对一块数学
  • Java中一秒需要多长时间?测量 Java 中的延迟时间

    我不想更改此代码 我只对 JVM 操作系统或内核定制 配置感兴趣以获得最佳结果 我有一秒循环 1000 x 1ms public static void main String args throws InterruptedExceptio
  • FB Realtime API 没有/不一致地通知某些连接(音乐、电影、书籍、电视)

    我目前遇到了 Facebook 实时 API 的问题 我希望订阅用户个人资料上的许多内容 包括他们在音乐 书籍 电视和电影类别中的 喜欢 当我通过 FQL 和图表查询时 我得到了正确的信息 但当用户个人资料上的这些条目发生更改时 Faceb
  • 处理大量rtsp摄像头,无实时限制

    问题定义 假设我有大量 rtsp 摄像机 gt 100 我想对其执行一些操作 例如图像特征提取 重要提示 我对实时性能不感兴趣 我什至可以在一分钟内进行 4 次特征提取 显然 越多越好 As now 瓶颈是图像采集 帧是通过以下方式获取的c
  • Minecraft 如何进行光照? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我唯一熟悉的模型是漫射照明 但这看起来比那要复杂得多 每个方块的亮度级别从 15 到 0 每个级别都比其上方的级别低 20 如果一个正
  • 如何处理 Node.js 中的“read ETIMEDOUT”?

    我有一个使用 Node js 的发布 订阅模型将数据从一个客户端传输到另一个客户端 此外 服务器还记录收到的所有内容并将其发送给新客户端 但是 某些数据在传输时损坏 并且出现如下错误 Error with socket Error writ
  • NotSerializedException org.neo4j.kernel.EmbeddedGraphDatabase

    我正在使用 neo4j 创建图表 将 mongodb 中的数据作为文档 独立代码运行良好 没有风暴 但是 在将其与 Storm 集成时 我得到了 java io NotSerializedException org neo4j kernel
  • 使用 setState SampleRate/topology.stats.sample.rate 的性能影响

    在yaml中设置topology stats sample rate 1 0对性能有什么影响 这是如何运作的 topology stats sample rate配置计算 Storm 拓扑统计数据的速率 默认值在默认值 yaml https
  • 更改 Firebase 实时数据库中的值时如何查看 flutter 应用程序的变化?

    每当我在 Firebase 实时数据库中进行任何更改时 我都会尝试使这些滚动开关更改其值 更具体地说 每当我将 Relay1 Data 的值更改为 0 时 我希望该开关变为非活动状态 我已经尝试并到处寻找 但找不到任何解决方案 bool r
  • java中的时间连续减少,格式为HH:MM:SS

    我有一个在项目中实施投标系统的方法 在服务器上的拍卖表中 我有一个用于开始时间和结束时间的字段 我正在做的是 当用户搜索时 他当然只会看到拍卖仍在进行中的物品 当用户点击该商品时 他会被带到一个可以出价的页面 在那里我得到开始时间和结束时间
  • Linux 中断与轮询

    我正在开发一个带有 DSP 和 ARM 的系统 ARM上有一个linux操作系统 我有一个 DSP 向 ARM Linux 发送数据 在 Linux 中 有一个内核模块读取从 DSP 接收到的数据 内核模块被唤醒以读取数据 使用 DSP 和
  • Dart 是否有 socket.io 端口?

    我使用这个简单的示例了解了 Dart 中的基本 websocket 功能 https github com financeCoding chat websocket dart https github com financeCoding c
  • Facebook:图形 API 回调 / 实时 API / 公共 Feed API

    我正在开发一个社交媒体项目 我需要关注一些粉丝专页并收听该特定页面上发生的所有事情 我确实知道有一些数据经销商 例如GNIP http gnip com Datasift http datasift com 谁能给我提供这样的数据 我已经尝
  • WOWZA + RTMP 在多个设备上播放?

    我仍然是 Wowza Streaming 的新手 但是当我设置所有内容 RHEL Wirecast 时 我可以以某种方式从我的家用电脑流式输出 广播到 EC2 服务器 正如我按照 Wowza Live Streaming 教程 我使用RTM
  • 无法从 Storm 教程运行 Storm-starter 拓扑

    当遵循 Storm starter 中的指南时repo https github com apache storm tree master examples storm starter 我无法实际运行任何拓扑 就像ExclamationTo
  • 如何在 Tensorflow 2.0 中使用 K.get_session 或如何迁移它?

    def init self kwargs self dict update self defaults set up default values self dict update kwargs and update with user o
  • 开始使用 Real Time Linux 编程的最佳方式是什么?

    虽然我用C实现了很多项目 但我对操作系统完全陌生 我在 Discovery board STM32 上尝试了实时 Linux 并得到了闪烁 LED 的正确结果 但我并没有真正理解整个过程 因为我只是按照步骤操作 并且无法在互联网上找到每个步
  • Storm Spout 未收到 Ack

    我已经开始使用storm 所以我使用创建简单的拓扑本教程 https github com nathanmarz storm wiki Tutorial 当我运行我的拓扑时LocalCluster一切看起来都很好 我的问题是我没有得到元组的
  • 在ubuntu内核中启用cgroup cpu实时运行时

    我正在尝试在 Ubuntu 18 04 上运行的 docker 容器中使用实时调度 我已经按照给定的方法安装了实时内核here https stackoverflow com questions 51669724 install rt li

随机推荐