在实践中（而非理论上），小批量与实时流有什么区别？

2023-12-19

在实践中（而非理论上），小批量与实时流有什么区别？从理论上讲，我理解迷你批次是在给定时间范围内进行批处理的东西，而实时流更像是在数据到达时执行某些操作，但我最大的问题是为什么不使用带有 epsilon 时间范围（例如一毫秒）的迷你批次或者我想了解为什么其中一个解决方案比其他解决方案更有效？

我最近遇到一个示例，其中小批量 (Apache Spark) 用于欺诈检测，实时流 (Apache Flink) 用于欺诈预防。有人还评论说小批量不会是预防欺诈的有效解决方案（因为目标是防止交易发生）现在我想知道为什么小批量（Spark）不会那么有效？为什么以 1 毫秒延迟运行小批量没有效果？批处理是一种无处不在的技术，包括操作系统和内核 TCP/IP 堆栈，其中磁盘或网络的数据确实被缓冲，那么这里有什么令人信服的因素可以说一个比另一个更有效呢？

免责声明：我是 Apache Flink 的提交者和 PMC 成员。我熟悉Spark Streaming的整体设计，但不了解其内部细节。

Spark Streaming实现的小批量流处理模型的工作原理如下：

流的记录被收集在缓冲区中（小批量）。
定期使用常规 Spark 作业处理收集的记录。这意味着，对于每个小批量，都会调度并执行完整的分布式批处理作业。
当作业运行时，会收集下一批的记录。

那么，为什么每 1ms 运行一次小批量并不有效呢？很简单，因为这意味着每毫秒安排一个分布式批处理作业。尽管 Spark 在调度作业方面非常快，但这有点太多了。它还会显着降低可能的吞吐量。如果操作系统或 TCP 中使用的批处理技术的批次变得太小，则它们也无法正常工作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在实践中（而非理论上），小批量与实时流有什么区别？的相关文章

是否可以“保护”属性并将其从选择语句中排除

我想保护数据层级别的某些属性例如我想保护用户存储在数据库中的密码哈希以便它不会以任意形式显示select 声明仅当在 a 中明确请求时才采用这种方式select property property2陈述我认为更准确的答案是设置se
c# 替代方案中 cfusion_encrypt 中填充的密钥是什么？

我找到了从这里复制 C 中的 cfusion encrypt 函数的答案 ColdFusion cfusion encrypt 和 cfusion decrypt C 替代方案 https stackoverflow com questio
尝试在节点 0.12 上重新安装 `node-sass`？

我想使用谷歌网络入门套件我安装了node js v0 12 0 node sass gulp 然后跑 sudo npm install 当我打字时gulp serve然后得到这个错误 Using gulpfile web starter
将静态库合并为单个

如何将静态库合并为一个我确实有三个静态库 libSignatureLibary armv6 a libSignatureLibary armv7 a 和 libSignatureLibary i368 a 现在我想将这三个文件合并到一个库
想要定制django Rest框架Browsable API页面

问题我想自定义 django Rest Framework Browsable API 页面使其具有与我的 Web 应用程序的其余部分相同的外观和感觉安装的软件 Python 3 6 Django 1 10 6 Django 休息框架
检查php中位字段是否打开的正确方法是什么

检查位字段是否打开的正确方法是什么在 php 中我想检查来自 db mysql 的位字段是否打开这是正确的方法吗 if bit 1 还有其他方法吗我看到有人使用代码ord http jameslow com 2008 08 12 m
通过 cmake 链接作为外部项目包含的 opencv 库[重复]

这个问题在这里已经有答案了我对 cmake 比较陌生经过几天的努力无法弄清楚以下事情我有一个依赖于 opencv 的项目它本身就是一个 cmake 项目我想静态链接 opencv 库我正在做的是我的项目中有一份 opencv 源
CSS：缩放字体大小以适应父块元素的高度

我发现的几乎每个问题和答案都谈到了视口大小这确实不是我的问题拿着这支笔 https codepen io njt1982 pen pZjZNM https codepen io njt1982 pen pZjZNM 我有一个非常基本的
如何处理两个 gradle 插件的任务冲突？

我使用 gradle 和两个插件com jfrog artifactory and io swagger core v3 swagger gradle plugin 现在我想按照此处所述进行配置https github com swagge
创建带有部分的选项卡式侧边栏 WPF

我正在尝试创建一个带有部分的选项卡式侧边栏如 WPF 中的以下内容我考虑过几种方法但是有没有更简单更优雅的方法呢方法一列表框 Using a ListBox并将 SelectedItem 绑定到右侧内容控件所绑定的值为了区分标
使用 python 将 CSV 文件上传到 Microsoft Azure 存储帐户

我正在尝试上传一个 csv使用 python 将文件写入 Microsoft Azure 存储帐户我已经发现C sharp https blogs msdn microsoft com jmstall 2012 08 03 convert
我找不到 IntelliJ 快捷方式

我使用 vim 一段时间我知道有一个 intellij vim 插件我很好奇内置的 IntelliJ 文本导航存在什么如何打开实时模板来创建模板如何查看以 tr 开头的现有模板列表如何进行全局搜索并在当前文档中进行搜索然后转到下
将文本从文本文件添加到 PDF 文件[重复]

这个问题在这里已经有答案了这是我的代码 using FileStream msReport new FileStream pdfPath FileMode Create step 1 using Document pdfDoc new D
使用剪贴板 SetText 换行

如何使用 SetText 方法添加换行符 I tried Clipboard SetText eee n xxxx 但当我将剪贴板数据粘贴到记事本中时它没有给我预期的结果预期结果 eee xxxx 我怎样才能做到这一点 Windows
添加两个 ActiveRecord::Relation 对象[重复]

这个问题在这里已经有答案了如何将两个关系添加在一起当我尝试运算符时它返回一个数组但我需要它来返回关系谢谢麦克风 Try new relation relation merge another relation
如何从函数返回矩阵（二维数组）？（C）

我创建了一个生成宾果板的函数我想返回宾果板正如我没想到的那样它不起作用这是函数 int generateBoard int board N M i j fillNum Boolean exists True initilize se
如何确定给定方法可以抛出哪些异常？

我的问题和这个真的一样找出 C 中方法可能抛出的异常 https stackoverflow com questions 264747 finding out what exceptions a method might throw in
使用 JQuery 预填充选择字段的下拉选项验证

我有这个 JQuery 片段来防止选择已在另一个字段中选择的下拉选项 var coll select name service on change function coll each function var val this value
如何从 TraCIDem11p.cc 获取 RSU 坐标？

我想知道如何开始编写一个能够在车辆靠近 RSU 时发送消息的程序首先我仍然对一些定义感到困惑但是一点一点地我想我会学习静脉 module simulation getModuleByPath rsu 0 c MobilityAcc
必须包含 log4J，但它会导致 Apache Spark shell 中出现错误。如何避免错误？

由于我必须将 jar 包含到 Spark 代码中因此我想请求帮助找出解决此问题而不删除 log4j 导入的方法简单代码如下 cp symjar log4j 1 2 17 jar import org apache spark rdd v

随机推荐

为什么以及如何重载运算符 << 进行打印

我写了一个程序来实现堆栈我里面有一个显示功能我一开始是这样写显示函数的 template
QPushButton 更改同一布局中其他小部件的边距

我有一个大布局其中包含以下结构的小部件和布局 QVBoxLayout QTableView QPushButton 我将布局上的边距填充和间距设置为 0 按照 Mac OS X 上的呈现方式按钮不会填充其所有空间相反它周围有一些填
带有不透明背景图像的引导内容

我正在学习 Bootstrap 并试图找出一种用不透明背景图像显示内容的好方法我目前正在使用 well 但不必这样做我可以得到井内部且不透明的图像但我无法得到其他内容后面的图像这是 html 的一个小示例 backgroun
C# 将 PDF 文件附加到 MemoryStream - 无法访问关闭的流

是否可以使用 iTextSharp 将现有 PDF 文件附加到动态创建的 PDF 中我尝试按照下面的代码使用 PdfCopy 但我得到了Cannot access a closed Stream error 我见过将实际 PDF 文件合并
添加 SQL 查询统计

我正在尝试将记录从文本框更新到 Access 数据库中我想知道每次点击保存时都会生成错误 System Data dll 中发生 System Data OleDb OleDbException 类型的未处理异常附加信息没有为一个或多
Redux 中的 Action 应该始终是唯一的吗？

在此示例中我使用名为的操作ADD TODO import createStore combineReducers from redux function todos state action state state switch acti
phpmyadmin 导出 html 而不是 sql

我有 phpmyadmin 4 4 7 并且之前已将 MySql 表精细导出为 sql 格式但是即使我使用快速或高级方法选择 sql 格式它现在仍以 html 格式导出非常感谢任何想法建议谢谢 Lyle 当数据库非常大在我的例
最优雅的项目分类用户界面？

我有一个项目集合用户需要以多种方式对这些项目进行分组分类举个例子假设它是汽车的集合用户希望按以下方式对它们进行分类颜色红银蓝黑等车身形状掀背车轿车轿跑车旅行车等座位 2 4 5 6 等 etc 您是否遇到过一
使用 DI 进行类注入有什么意义吗

在 Angular1 中我们经常使用工厂来注入类而不是实例在 angular2 中我可以做同样的事情 provide MyClass useFactory gt return MyClass constructor MyClass
多个 PostConstruct 方法？

它说在Java 的文档 http docs oracle com javaee 7 api javax annotation PostConstruct htmlPostConstruct 页面该注解只能注解一种方法但我只是尝试使用 P
AVL树最小节点

高度为 h 的 AVL 树中的最小节点数是多少我在互联网上做了一些研究但它们都很令人困惑 n h 是高度为 h 的 AVL 树的最小节点数则 n 0 1 n 1 2 n h 1 n h 1 n h 2
sas 日期时间转 R 日期格式

我有一个包含日期时间变量的 SAS 数据集我已使用 sas7bdat 包将此数据集移植到 R 中但日期时间变量以整数格式显示例如 1706835972 有什么办法可以将这个整数转换为日期格式吗要准确匹配默认日期时间结构的 SAS 输
reinterpret_cast 为相同类型

考虑以下程序 struct A int main A a A b a A c reinterpret cast a a 编译器 g 14 抛出一个错误invalid cast from type A to type A 为什么转换为相同类型
“请求中的 URI 无效”尝试代理 iframe 内容以进行本地调试

我正在尝试调试包含 iframe 的页面中的问题为父页面提供服务的网站是我正在处理的代码我可以轻松地在本地运行但 iframe 的内容来自我无权访问的代码有一些保护措施会阻止跨域 iframe 这在生产中不会成为问题因为它们将在同
如何在Linux上后台无限运行脚本？

我有一个带有无限循环的 PHP 脚本我需要这个脚本永远运行所以我跑 php path to script php gt dev null 它在我当前用户的安全上下文中在后台运行但是当我关闭终端窗口注销时 CentOS Linux
从命令行运行 PyCharm 项目

我正在尝试将我的项目部署到服务器并在那里运行它当我尝试从命令行启动脚本时它显示错误导入父目录中的脚本时我使用 PyCharm 制作了该项目 python 2 7 10 并将其分散到多个目录中这些文件夹看起来像这样项目 dir s
匹配澳大利亚商业号码 (ABN) 的正则表达式

我需要一个正则表达式来匹配一个值其中每个字符可以是 0 到 9 之间的数字或空格该值必须恰好包含 11 位数字例如它应匹配格式为 012 345 678 90 或 01234567890 的值有人可以帮我解决这个问题吗为了将来可
Camunda 使用 REST 获取 XOR 网关的机会

I have the following situation 我想要做的是在我的 Angular 应用程序中获得一个下拉菜单其中列出了书籍的所有机会所以我可以在哈利波特白鲸记和鲁宾逊漂流记之间进行选择当我选择一本书并按提交
沙盒 AppDomain 中的线程安全

我有一个应用程序域来托管不受信任的代码程序集我用安全属性解决了所有安全问题效果很好不受信任的代码在专用线程上运行 CLR 是 2 0 这就是我所拥有的应用程序域Shell http code google com p robocod
在实践中（而非理论上），小批量与实时流有什么区别？

在实践中而非理论上小批量与实时流有什么区别从理论上讲我理解迷你批次是在给定时间范围内进行批处理的东西而实时流更像是在数据到达时执行某些操作但我最大的问题是为什么不使用带有 epsilon 时间范围例如一毫秒的迷你批次或者我想

在实践中（而非理论上），小批量与实时流有什么区别？

在实践中（而非理论上），小批量与实时流有什么区别？ 的相关文章

随机推荐

热门标签

在实践中（而非理论上），小批量与实时流有什么区别？的相关文章