批量处理长 Linq 操作？

2024-03-06

我提出了一个问题并得到了回答here https://stackoverflow.com/a/23606749/859154关于我遇到的性能问题large数据收集。（使用 linq 创建）

好吧，我们先把它放在一边。

但其中一个有趣的（并且geniusly）优化 - Marc 建议 - 是Batchifylinq 查询。

/*1*/ static IEnumerable<T> Batchify<T>(this IEnumerable<T> source, int count)
/*2*/    {
/*3*/      var list = new List<T>(count);
/*4*/      foreach(var item in source)
/*5*/         {
/*6*/           list.Add(item);
/*7*/           if(list.Count == count)
/*8*/             {
/*9*/               foreach (var x in list) yield return x;
/*10*/              list.Clear();
/*11*/            }
/*12*/        }
/*13*/      foreach (var item in list) yield return item;
/*14*/    }

在这里，Batchify 的目的是确保我们不会帮助服务器太多，每次操作之间花费相当长的时间 - 数据以1000为批次发明，每批次制作很快就可以使用。

现在我明白了what它正在做，但我can't说出区别，因为我可能会错过它实际工作的方式。（有时你认为你知道一些事情......直到......)

好的，回到基础知识：

AFAIK，Linq 的工作方式就像这个链 –：

所以，我们不能开始枚举till的结果select in :

Where-->OrderBy-->Select

已经完成了。

所以基本上我是waiting for select具有all正确的数据（after where，后orderby), and 只有那时- 我的代码可以触及这些值。（产生自select)

但根据我对Marc回答的理解，这些之间似乎存在差距yields它允许其他资源做某事...（？）

如果是这样，那么在每次迭代之间#4, 行后#9，CPU还有时间做别的事吗？

Question

有人可以照亮吗？这是如何运作的？

我已经知道了（例如）select无非是：

public static IEnumerable<TResult> Select<TSource,TResult>
 (this IEnumerable<TSource> source, Func<TSource,TResult> selector)
{
   foreach (TSource element in source)
       yield return selector (elem![enter image description here][3]ent);
}

但如果是这样，我的代码就无法触及它，直到所有值（之后where , orderby) 计算...

edit :

对于那些询问是否有区别的人：https://i.stack.imgur.com/19Ojw.jpg https://i.stack.imgur.com/19Ojw.jpg

2秒为1M项目。9秒为5M items.

(ignore the second line of time , (extra console.write line).) enter image description here

这是 5m 列表：https://i.stack.imgur.com/DflGR.jpg https://i.stack.imgur.com/DflGR.jpg（第一个是 withBatchify ，另一个不是）

重要提示：显示的图像包括OrderBy: 你应该注意这个breaks在这里进行批处理，因为OrderBy是一个缓冲运算符。我展示的批处理方法适用于非缓冲假脱机流。

在我使用它的上下文中，起源（在批处理之前）是一个迭代器块，它在每次迭代中执行许多涉及对象创建和伪随机数生成器的操作。因为有问题的代码对时间敏感，所以我做了什么not想要做的是在每次调用存储之间引入一个可靠的暂停（用于创建每个项目的 CPU 工作）。这部分是为了模拟原始代码，它预先创建了所有对象，部分是因为我了解 SE.Redis 如何处理套接字工作。

让我们考虑一下没有的行为Batchify:

创建一个项目（CPU 工作）并产生它
发送到商店（网络IO）
创建一个项目（CPU 工作）并产生它
发送到商店（网络IO）
创建一个项目（CPU 工作）并产生它
发送到商店（网络IO）
...

特别是，这意味着存储请求之间存在可预测的暂停。 SE.Redis 在专用工作线程上处理套接字 IO，上述情况很容易导致大量数据包碎片，特别是因为我使用了“即发即忘”标志。编写器线程需要定期刷新，当either缓冲区达到临界大小，or出站消息队列中没有更多工作。

现在考虑batchify 的作用：

创建一个项目（CPU 工作）并缓冲它
创建一个项目（CPU 工作）并缓冲它
...
创建一个项目（CPU 工作）并缓冲它
产生一个项目
发送到商店（网络IO）
产生一个项目
发送到商店（网络IO）
...
产生一个项目
发送到商店（网络IO）
创建一个项目（CPU 工作）并缓冲它
...

在这里您可以看到存储请求之间的 CPU 工作量是显著地减少。这更正确地模仿了原始代码，其中最初创建了数百万个列表，然后进行迭代。但此外，这意味着创建出站消息的线程很有可能会去至少一样快作为写入线程，这意味着出站队列在任何可观的时间内都不太可能变为零。这允许much减少数据包碎片，因为现在每个请求中很可能包含多个消息，而不是每个请求都有一个数据包。由于开销减少，更少的数据包通常意味着更高的带宽。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

批量处理长 Linq 操作？的相关文章

Directory.Delete 之后 Directory.Exists 有时返回 true ？

我有非常奇怪的行为我有 Directory Delete tempFolder true if Directory Exists tempFolder 有时 Directory Exists 返回 true 为什么可能是资源管理器打开了
在 LINQ 中按 Id 连接多表和分组

我想按categoryId显示列表产品的名称组这是我的代码我想要我的视图显示结果 Desktop PC HP Red PC Dell Yellow PC Asus Red SmartPhone Lumia 720 Blue 我的组模型
为什么极端下派生类（多重虚拟继承）的大小包括超类成员大小的两倍？

include
复制目录内容

我想将目录 tmp1 的内容复制到另一个目录 tmp2 tmp1 可能包含文件和其他目录我想使用C C 复制tmp1的内容包括模式如果 tmp1 包含目录树我想递归复制它们最简单的解决方案是什么我找到了一个解决方案来打开目录并读
单个对象的 Monogame XNA 变换矩阵？

我读过一些解释 XNA Monogame 变换矩阵的教程问题是这些矩阵应用于 SpriteBatch Begin matrix 这意味着所有 Draw 代码都将被转换如何将变换矩阵应用于单个可绘制对象就我而言我想转换滚动背景使其自
使用接口有什么好处？

使用接口有什么用我听说它用来代替多重继承并且还可以用它来完成数据隐藏还有其他优点吗哪些地方使用了接口程序员如何识别需要该接口有什么区别explicit interface implementation and implicit
在 Visual Studio 2010 中从 Fortran 调用 C++ 函数

我想从 Fortran 调用 C 函数为此我在 Visual Studio 2010 中创建了一个 FORTRAN 项目之后我将一个 Cpp 项目添加到该 FORTRAN 项目中当我要构建程序时出现以下错误 Error 1 unr
为什么调用非 const 成员函数而不是 const 成员函数？

为了我的目的我尝试包装一些类似于 Qt 共享数据指针的东西经过测试我发现当应该调用 const 函数时会选择它的非 const 版本我正在使用 C 0x 选项进行编译这是一个最小的代码 struct Data int x con
标准化 UTF-8 到底是什么？

The 重症监护室项目 http userguide icu project org transforms normalization 现在也有一个PHP库 http us php net manual en class normalize
如何在 Xaml 文本中添加电子邮件链接？

我在 Windows Phone 8 应用程序中有一些大文本我希望其中有电子邮件链接例如 mailto 功能这是代码的一部分
SignalR 似乎正在减慢我的 MVC/Azure 应用程序的启动速度

我有一个 MVC 应用程序在 Windows Azure 上的 WebRole 上的 NET 4 5 下运行使用 SignalR 1 0 alpha2 并使用 ServiceBus 底板在我的 App Start 文件夹中我有 Reg
C# HashSet 只读解决方法

这是示例代码 static class Store private static List
为什么 std::strstream 被弃用？

我最近发现std strstream已被弃用取而代之的是std stringstream 我已经有一段时间没有使用它了但它做了我当时需要做的事情所以很惊讶听到它的弃用我的问题是为什么做出这个决定有什么好处std stringstr
如何设置 log4net 每天将我的文件记录到不同的文件夹中？

我想将每天的所有日志保存在名为 YYYYMMdd 的文件夹中 log4net 应该根据系统日期时间处理创建新文件夹我如何设置它我想将一天中的所有日志保存到 n 个 1MB 的文件中我不想重写旧文件但想真正拥有一天中的所有日志我该如
如果没有抽象成员，基类是否应该标记为抽象？

如果一个类没有抽象成员可以将其标记为抽象吗即使没有实际理由直接实例化它除了单元测试是的将不应该实例化的基类显式标记为抽象是合理且有益的即使在没有抽象方法的情况下也是如此它强制执行通用准则来使非叶类抽象它阻止其他程序员创建该类
System.IO.FileNotFoundException：找不到网络路径。在 Windows 7 上使用 DirectoryEntry 对象时出现异常

我正在尝试使用 DirectoryEntry 对象连接到远程 Windows 7 计算机这是我的代码 DirectoryEntry obDirEntry new DirectoryEntry WinNT hostName hostName
C++ 条件编译

我有以下代码片段 ifdef DO LOG define log p record p else define log p endif void record char data 现在如果我打电话log hello world 在我的代码中
无法接收 UDP Windows RT

我正在为 Windows 8 RT 编写一个 Windows Store Metro Modern RT 应用程序需要在端口 49030 上接收 UDP 数据包但我似乎无法接收任何数据包我已按照使用教程进行操作DatagramSock
如何从 ODBC 连接获取可用表的列表？

在 Excel 中我可以转到数据 gt 导入外部数据 gt 导入数据然后选择要使用的数据源然后在提供登录信息后它会给我一个表格列表我想知道如何使用 C 以编程方式获取该列表您正在查询什么类型的数据源 SQL 服务器使用权看
如何将 PostgreSql 与 EntityFramework 6.0.2 集成？ [复制]

这个问题在这里已经有答案了我收到以下错误实体框架提供程序类型的实例成员 Npgsql NpgsqlServices Npgsql 版本 2 0 14 2 文化中性 PublicKeyToken 5d8b90d52f46fda7 没

随机推荐

自定义控件中的选择器

我正在建立一些表格使用TableView 并注意到我对单元格的样式设置相同我决定将这段重复的代码重构为一个公共控件 I am struggling to get the binding to work on the picker cor
如何暂停在终端中运行的Python脚本

我有一个网络爬行 python 脚本在终端中运行了几个小时它不断填充我的数据库它有几个嵌套的 for 循环由于某些原因我需要重新启动计算机并从我离开的位置继续执行脚本是否可以保留指针状态并恢复之前在终端中运行的脚本我正在寻找一种
ShellExecute 对于本地 html 或文件 URL 失败

我们公司正在将我们的帮助系统迁移到 Flare 下的 HTML5 格式我们还在 URI 命令行上使用 Flare CSHID 添加了对帮助系统的基于主题的访问以便直接访问主题例如index html CSHID GettingStar
MVC中如何定义img src路径

我的 index cshtml 带有图像里面还有一个Images文件夹myApp Images folder 如果我访问 http localhost myApp 或 http localhost myApp home 工作正常但如果我
gcc 是否会根据条件优化我的循环？

我有以下循环 condition will be set here to true or false for int i 0 i lt LARGE NUMBER i if condition do foo else do bar 假设无条
如何设计一个带有“注释”字段的类？

想象一下我们有某种包含数百种消息类型的协议我们希望通过 C 类对每种消息类型进行建模由于每个类应该能够自动处理每个字段一个自然的解决方案是只拥有一个std tuple具有所有必需的类型 std tuple
“平面文件源”(471) 预执行阶段失败并返回错误代码 0xC020200E。我该如何阻止这种情况发生？

你好我想知道你是否可以帮忙每个星期我都会收到这个错误平面文件源 471 预执行阶段失败并返回错误代码 0xC020200E 无法打开数据文件 G Data 待处理 RO Orders csv 我知道如果我进入平面文件连接管理器编辑器
检查 MySQL 中的日期范围冲突

我正在写一个酒店预订系统经过大量研究包括堆栈溢出我编写了这个 sql 来查找空闲房间 SELECT FROM room WHERE room id NOT IN SELECT room id FROM bookings WHERE c
从快捷键运行宏时不出现输入框

我有一个简单的小 Excel 宏用于打开模板询问文件名并保存文件它从 Microsoft VBA 窗口运行没有问题但当从 Excel 使用快捷键时它会打开文件但不显示输入框 Sub NewCommentSheet NewComm
如何获取浏览器内存中的 JavaScript 对象大小和计数

我知道你们大多数人都会向我指出chrome profiler heap snapshot 但是在空页面上没有js没有css 只有html gt body 它显示8mb堆大小和12到30000个对象取决于他的心情所以对于这个任务来说它是完
Yii2 查看日期时间格式 (d-m-Y H:i:s) 但在数据库中保存/更新时将格式更改为 Y-m-d H:i:s

我正在使用 Kartik DateTimePicker 扩展
opencv中python导入错误

尝试导入 opencv 时出现此错误 gt gt gt import cv2 RuntimeError module compiled against API version 0xa but this version of numpy is
MongoDB - 安装错误 - mongodb 安装向导提前结束

我之前安装的时候也遇到过这个问题也检查了其他线程但在我的情况下无法找到正确的解决方案 UPDATE CLOSED 取消选中Install MongoDB Compass设置向导中的选项为我工作
Android TextView：设置文本时获取“W/StaticLayout：maxLineHeight 不应为-1。maxLines：1 lineCount：1”

我根据计时器每 0 5 秒在 TextView 上设置一些文本每次当计时器运行并设置文本时我都会在控制台中收到此警告消息 W StaticLayout maxLineHeight 不应为 1 最大行数 1 行数 1 XML代码
python 闭包 + oop

我正在尝试用 python 闭包做一些有点奇怪的事情至少对我来说假设我有两个这样的课程 usr bin python import types def method a self print ma d self val class A
将 YAML 文件转换为 Application.properties [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们如何将 YAML 文件转换为应用程序属性 pay payment sandbox Url https securegw stage p
jquery keypress() 事件获取文本

我希望在文本框上按下按键时运行一个函数所以我有以下代码 input x keypress function DoX 这工作正常但在我的函数中我想根据文本框中的文本值做一些事情 var textValue input x val 现在的问
java.util.AbstractList.remove 处的 java.lang.UnsupportedOperationException（来源未知）

我试过下面的代码 String s 1 2 3 4 Collection c Arrays asList s System out println c remove 1 remove flag System out println coll
熊猫标签重复

给定以下数据框 import pandas as pd d pd DataFrame label 1 2 2 2 3 4 4 values 3 5 7 2 5 8 3 d label values 0 1 3 1 2 5 2 2 7 3 2
批量处理长 Linq 操作？

我提出了一个问题并得到了回答here https stackoverflow com a 23606749 859154关于我遇到的性能问题large数据收集使用 linq 创建好吧我们先把它放在一边但其中一个有趣的并且geniu

批量处理长 Linq 操作？

edit :

批量处理长 Linq 操作？ 的相关文章

随机推荐

热门标签

批量处理长 Linq 操作？的相关文章