并行读取和顺序写入？

2023-12-21

我有以下代码，可以读取和写入每个id依次。

async def main():
    while id < 1000:
       data = await read_async(id) 
       await data.write_async(f'{id}.csv')
       id += 1

read_async()需要几分钟并且write_async()运行时间不到一分钟。现在我想要

Run read_async(id)在平行下。但是，由于内存限制，最多可以并行运行 3 个调用。
write_async必须按顺序运行，即write_async(n+1)之前不能运行write_async(n).

您可以使用队列和固定数量的任务来从主任务中读取和写入。主要任务可以使用事件来查找读者是否可以使用新数据，并使用共享字典从读者那里获取新数据。例如（未经测试）：

async def reader(q, id_to_data, data_ready):
    while True:
        id = await q.get()
        data = await read_async(id) 
        id_to_data[id] = data
        data_ready.set()

async def main():
    q = asyncio.Queue()
    for id in range(1000):
        await q.put(id)

    id_to_data = {}
    data_ready = asyncio.Event()
    readers = [asyncio.create_task(reader(q, id_to_data, data_ready))
               for _ in 3]

    for id in range(1000):
       while True:
           # wait for the current ID to appear before writing
           if id in id_to_data:
               data = id_to_data.pop(id)
               await data.write_async(f'{id}.csv')
               break
               # move on to the next ID
           else:
               # wait for new data and try again
               await data_ready.wait()
               data_ready.clear()

    for r in readers:
        r.cancel()

使用单独的结果队列而不是事件队列是行不通的，因为队列是无序的。优先级队列可以解决这个问题，但它仍然会立即返回当前可用的最低 id，而编写者需要nextid 以便按顺序处理所有 id。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

Asynchronous

pythonasyncio

并行读取和顺序写入？的相关文章

为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
来自 dll 的 Java 调用函数

我有这个 python 脚本导入zkemkeeperdll 并连接到考勤设备 ZKTeco 这是我正在使用的脚本 from win32com client import Dispatch zk Dispatch zkemkeeper ZKE
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht

随机推荐

Flutter 上的简单可扩展列也不会具有“标题”>“可扩展”

我正在尝试制作一个可扩展的列也就是说它有 2 个子项子项和展开小部件时出现的子项在下图中您可以看到子项蓝色和展开的子项红色它们仅应在Expand gt 单击按钮一切正常但无论我做什么我都无法得到Expand gt 按
Oracle 如果行不存在则插入

insert ignore into table1 select value1 value2 from table2 where table2 type ok 当我运行这个时我收到错误缺少 INTO 关键字当我运行这个时我收到错误
HBase 表上的 SparkSQL

任何人都直接在 HBase 表上使用 SparkSQL 就像在 Hive 表上使用 SparkSQL 一样我是spark新手请指导我如何连接hbase和spark 如何查询hbase表 AFAIK 有 2 种方法连接到 hbase 表
iOS - 使用 AVPlayer 检测 URL 流是否正常工作

这就是我的代码中从 url 播放的样子 private func play let streamUrl let playerItem AVPlayerItem url streamURL radioPlayer AVPlayer playe
ls | 的输出厕所-l

通常输出为wc l命令给出文件中的行数但是当我们通过管道输出ls命令它它似乎正确显示当前工作目录中的文件和目录以及链接的数量我的问题是输出ls命令在同一行中显示某些文件和目录的名称那么为什么在这种情况下使用ls wc l与相比
如何使用 Powershell 更改文件的属性？

我有一个 Powershell 脚本可以将文件从一个位置复制到另一个位置复制完成后我想清除源位置中已复制的文件的存档属性如何使用 Powershell 清除文件的 Archive 属性您可以使用旧的 dos attrib 命令如
以编程方式更改 ABAddressBook、ABPersonCopyArrayOfAllLinkedPeople 中的链接联系人数组

是否可以通过编程方式添加删除 CFArray 返回的联系人ABPersonCopyArrayOfAllLinkedPeople 因此有效地链接和取消链接来自不同来源的不同联系人记录以在 iOs 电话簿中显示为统一据我所知至少在
如何在java中打开第2层原始套接字？

如何在java中打开第2层原始套接字在 C 中我们通常使用 AF PACKET 级别来打开具有 sockaddr ll 结构的第 2 层原始套接字二层编程对应的socket包是什么使用普通的 Java 方法这是不可能的因为 Jav
使用 nuxtJS + Vue2-Editor 时如何解决文档未定义错误？

我正在尝试使用 vue2 editor 设置 nuxtjs 应用程序如果我尝试通过客户端导航导航到编辑器页面则其加载但如果我直接访问或刷新例如 com editor 页面我收到文档未定义错误我已经识别出它是因为 vue2 编辑器不
如何交换 observableArray 中的两个项目？

我有一个按钮可以将 observableArray 中的项目向左移动一个位置我正在按照以下方式进行操作然而缺点是categories index 被从数组中删除从而丢弃了该节点上的任何DOM操作在我的例子中是通过jQuery验证
NUnit 异步测试导致 AppDomainUnloadedException

我有一个带有异步操作的 NET 4 5 WCF 服务我进行了集成测试它使用 NetNamedPipeBinding 构建服务主机并通过客户端进行操作然而每次这样的测试总是会导致 NUnit 报告以下内容 System AppDoma
在 DBAccess 中关联两个对象

我正在为我的 iOS 项目使用 dbaccess 如何将数组传递给 dbaccess 对象例如我有像这样的 dbobject interface Member DBObject property strong NSString firs
如何发送带有参数的 getForObject 请求 Spring MVC

我在服务器端有一个方法它为我提供有关在我的数据库中注册的特定名称的信息我正在从我的 Android 应用程序访问它向服务器的请求正常完成我想做的是根据我想要获取的名称将参数传递给服务器这是我的服务器端方法 RequestMappi
我应该严格避免在 Android 上使用枚举吗？

我曾经定义一组相关的常量例如Bundle在如下界面中组合键 public interface From String LOGIN SCREEN LoginSCreen String NOTIFICATION Notification St
C++ 枚举从 0 开始吗？

如果我有一个enum不给枚举分配数字它的序数值会是 0 吗例如 enum enumeration ZERO ONE TWO THREE FOUR FIVE SIX SEVEN EIGHT NINE 我已经找到了帖子引用 C99 标准需要
如何在 Angular 6 中创建级联下拉列表（国家和州列表）

如何在 Angular 6 中创建级联下拉列表国家地区和州列表我想要在 Angular 6 中创建一个完整的国家地区和州列表任何知道这一点的人请分享你的想法演示 gt 级联下拉菜单国家和州列表 https stackblitz
使用 NUnit 测试 Windows 8 应用商店应用程序

我目前正在为一门课程开发 Windows 应用商店应用程序 Windows 8 但在运行 NUnit 测试时遇到问题我的解决方案项目设置如下所示 TheMetroApp sln SQLite net csproj 类库 Windows
如何在 C# 中按类型查找 .cs 文件的路径

如何按类型查找 cs 文件的路径函数原型 string FindPath Type 返回类似 C Projects MyClass cs 的内容在 Net 4 5中你可以使用CallerFilePath反射属性来自MSDN using
需要帮助创建 YouTube 视频列表

我想访问 Youtube 视频并在 ListView 中显示视频的缩略图及其标题单击缩略图后应播放视频任何人都可以建议一些与我的需求或链接相关的示例程序这是我使用 URL 播放 youtube 视频的代码这可能无法满足您的完整要求
并行读取和顺序写入？

我有以下代码可以读取和写入每个id依次 async def main while id lt 1000 data await read async id await data write async f id csv id 1 read

并行读取和顺序写入？

并行读取和顺序写入？ 的相关文章

随机推荐

热门标签

并行读取和顺序写入？的相关文章