使用 Python 的 select 模块检查是否有更多数据可以从文件描述符中读取

2024-02-07

我有一个程序，它在线程中创建一个子进程，以便线程可以不断检查特定的输出条件（来自 stdout 或 stderr），并调用适当的回调，而程序的其余部分继续。这是该代码的精简版本：

import select
import subprocess
import threading

def run_task():
    command = ['python', 'a-script-that-outputs-lines.py']
    proc = subprocess.Popen(command, stdout = subprocess.PIPE, stderr = subprocess.PIPE)
    while True:

        ready, _, _ = select.select((proc.stdout, proc.stderr), (), (), .1)

        if proc.stdout in ready:
            next_line_to_process = proc.stdout.readline()
            # process the output

        if proc.stderr in ready:
            next_line_to_process = proc.stderr.readline()
            # process the output

        if not ready and proc.poll() is not None:
            break

thread = threading.Thread(target = run_task)
thread.run()

它工作得相当好，但我希望线程在满足两个条件后退出：正在运行的子进程已完成，并且 stdout 和 stderr 中的所有数据已被处理。

我遇到的困难是，如果我的最后一个条件是上面的（if not ready and proc.poll() is not None），那么线程永远不会退出，因为一旦 stdout 和 stderr 的文件描述符被标记为就绪，它们就永远不会变得未就绪（即使在从它们读取所有数据之后，并且read()会挂起或readline()将返回一个空字符串）。

如果我将该条件更改为if proc.poll() is not None，那么当程序退出时循环就存在，并且我不能保证它看到了所有需要处理的数据。

这只是错误的方法，还是有一种方法可以可靠地确定您何时读取了将写入文件描述符的所有数据？或者这是一个特定于尝试从子进程的 stderr/stdout 读取的问题？

我一直在 Python 2.5（在 OS X 上运行）上尝试这个，并且也尝试过select.poll() and select.epoll()基于 Python 2.6 的变体（在具有 2.6 内核的 Debian 上运行）。

select如果您想了解是否可以在不阻塞的情况下从管道中读取数据，则 module 是合适的。

为了确保您已读取所有数据，请使用更简单的条件if proc.poll() is not None: break并打电话rest = [pipe.read() for pipe in [p.stdout, p.stderr]]循环之后。

子进程不太可能在关闭之前关闭其 stdout/stderr，因此为了简单起见，您可以跳过处理 EOF 的逻辑。

不要打电话Thread.run()直接使用Thread.start()反而。您可能根本不需要这里的单独线程。

不要打电话p.stdout.readline()之后select()，它可能会阻塞，使用os.read(p.stdout.fileno(), limit)反而。空字节串表示相应管道的 EOF。

作为替代方案或补充，您可以使用以下命令使管道不阻塞fcntl module:

import os
from fcntl import fcntl, F_GETFL, F_SETFL

def make_nonblocking(fd):
    return fcntl(fd, F_SETFL, fcntl(fd, F_GETFL) | os.O_NONBLOCK)

并在读取时处理 io/os 错误。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Python 的 select 模块检查是否有更多数据可以从文件描述符中读取的相关文章

SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
html 选择列表 - 通过传入变量获取文本值？

我有一个显示列表语言的选择列表
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

如何在 bash 中不使用 printf 将字符转换为 ASCII

ascii printf d 1 我目前正在使用此函数将字符转换为 ASCII 但是我只想将函数的结果存储为变量而不打印 ascii 我该怎么办呢请记住我总共只使用了几个小时的 bash 如果这是一个愚蠢的问题我很抱歉在 bash
如何解决此 RCurl 错误：“SSL 证书问题：证书已过期”？

我只是想获得下面一个简单的 URL 响应但出现以下错误该网站是有效的我过去已经可以从该网站提取数千次信息 jsonString lt getURL full url Error in function type msg asError
如何限制对ravendb管理面板的访问？

当默认情况下运行 Raven Server exe 时管理面板在 IP PORT 地址处可见如何限制仅特定用户访问此面板 Steve 我们将 RavenDB 作为 Windows 服务运行并使用 Windows 身份验证来控制访问如
将画布保存到图像文件会保存空白黑色图像

首先我对 UWP 和 XAML 还很陌生我在我的 uwp 上编写了一个简单的代码其中有一个画布命名为 ImageHolder 里面有一个图像和文本块我的主要问题是每当我尝试使用 RenderTargetBitmap 将画布保存到
如何在git的post-receive钩子中处理分支上的文件

我有一个远程服务器我在上面创建了一个裸 git 存储库我想创建一个钩子以便给定的脚本在任何给定分支上收到的最新代码上运行我知道post receive可以使用钩子来实现它但是我想做以下事情找到收到代码的分支在临时位置检出代码并
Python：交织两个列表[重复]

这个问题在这里已经有答案了执行以下操作的 pythonic 方法是什么我有两个清单a and b相同长度的n 我想形成一个列表 c a 0 b 0 a 1 b 1 a n 1 b n 1 c item for pair in zip a
jQuery / JavaScript 中的自定义滚动条数学

我目前正在开发一个项目该项目使用自定义滚动插件由我编写来允许元素在触摸设备以及桌面浏览器中滚动一切都工作正常包括 iOS 的速度和减速度然而剩下的唯一问题是当用户滚动时计算滚动条的顶部或左侧位置我用以下公式计算了滚动条的
在我的 Express.js Jest 测试中找不到内存泄漏

我现在花了一些时间尝试在 Jest 测试中查找内存泄漏尽管我已经成功解决了一些问题但仍然有相当多的内存在测试套件之间泄漏具体来说当我npm test 所有测试套件我得到以下输出 PASS src suite1 test ts 71
iPhone 消息应用程序中的上滑菜单是如何实现的？

在我的 iPhone iOS 8 0 2 上的消息应用程序中当您撰写消息并单击相机图标插入图像时底部会出现一个向上滑动菜单它包含一些按钮以及我可以插入到消息中的最近拍摄的照片这个菜单叫什么名字已经可以通过本地课程获得了吗图
无法搜索联系人

所以我制作了一个静态联系人列表并尝试添加搜索栏但是我无法使用搜索栏搜索联系人当我单击搜索栏时它会打开但随后关闭键盘会弹出一会儿然后就会关闭这个想法是使搜索具有预测性因此当输入名称时它将根据数据库中的名称列出已关闭的名称有
删除 JSON 元素

我想从 JSON 中删除 JSON 元素或一整行我有以下 JSON 字符串 result FirstName Test1 LastName User FirstName user LastName user FirstName Ropbe
Haskell：映射函数应用

我在 Haskell 中进行的部分计算会产生映射的函数列表Float to Float 我想对所有这些函数应用一个参数如下所示 x Float functions Float gt Float map f gt f x functions
如何检查空结构？

我定义了一个结构体 type Session struct playerId string beehive string timestamp time Time 有时我给它分配一个空会话因为 nil 是不可能的 session Sessi
matlab 脚本中是否使用了某些 matlab 例程？

我正在运行一个大的 m 文件该文件不是我自己编写的并且取决于某些子函数我想知道所有嵌套函数中的任何位置是否使用了特定函数在我的例子中是函数 eig m 用于计算特征值有没有快速的方法来做到这一点亲切的问候科恩您可以使用半文档
如何编写 GraphQL 查询以从 github 检索所有工作流程/运行

如何编写 GraphQL 查询以从 github 检索所有工作流程运行我尝试下面的查询来获取节点 id organization login abc repositories first 100 nodes id name 和下面的查询
Microsoft Teams：获取用户的时区？

我正在为 MS Teams 开发一个机器人我希望了解用户的时区以便在适当的时间例如不是在半夜传递消息我没有在机器人框架 REST API 中找到合适的东西虽然我们收到的消息包含 clientInfo country 属性这是
枚举另一个会话上用户桌面的 Windows

我有一个简单的问题让我发疯我有一个用 C 编写的 Windows 服务它应该在 XP Vista 和 7 上运行并且能够枚举当前用户桌面的窗口如果有以进行监控 So far 我用过EnumDesktopWindows通过IntPt
XmlSerializer序列化接口的通用列表

我正在尝试使用 XmlSerializer 来保存 List T 其中 T 是一个接口序列化器不喜欢接口我很好奇是否有一种简单的方法可以使用 XmlSerializer 轻松序列化异构对象列表这就是我想要的 public interf
使用 ColdFusion 对单点登录数据进行签名

对于这篇文章的长度我提前表示歉意我对这个问题的了解还不够无法正确确定具体问题实际上是什么但无论如何我们一直在使用 Leigh 提供的步骤和建议来调用我们的会员 API 来查询有关我们会员的信息加入日期会员类型等 here ht
使用 Python 的 select 模块检查是否有更多数据可以从文件描述符中读取

我有一个程序它在线程中创建一个子进程以便线程可以不断检查特定的输出条件来自 stdout 或 stderr 并调用适当的回调而程序的其余部分继续这是该代码的精简版本 import select import subprocess

使用 Python 的 select 模块检查是否有更多数据可以从文件描述符中读取

使用 Python 的 select 模块检查是否有更多数据可以从文件描述符中读取 的相关文章

随机推荐

热门标签

使用 Python 的 select 模块检查是否有更多数据可以从文件描述符中读取的相关文章