如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

2024-05-06

我花了几个小时来挖掘这种行为，首先是关于这些问题：

`write(2)` 到本地文件系统的原子性 https://stackoverflow.com/questions/10650861/atomicity-of-write2-to-a-local-filesystem
如何同步（使原子化）从两个进程写入一个文件？ https://stackoverflow.com/questions/6896011/how-can-i-synchronize-make-atomic-writes-on-one-file-from-from-two-process
如何以编程方式确定“写入”系统调用对特定文件是否是原子的？ https://stackoverflow.com/questions/7660293/how-does-one-programmatically-determine-if-write-system-call-is-atomic-on-a-pa
如果两个不同的进程同时对同一文件调用写入系统调用，会发生什么情况 https://stackoverflow.com/questions/7236475/what-happens-if-a-write-system-call-is-called-on-same-file-by-2-different-proces
http://article.gmane.org/gmane.linux.kernel/43445 http://article.gmane.org/gmane.linux.kernel/43445

看来如果我们在打开文件时使用“O_APPEND”标志，那么在 Linux 上从多个进程登录到同一个文件总是可以的。我相信 python 肯定在其日志记录模块中使用“O_APPEND”标志。

从一个小测试来看：

#!/bin/env python
import os
import logging

logger = logging.getLogger('spam_application')
logger.setLevel(logging.DEBUG)
# create file handler which logs even debug messages
fh = logging.FileHandler('spam.log')
logger.addHandler(fh)
formatter = logging.Formatter(
    '%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setFormatter(formatter)

for i in xrange(10000):
    p = os.getpid()
    logger.debug('Log line number %s in %s', i, p)

我运行它：

./test.py & ./test.py & ./test.py & ./test.py &

我发现spam.log没有任何问题。这种行为或许可以支持上面的结论。

但问题随之而来：

这是什么意思here https://docs.python.org/2/howto/logging-cookbook.html#logging-to-a-single-file-from-multiple-processes?
以及使用场景有哪些this https://pypi.python.org/pypi/ConcurrentLogHandler/0.9.1，只是为了文件轮换？

最后，如果两个进程正在同一个文件上进行写入，我的意思是它们正在同一个文件上调用 write(2)，谁确保来自两个进程的数据不会交错（内核或文件系统？），以及如何交错。[注意：我只是想深入了解 write 系统调用，欢迎任何有关此的点击。]

EDIT1 :

Do this https://docs.python.org/2/howto/logging-cookbook.html#logging-to-a-single-file-from-multiple-processes and this https://pypi.python.org/pypi/ConcurrentLogHandler/0.9.1只是为了不同操作系统环境（如 Windows、Linux 或 Mac）之间的兼容性而存在？

EDIT2 :

再进行一项测试，每次向logging.debug提供8KB字符串。这次我可以在 spam.log 中看到“交错”行为。此行为正是上面一页中有关 PIPE_BUF 的指定内容。所以看起来 Linux 上的行为很清楚，如果 write(2) 的大小小于 PIPE_BUF，则使用 O_APPEND 是可以的。

我越挖越深。现在我想这些事实已经很清楚了：

使用 O_APPEND，多个进程的并行 write(2) 就可以了。只是行的顺序未确定，但行不会相互交错或覆盖。根据尼尔·道格拉斯 (Niall Douglas) 的回答，数据的大小是任意数量的了解多个进程的并发文件写入 https://stackoverflow.com/questions/12942915/understanding-concurrent-file-writes-from-multiple-processes。我已经在linux上对此进行了“任意数量”的测试，但没有找到上限，所以我想这是正确的。
没有O_APPEND，就会乱七八糟。 POSIX 是这样说的：“POSIX.1-2008 的本卷没有指定从多个进程并发写入文件的行为。应用程序应该使用某种形式的并发控制。”
现在我们进入Python。我在 EDIT3 中进行的测试，即 8K，我找到了它的起源。 Python的write()实际上使用了fwrite(3)，而我的python在这里设置了一个BUFF_SIZE，即8192。根据abarnert的回答Linux 上文件的默认缓冲区大小 https://stackoverflow.com/questions/18194374/default-buffer-size-for-a-file。这个8192的故事说来话长。

不过，欢迎提供更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？的相关文章

类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
如何启用 vstest.console.exe 日志记录？

我试图查看在 Visual Studio 2013 中运行测试时究竟执行了什么 vstest 命令如何启用 vstest console exe 日志记录执行的命令是带有相关参数的 VSTest Console exe 当您运行测试时
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

如何正确使用 liquibase `searchPath` 选项来指示各自的资源文件夹？

我正在尝试调用update的命令liquibase如下 liquibase update changelog file persistence src main resources changelog db changelog dev xm
Three.js - 如何翻译几何图形

我有一个脚本可以定位各种宽度高度和深度的立方体并且正在努力根据 xAxis yAxis 和 zAxis 也有所不同将它们准确地排列起来 var geometry new THREE BoxGeometry width height
如何按外部值对 Django QuerySet 进行排序？

我有一个由 id rank 对组成的字典我想对 ids 执行 Django 查询以便生成的查询集按排名降序排序获取查询集很容易 rankings result MyModel objects filter id in rankin
对象关系映射继承

有没有人really想要并使用过 ORM 工具的继承支持如果是的话您认为哪一个提供最好的支持或者ORM继承是一个天上掉馅饼的概念吗我已经在 Hibernate 中使用了继承还有一些在 Django 中并且非常后悔组合优于继
如何在一个文本框中搜索多个值并在 DataGridView vb.net 中显示

有没有一种方法可以在一个文本框中搜索过滤多个值我正在 OPIS 列中搜索两个或多个不同的单词短语 Example 搜索 sveder 然后搜索 din 374 然后搜索 TiN 结果将是具有此描述的所有项目我有这段代码但是当搜索与
ZXing 无法正确读取巴西条形码钞票（交错的 2 个，共 5 个）。我该如何修复它？

我使用 XZing 2 3 0 读取 ITF 条形码但 ZXing 无法正确读取 47 位巴西钞票以下示例条形码图像可以在这里找到 http www shimatai com br images boleto png 被读作03391
一个同时接受 std::vector 和 QVector 的函数模板？

假设我有一个函数叫做loadData 它需要一个容器填充数据和一个 CSV 文件我需要以下重载 loadData std vector
从多行中选择数据并对其进行排序[重复]

这个问题在这里已经有答案了 id title content class 1 t1 p1 1 2 t2 p6 1 3 t3 p5 2 4 t4 p8 3 对于这个表我如何使用 1 个查询来SELECT所有课程DISTINCTLY变成这个
如何使用 xpointer 和 Xinclude 来引用元素

我想将 2 个具有相同结构的 XML 文件合并为一个例如测试1 xml
emberjs 无法克隆未实现 Ember.Copyable 的 Ember.Object

我正在使用 ember 1 3 1 和 ember data 1 0 0 beta 5 在创建新模式时我收到以下错误断言失败无法克隆未实现 Ember Copyable 的 Ember Object 以下是我的模型代码 App myM
如何在列表中使用 CSS 计数器而不重置计数器？

我想要有多个 ol 列表其中计数器值not在列表之间重置另一种说法是我希望第二个列表中第一个 li 的计数器比前一个列表最后一个元素的计数器值高一个有什么 CSS 魔法可以做到这一点吗 While 苏的回答 https stacko
多重集删除最后一个元素

我试图使用以下方法删除多重集的最后一个元素 minheap erase minheap rbegin 它无法编译并出现 4 5 个错误请注意在 C 多重集中 end 指向最后一个元素的旁边而不是最后一个元素有任何想法吗 EDIT
JSON 和 JavaScript 对象有什么区别？ [复制]

这个问题在这里已经有答案了我对 JSON 和 JavaScript 对象很陌生有人可以解释一下 JSON 和 JavaScript 对象之间的区别吗它们的用途是什么这个比那个好吗还是要看情况而定何时使用哪一个在什么情况下使用
ios 将 alpha 通道视频叠加在另一个视频上

我一直在尝试创建一个视频模板该模板使用 alpha 通道视频叠加在 mp4 视频和图像上这就是我需要创建视频的方式http viewptch ptchcdn com rendered 52b28a9f8d4f980f3a3f99c3 c
如何使用 HTML/CSS/jQuery 编写复数分数？

我希望能够使用 HTML CSS jQuery 编写分数而不是使用 TeX 渲染器甚至 MathML 目前有一个很好的解决方法可以编写简单的分数如果您有one term对于分子和分母来说但是一旦你开始使用多个术语它看起来就相当可怕
mockito：如何在java 8中匹配可变参数？

我正在努力将项目从 java 7 迁移到 8 并且在 Mockito 何时情况下遇到编译错误我很难追踪 when queryRunner query any String class any ResultSetHandler class
为什么即使显式抛出错误也没有被捕获？

我想使用带注释的 ExceptionHandler 捕获 SpringMVC3 中的错误我可以捕获可抛出异常和任何异常但是当我尝试使用 Error 时它没有捕获异常知道为什么吗下面的代码演示了这个问题 Controller Re
$PATH 中 /usr/bin 和 /usr/local/bin 等的顺序

在我的 Mac 上我经常使用 bash 对于我的环境设置我添加了 usr bin and usr local bin into PATH就像我平常做的那样虽然我知道什么 usr bin and usr local bin关于我很好奇
Android 手机号码验证

如何检查电话号码是否有效长度最大为13 包括字符在前我怎么做我试过这个 String regexStr 0 9 String number entered number getText toString if entered num
如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

我花了几个小时来挖掘这种行为首先是关于这些问题 write 2 到本地文件系统的原子性 https stackoverflow com questions 10650861 atomicity of write2 to a local f

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？ 的相关文章

随机推荐

热门标签

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？的相关文章