有没有办法找到文件对象的缓冲区大小

2023-11-26

我正在尝试“映射”一个非常大的 ascii 文件。基本上，我会读取行，直到找到某个标签，然后我想知道该标签的位置，以便稍后再次查找它以提取相关数据。

from itertools import dropwhile
with open(datafile) as fin:
    ifin = dropwhile(lambda x:not x.startswith('Foo'), fin)
    header = next(ifin)
    position = fin.tell()

现在这个tell没有给我正确的位置。这个问题以前已经以各种形式被问过。原因大概是因为 python 正在缓冲文件对象。所以，python 告诉我它的文件指针在哪里，而不是我的文件指针在哪里。我不想关闭这个缓冲...这里的表现很重要。然而，如果知道是否有一种方法可以确定 python 选择缓冲多少字节，那就太好了。在我的实际应用程序中，只要我关闭以Foo，没关系。我可以到处写几行。所以，我实际上计划做的是这样的：

position = fin.tell() - buffer_size(fin)

有什么办法可以找到缓冲区大小吗？

对我来说，缓冲区大小看起来是硬编码的在 Cpython 中为 8192。据我所知，除了打开文件时读取一行之外，没有其他方法可以从 python 接口获取这个数字，执行f.tell()找出 python 实际读取了多少数据，然后在继续之前返回到文件的开头。

with open(datafile) as fin:
    next(fin)
    bufsize = fin.tell()
    fin.seek(0)

    ifin = dropwhile(lambda x:not x.startswith('Foo'), fin)
    header = next(ifin)
    position = fin.tell()

当然，如果第一行是longer超过 8192 字节长，但这对我的应用程序没有任何实际影响。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有没有办法找到文件对象的缓冲区大小的相关文章

如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
回形针不支持 .doc 文件

在 Rails 4 0 2 中我使用回形针 gem 上传文件但它不支持 doc 文件在文件上传字段下方显示一条错误消息扩展名与其内容不匹配在模型中检查内容类型的验证如下 validates attachment content
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar

随机推荐

派生类中的私有虚函数[重复]

这个问题在这里已经有答案了可能的重复 C 重写公共私有继承 class base public virtual void doSomething 0 class derived public base private lt Note t
当标志在不同线程中更改时，While 循环不会结束[重复]

这个问题在这里已经有答案了我的 Java 程序的 main 方法中有一个 while 循环正在运行该循环应该一直运行直到在程序的 keyPressed 方法中将布尔标志变量设置为 true 我将程序作为 KeyListener 添加到
如何修复 xcrun 无法找到 simctl 错误？

我有 Xcode 6 2 Beta 尝试 xcrun simctl in terminal yields xcrun 错误无法找到实用程序 simctl 不是开发人员工具或在 PATH 中我通过输入解决了这个问题 Xcode gt Pr
格式化 SoapUI 项目文件

我使用 SoapUI 的免费版本版本 4 6 1 并注意到它的项目文件格式非常糟糕它的许多元素并不像开发人员维护的大型 XML 文件那样位于专用行或缩进中这使得区分和合并对源代码控制项目文件的更改变得更加困难我知道 SoapUI P
如何从工作表中删除公式但保留其计算值[关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案询问代码的问题必须对所解决的问题表现出最低限度的了解包括尝试的解决方案为什么不起作用以及预期结果也可以看看 Stack Overflow 问题清单有关您编写的代码的问题必须描
WPF 中的分段文本框

有谁知道免费或商业 WPF 控件可以执行以下操作每个框 X 个字符并在完成每个框时自动跳到下一个框类似于为 Microsoft 产品输入许可证密钥的方式我认为从头开始做起来并不是特别困难但如果已经存在一个很好的例子我想避免重新发
如何在 NestedScrollView 中使用 RecyclerView

我有这样的布局
在rails4中设置hstore，动态键/值

我第一次在 Rails4 应用程序中使用 Hstore 并且在表单中使用 javascript 为 hstore 列构建动态表单字段 schema 在 Rails 4 中我不需要在模型中添加任何 setter getter 方法对吗在
在 Scala 中使用 Streams 进行迭代

SICP表示迭代过程例如平方根计算的牛顿法 pi 计算等可以用以下形式表示Streams 有人用吗streams在 Scala 中建模迭代这是生成 pi 近似值流的一种方法 val naturals Stream from 0 0 1
通过引用传递键和值的替代方法：

有人可以向我解释为什么你不能传递密钥作为参考吗 Ex if is array where foreach where as key gt value key sec key value sec value unset key value T
fsync、sync：它真的做了它应该做的事情吗？ [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我想对 Linux 2 6 31 中的sync 8 和 fsync 函数的功能有更多的说明它是否确保文件写入相应的存储 http linux die net man 8 sync
如何使用主题标签更改单词的颜色

我需要能够以不同的颜色显示所有以开头的单词的文本并且它们应该是可单击的我怎样才能做到这一点这应该可以解决问题 private void setTags TextView pTextView String pTagString Spa
Java socketRead0 问题

我正在使用 htmlunit 开发一个网络爬虫并且添加了所有必需的超时但我注意到当我使用 Java VisualVM 进行线程转储时某些网站的服务器没有响应时应用程序会挂起 java lang Thread State RUNNAB
Google 地图 Android API：授权失败。确保启用“Google Maps Android API v2”。确保以下 Android Key 存在

我收到此错误 E Google Maps Android API Authorization failure Please see https developers google com maps documentation android
有没有办法在 CSS 中的内联元素上设置 min-line-height ？

我有一些内联链接图标显示在左侧填充背景但是当字体太小时图像不适合行高并且会在顶部和底部被裁剪有没有什么方法可以在不使用javascript的情况下防止这种情况发生我不想以 px 为单位设置字体大小将某些 min line
错误：EACCES：权限被拒绝

I run npm 安装 lodash但它抛出错误 EACCES 权限被拒绝错误我知道这是权限问题但据我所知本地安装节点模块不需要 sudo 权限如果我使用 sudo 运行它它会安装在 node modules 文件夹中 drwx
创建一个ostream

出于教育原因我正在尝试创建一个 C ostream 我的测试将创建一个 ostream 其行为类似于 ofstream 只不过它不是写入文件而是写入双端队列或向量容器正如您所说因为这是为了教育我将向您展示我将如何做这样的事情否则
hibernate不创建表但没有错误消息

我正在做一个 spring boot 项目并尝试使用 hibernate 创建一个表当我运行应用程序并且服务器正常启动时没有收到错误但该表没有创建状态更新 java package model import java util Dat
android：如何更改ListPreference标题颜色？

我想将 ListPreference 的标题和线条颜色从蓝色更改为粉红色以匹配操作栏的线条有任何想法吗提前致谢我一直在浏览 Android 的themes xml and styles xml看着像这样的东西dialogPrefer
有没有办法找到文件对象的缓冲区大小

我正在尝试映射一个非常大的 ascii 文件基本上我会读取行直到找到某个标签然后我想知道该标签的位置以便稍后再次查找它以提取相关数据 from itertools import dropwhile with open data

有没有办法找到文件对象的缓冲区大小

有没有办法找到文件对象的缓冲区大小 的相关文章

随机推荐

热门标签

有没有办法找到文件对象的缓冲区大小的相关文章