在 Python 中跟踪文件加载进度

2024-01-07

我使用的许多模块都会将整个文件导入内存或在处理文件时将文件的内容滴入其中。我想知道是否有任何方法可以跟踪这种加载进度？可能是一个需要回调的包装类？

我会通过确定文件的大小，然后简单地将总数除以读取的字节数来实现这一点。像这样：

import os

def show_progress(file_name, chunk_size=1024):
    fh = open(file_name, "r")
    total_size = os.path.getsize(file_name)
    total_read = 0
    while True:
        chunk = fh.read(chunk_size)
        if not chunk: 
            fh.close()
            break
        total_read += len(chunk)
        print "Progress: %s percent" % (total_read/total_size)
        yield chunk

for chunk in show_progress("my_file.txt"):
    # Process the chunk
    pass

Edit:我知道这不是最好的代码，但我只是想展示这个概念。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

file

load

progress

在 Python 中跟踪文件加载进度的相关文章

如何在 JavaScript 中创建服务器端进度指示器？

我想在我的网站中创建一个部分用户可以在其中进行一些简单的操作update纽扣这些中的每一个update按钮将发送到服务器并在幕后进行长时间的处理当服务器处理数据时我希望用户有某种进度指示器例如进度条或文本百分比我使用 jQue
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

大型内部类和私有变量

我多次遇到的一件事是服务类如 JBoss 服务由于助手内部类而变得过大我还没有找到一个好的方法来打破课堂这些助手通常是线程这是一个例子 Asset service keeps track of the metadata about
使用 NHibernate 映射字符串集合

我有一个带有属性的域类IList
如何使用 javascript/css 更改 href 属性的值？

假设html包含以下结构 div a href http the link that needs to be changed text a div div div div div
LaTeX 中的词汇表包和脚注

我目前陷入困境有两个单独的术语表 main acronyms Acronyms词汇表在文本中首次使用时打印脚注但是main词汇表没有有没有办法制作除其他词汇表之外的其他词汇表acronyms在第一次使用该术语时打印脚注我不明白该怎么
在 .svg xml 中按 ID 选择元素

我生成一个 svg使用 Inkscape 生成图像这是一个 xml 文件我将节点的 ID 设置为 mount arm r 我想从该元素读取属性 x y 我似乎无法选择rect元素 python 我尝试了 XPath 或者手动一次深度我
Android进度条中的垂直线

我需要一个水平进度条在主进程的末尾有一条黑色垂直线使用我的代码进度条没问题但该线始终位于进度条的中间我尝试使用clip但随后它就消失了而不是出现在片段的末尾 My code
我应该将我的应用程序上下文与用于身份的 ApplicationDbContext 分开吗？

在 Visual Studio 2013 中创建 ASP NET 项目时会生成一个文件IdentityModels cs包含一个类ApplicationDbContext 继承自IdentityDbContext
如何在 CLR UDF 中返回 nvarchar(max)？

假设以下定义
Angular2中@Inputs的一次性（不是单向）绑定？

在 Angular 1 x 中单向数据绑定语法是我正在尝试通过一次性绑定将一个对象传递给子组件子级需要从父级获取初始数据但父级永远不会更改数据也不需要知道子级是否更改了数据
当第二个参数包含“T”时，无法推断模板参数“T”

给定这个模板函数 template lt typename T typename U typename std enable if lt std is same v
防止客户（用户）更改“我的帐户”页面或 WordPress 网站任何其他部分的“帐户详细信息”中的电子邮件

当客户或用户在网站上注册时他可以轻松更改并在帐户详细信息部分中保存他的电子邮件仅此而已如何防止用户的电子邮件在网站的所有部分和部分被更改并且只有网站管理员可以更改用户的电子邮件而不能更改任何其他用户或个人甚至用户本人我不想
管理 fork() 守护进程的信号处理

我想用 perl 编写一个健壮的守护进程它将在 Linux 上运行并且遵循所描述的模板在这个优秀的答案中 https stackoverflow com questions 766397 how can i run a perl scr
将多维数组传递给 C 中的函数

我有一个这样的函数 void myfunc int arr int n int i j for i 0 i
如何用加权平均分组汇总数据？

With xa aggregate x avg by list x value FUN weighted mean w x weight 给我一个错误 Error in weighted mean default X 1L x and w
Retrofit2 并行请求

我在用着OkHttp Retrofit2为第三方系统构建API 我注意到即使使用ConnectionPool和多个线程 Retrofit 永远不会同时调用这就是我创建服务的方式 OkHttpClient Builder httpClien
如何禁用应用程序中的所有滚动效果？

滚动效果上的蓝色阴影在我们的应用程序中看起来非常难看有没有办法禁用所有的过度滚动效果你知道有很多ScrollViews 和其中的列表如果我必须在每个可以的小部件中禁用它那将是一种耻辱滚动谢谢你可以简单地做到 In 布局 XML
AttributeError：“模块”对象没有属性“merge_all_summaries”

乌班图14 04 Python 2 7 13 Anaconda 自定义 64 位我按照教程安装了 Tensorflow https www tensorflow org install https www tensorflow org i
SQL Server - 已声明变量，但仍显示“必须声明标量变量”

我尝试在 Microsoft SQL Server 上运行这组 SQL 命令但收到此错误消息 137 第 15 级状态 1 第 1 行必须声明标量变量 dbstatus 我以为我确实声明了该变量所以我不确定为什么它仍然抛出错误 DE
Javamail 和 Javafx。阅读并显示邮件嵌入图像

我使用名为WebEngine javafx 的控件来显示javamail下载的邮件内容当内容是纯文本或带有图像 src http 链接的 html 时这很好但是当邮件嵌入图像 src 中有内容 id 时控件不会显示此图像当然因为
在 Python 中跟踪文件加载进度

我使用的许多模块都会将整个文件导入内存或在处理文件时将文件的内容滴入其中我想知道是否有任何方法可以跟踪这种加载进度可能是一个需要回调的包装类我会通过确定文件的大小然后简单地将总数除以读取的字节数来实现这一点像这样 import o

在 Python 中跟踪文件加载进度

在 Python 中跟踪文件加载进度 的相关文章

随机推荐

热门标签

在 Python 中跟踪文件加载进度的相关文章