在Python中迭代文件对象不起作用，但readlines()可以，但效率低下

2024-05-24

在下面的代码中，如果我使用：

for line in fin:

它只对 'a' 执行

但如果我使用：

wordlist = fin.readlines()
for line in wordlist:

然后它执行 a thru z。

But readlines()立即读取整个文件，这是我不想要的。

如何避免这种情况？

def avoids():
    alphabet = 'abcdefghijklmnopqrstuvwxyz'
    num_words = {}

    fin = open('words.txt')

    for char in alphabet:
      num_words[char] = 0
      for line in fin:
        not_found = True
        word = line.strip()
        if word.lower().find(char.lower()) != -1:
          num_words[char] += 1
    fin.close()
    return num_words

语法for line in fin只能使用一次。执行此操作后，您将耗尽该文件，并且无法再次读取它，除非您通过以下方式“重置文件指针”fin.seek(0)。反过来，fin.readlines()会给你一个可以一遍又一遍迭代的列表。

我认为一个简单的重构Counter http://docs.python.org/2/library/collections.html#collections.Counter(python2.7+) 可以让你免去这个头痛：

from collections import Counter
with open('file') as fin:
    result = Counter()
    for line in fin:
        result += Counter(set(line.strip().lower()))

它将计算文件中包含特定字符的单词数（每行 1 个单词）（我相信这是您的原始代码......如果我错了，请纠正我）

您也可以使用以下命令轻松完成此操作defaultdict http://docs.python.org/2/library/collections.html#collections.defaultdict(python2.5+):

from collections import defaultdict
with open('file') as fin:
    result = defaultdict(int)
    for line in fin:
        chars = set(line.strip().lower())
        for c in chars:
            result[c] += 1

最后，抛弃老派——我什至不知道什么时候setdefault被介绍...：

fin = open('file')
result = dict()
for line in fin:
    chars = set(line.strip().lower())
    for c in chars:
        result[c] = result.setdefault(c,0) + 1

fin.close()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

在Python中迭代文件对象不起作用，但readlines()可以，但效率低下的相关文章

在 Python 中解析 TCL 列表

我需要在双括号上拆分以空格分隔的 TCL 列表例如 OUTPUT 172 25 50 10 01 01 Ethernet 172 25 50 10 01 02 Ethernet Traffic Item 1 172 25 50 10 01
Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
Django REST Framework - CurrentUserDefault 使用

我正在尝试使用CurrentUserDefault一个序列化器的类 user serializers HiddenField default serializers CurrentUserDefault 文档说为了使用它请求必须作为
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m

随机推荐

使用放置新运算符时我真的需要担心对齐吗？

我读了这个我什么时候应该担心对齐问题 https stackoverflow com questions 6474316 when should i worry about alignment但我仍然不知道是否需要担心放置新运算符返回的未对
修复类以在 Flask 会话中启用对象存储[重复]

这个问题在这里已经有答案了我有一个自定义类 Passport 其中包含活动用户身份和权限我曾经将它存储在会话中如下所示 p Passport p do something fancy session passport p 它就奏效了
如何在 Adobe Brackets 中使用 const 和 let 禁用 JSLint ES6 错误？

我用 Google 搜索并浏览了这个网站但我只能找到 JSHint 而不是 JSLint 的答案为了摆脱 use function form of use strict 错误我添加了 jslint node true 但要禁用使用错误
当前环境不支持指定的持久类型firebase

我收到这个错误当前环境不支持指定的持久性类型我正在测试我的应用程序发现当用户登录时它在任何地方都已登录所以我尝试使用 firebase 在 Node js Express 上实现会话希望这能解决这个问题我的代码是这样的 rou
终端 vim 中的语法高亮显示，但 gVIM 中没有

我目前在终端中使用 VIM 并且有完美的语法突出显示但是当我尝试使用 gvim 时无论什么类型的文件或输入多少次 syntax on 我都没有得到任何语法突出显示有人有什么想法吗谢谢这是我的 vimrc 供感兴趣的人使用 Turn
使用 UserProfileManager 获取随机用户

我正在尝试为我正在处理的 SharePoint 2010 项目创建一个 Who is Web 部件此 Web 部件应该从 SharePoint 配置文件中选择一个随机用户并显示他她的姓名部门和电话问题是我找不到直接从用户配置文件中获
根据屏幕尺寸更改 md-grid-list 的布局或 cols 值

我正在使用的网格列表角材2 https material angular io components grid list examples 这是笨蛋https plnkr co edit 0v9R3e4x3tThh85147x7 p pre
如何在 asp.net 文本框中保留前导空格

我有一个文本框 Web 控件它会自动修剪其内容中的任何前导空格因此当我收到文本时它与用户最初编写的内容不同如果他输入了前导空格有没有办法禁用这个功能好吧只有一种解决方案可以覆盖默认行为那就是编写一个 javascript 函
Silverlight：在 XAML 中创建 DataTemplate，并在代码中分配它？

是否可以在 XAML 中创建 DataTemplate 并通过代码将其应用到各种控件如果是这样我如何引用我在 XAML 中构建的 DataTemplate 如果你有
使用 xuggle 将 mp3 转换为 wav 出现异常

我正在尝试将 mp3 转换为 wav 代码在这里 String mp3 F work pic2talk38512 mp3 String wav F work pic2talk38512 wav TranscodeAudioAndVideo
避免刷新时上传图片

我正在使用最简单的图像上传形式我非常希望保持这种方式只需要一些 php 代码看起来像这样
使用 Homebrew 安装 Git 时出现问题 [重复]

这个问题在这里已经有答案了可能的重复使用 Homebrew 升级 Git 时出现问题 https stackoverflow com questions 12362021 problems upgrading git with home
[python]没有属性“TessBaseAPI”

当我编译代码时出现错误 import tessercat api tesseract TessBaseAPI 错误是 AttributeError 模块对象没有属性 TessBaseAPI 我已经安装了tesseract via pip
使用 Google Apps 脚本处理数组中输入元素中的多个文件

我有一个表单允许从下拉列表中选择一个项目并上传文件项目的名称和 ID 保存在电子表格文档中适用于一个文件但我想上传多个文件你能帮我修改一下脚本吗 HTML 部分如下所示 div class col md 4 col sm 6 di
如何将方法从其类中取出（并放入新的或现有的类中）？

使用 Visual studio 2010 Resharper 将现有方法从其类中拉出并放入新类中的最简单方法是什么编辑我使用 Resharper 版本 5 从开始公共无效方法首先使用 Make Method Static 命令
从 Bitmap 类创建 .bmp 图像文件

我创建了一个使用套接字的应用程序客户端在其中接收图像并将图像数据存储在 Bitmap 类中谁能告诉我如何创建一个名为我的图像 png or 我的图像 bmp来自此 Bitmap 对象 String base64Code dataInpu
Java，将 null 分配给对象和仅声明之间有什么区别

之间有什么区别 Object o null and Object o 仅声明有人可以回答我吗这取决于您声明变量的范围例如局部变量没有default values在这种情况下你将不得不分配null手动在这种情况下实例变量分配 nul
谷歌脚本循环性能

我是 google 脚本的新手我不确定为什么与 Excel VBA 的简单循环相比我的性能如此差我附上了下面的代码它是一个大约 1200 行的循环每秒删除大约 2 3 行我写的脚本效率很低吗我还不熟悉 Javascript 但
Eclipse 自动完成更改变量名称

只是一个愚蠢的问题但很难搜索因为有很多关于 Eclipse 自动完成的主题而且很难找到与我的问题匹配的内容所以问题是如果我写 MyClass MyVarName 然后按空格键添加 new MyClass Eclipse 自动添加
在Python中迭代文件对象不起作用，但readlines()可以，但效率低下

在下面的代码中如果我使用 for line in fin 它只对 a 执行但如果我使用 wordlist fin readlines for line in wordlist 然后它执行 a thru z But readlines 立

在Python中迭代文件对象不起作用，但readlines()可以，但效率低下

在Python中迭代文件对象不起作用，但readlines()可以，但效率低下 的相关文章

随机推荐

热门标签

在Python中迭代文件对象不起作用，但readlines()可以，但效率低下的相关文章