迭代 openpyxl 中的只读工作簿中的列

2024-01-03

我有一个有点大的 .xlsx 文件 - 19 列，5185 行。我想打开文件，读取一列中的所有值，对这些值执行一些操作，然后在同一工作簿中创建一个新列并写出修改后的值。因此，我需要能够在同一个文件中读取和写入。

我原来的代码是这样做的：

def readExcel(doc):
    wb = load_workbook(generalpath + exppath + doc)
    ws = wb["Sheet1"]

    # iterate through the columns to find the correct one
    for col in ws.iter_cols(min_row=1, max_row=1):
        for mycell in col:
            if mycell.value == "PerceivedSound.RESP":
                origCol = mycell.column

    # get the column letter for the first empty column to output the new values
    newCol = utils.get_column_letter(ws.max_column+1)

    # iterate through the rows to get the value from the original column,
    # do something to that value, and output it in the new column
    for myrow in range(2, ws.max_row+1):
        myrow = str(myrow)
        # do some stuff to make the new value
        cleanedResp = doStuff(ws[origCol + myrow].value)
        ws[newCol + myrow] = cleanedResp

    wb.save(doc)

然而，由于工作簿太大，Python 在第 3853 行之后抛出了内存错误。 openpyxl 文档说使用只读模式（https://openpyxl.readthedocs.io/en/latest/optimized.html https://openpyxl.readthedocs.io/en/latest/optimized.html）来处理大型工作簿。我现在正在尝试使用它；但是，当我添加 read_only = True 参数时，似乎无法迭代列：

def readExcel(doc):
    wb = load_workbook(generalpath + exppath + doc, read_only=True)
    ws = wb["Sheet1"]

    for col in ws.iter_cols(min_row=1, max_row=1):
        #etc.

python 抛出这个错误：AttributeError：“ReadOnlyWorksheet”对象没有属性“iter_cols”

如果我将上面代码片段中的最后一行更改为：

for col in ws.columns:

python 抛出同样的错误：AttributeError：“ReadOnlyWorksheet”对象没有属性“columns”

迭代行很好（并且包含在我上面链接的文档中）：

for col in ws.rows:

（没有错误）

这个问题 https://stackoverflow.com/questions/45220078/attributeerror-with-openpyxl询问 AttritubeError 但解决方案是删除只读模式，这对我不起作用，因为 openpyxl 在非只读模式下不会读取我的整个工作簿。

那么：如何迭代大型工作簿中的列？

我还没有遇到过这种情况，但一旦我可以迭代这些列，我就会遇到这种情况：如果所述工作簿很大，我如何读取和写入同一工作簿？

Thanks!

如果工作表只有大约 100,000 个单元格，那么您应该不会有任何内存问题。您可能应该进一步调查这一点。

iter_cols()在只读模式下不可用，因为它需要不断且非常低效地重新解析底层 XML 文件。然而，将行转换为列相对容易iter_rows() using zip.

def _iter_cols(self, min_col=None, max_col=None, min_row=None,
               max_row=None, values_only=False):
    yield from zip(*self.iter_rows(
        min_row=min_row, max_row=max_row,
        min_col=min_col, max_col=max_col, values_only=values_only))

import types
for sheet in workbook:
    sheet.iter_cols = types.MethodType(_iter_cols, sheet)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

迭代 openpyxl 中的只读工作簿中的列的相关文章

Gunicorn 工作人员无论如何都会超时

我正在尝试通过gunicorn运行一个简单的烧瓶应用程序但是无论我做什么我的工作人员都会超时无论是否有针对应用程序的活动工作人员在我设置任何内容后总是会超时timeout值到是什么导致它们超时当我发出请求时请求成功通过但工作
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
溢出范围：将数组转换为与 @ 的交集值

在 Excel 引入溢出范围之前在运算符可以使用将范围转换为单个值0 数值或字符串但并不完全相同假设有一列正整数从B4向南从D2向东有一行正整数并且 A 列和 C 列以及第 1 行和第 3 行完全是空的目的是将单

随机推荐

并行动态规划

有没有讨论如何采用动态程序并将其并行化的好论文我们最近发表了一篇论文展示了如何通过共享无锁哈希表在共享内存多核计算机上并行化任何动态编程 Stivala A 和 Stuckey P J 和 Garcia de la Banda M 和
使用 bazel 覆盖率生成 lcov 覆盖率文件时，未创建输出“_coverage/_coverage_report.dat”

我正在使用 bazel 来管理我们的 golang 项目我在网上找到了一个选项我可以通过先生成 lcovcoverage dat 文件来生成覆盖率 html 文件然后使用 genhtml 生成 html 然而我却无法成功迈出第一步
确定单元格是否通过 Excel 中的 VBA 链接到查询表

我使用 QueryTables 将 Excel 工作表链接到数据源效果很好我想引入逻辑来检查给定单元格并确定该单元格是否是现有查询表的左上角这在概念上似乎微不足道但在实践中却被证明是难以捉摸的如果我尝试检查与 QueryTable
安卓。警报管理器在奇怪的时间触发

我使用以下代码设置重复闹钟每 5 分钟一次 public void SetAlarm Context context AlarmManager am AlarmManager context getSystemService Contex
将列更改为默认 SYSDATE 的 DATE 的 SQL 语句（Oracle）是什么？

我得到了一个表名 kundorder 和列名称 datum 我想将数据类型更改为 DATE SYSDATE 但我无法让它工作我认为它应该看起来像这样 ALTER TABLE kundorder MODIFY datum DATE DEFA
在 iFrame 中使用 Google 云端硬盘不起作用

我在 iFrame 中使用 Google Drive 时遇到了一些问题通常在 iFrame 中使用它无论如何都不是一个好主意但这是为了教学 Google Drive 学生可以编写一些代码然后他们可以预览它预览需要在 iFrame
在 Uint8Array 中搜索多字节模式

我有一个 nodejs 脚本我想在其中解析 MP3 帧这些帧很容易检测因为每个帧都以两个字节开头0xff 0xfb 我正在使用一个Uint8Array访问该文件的字节使用 indexOf call data 0xff 我可以轻松搜索
IE 中的 Google Maps API v3 不显示地图或标记

我们最近从 Google 地图 v2 升级到 v3 现在标记和地图将不会在任何版本的 IE 中显示它适用于所有其他浏览器控制台显示 Stack Overflow 错误我们认为这与标记和或标记的创建有关我们禁用了 fitbounds
Numpy where 返回空数组

我有一个数组例如 a 5 1 3 0 2 我应用 where 函数 np where a 2 输出是一个空数组 array dtype int64 我发现了同样的问题here https stackoverflow com questio
Visual Studio 2015 - 连接到 Visual Studio 库进行扩展和更新时出现 Visual Studio 库错误

当尝试从扩展和更新获取 Visual Studio 扩展时我收到以下错误向 Visualstudiogallery msdn microsoft com Services VStudio Extension svc 发出 HTTP 请求
如何在单文件组件中使用 VueJS 2 全局组件？

我正在尝试使用全局注册的组件带有Vue 组件在单个文件组件中但我总是得到 vue common js 2611 Vue warn Unknown custom element
如何使用 System.Text.Json 将 double[] 二维数组序列化为 JSON？

我需要写一个double 使用 System Text Json 转换为 JSON 文件但此序列化程序不支持二维数组我需要一些帮助来转换我的double to a List
PyPy 中的 GIL 在哪里？

PyPy GIL 是 RPython 中 PyPy 解释器实现的一部分还是 translate py 自动添加的东西也就是说如果我用 RPython 编写自己的新语言解释器并通过 translate py 运行它它是否会先验地受到
如何向网页添加自定义右键菜单？

我想向我的 Web 应用程序添加自定义右键菜单可以在不使用任何预构建库的情况下完成此操作吗如果是这样如何显示一个不使用第 3 方 JavaScript 库的简单自定义右键菜单我的目标是像 Google Docs 那样它允许用户右键
提示用户从 Dropbox 下载时保存

我想要一个从 Dropbox 下载文件的链接该链接会提示用户而不是在浏览器中显示该文件这可能需要将内容处置标头设置为附件我目前正在使用 Dropbox 媒体 URL 如下所述 https www dropbox com develo
C2039：类不是命名空间的成员

法师接口 Context h pragma once include
onResume 手机屏幕锁定时被反复呼叫

看来如果手机屏幕锁定时某个 Activity 位于前台广播事件和或唤醒锁将导致该 Activity 的 onResume 被调用无论它们是否适用于您的应用程序即使您不以任何方式与手机交互也会发生这种情况不解锁它不触摸它不做
Android 上的 SQLite 数据库有大小限制吗？ [复制]

这个问题在这里已经有答案了我想将 db 文件内部存储在设备 SD 卡中并希望从中访问数据有人可以告诉我们在我们的 Android 应用程序中可以检索的 db 文件的最大大小吗没有任何内存异常 SQLite 的最大大小为 10MB 到
类型类与代数数据类型？

我经常开始考虑要定义的类型类方面的问题并意识到当我开始编码时我不需要类型类并且可以使用代数数据类型来解决我的问题这看起来更简单因此我想知道什么时候需要类型类据我了解类型类是表示某些类型存在某些函数的一种方式例如当类型 My
迭代 openpyxl 中的只读工作簿中的列

我有一个有点大的 xlsx 文件 19 列 5185 行我想打开文件读取一列中的所有值对这些值执行一些操作然后在同一工作簿中创建一个新列并写出修改后的值因此我需要能够在同一个文件中读取和写入我原来的代码是这样做的 def re

迭代 openpyxl 中的只读工作簿中的列

迭代 openpyxl 中的只读工作簿中的列 的相关文章

随机推荐

热门标签

迭代 openpyxl 中的只读工作簿中的列的相关文章