Python 3：使用 REGEX 搜索大型文本文件

2023-11-23

我希望使用正则表达式搜索大型文本文件并设置以下代码：

import re

regex = input("REGEX: ")

SearchFunction = re.compile(regex)

f = open('data','r', encoding='utf-8')

result = re.search(SearchFunction, f)

print(result.groups())

f.close()

当然，这是行不通的，因为第二个参数re.search应该是字符串或缓冲区。但是，我无法将所有文本文件插入到字符串中，因为它太长（意味着它会花费很长时间）。还有什么选择呢？

您检查每行的模式是否匹配。这不会将整个文件加载到内存中：

for line in f:
    result = re.search(SearchFunction, line)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

Text

python3x

Python 3：使用 REGEX 搜索大型文本文件的相关文章

Python 遍历目录树的方法是什么？

我觉得分配文件和文件夹并执行 item 部分有点黑客有什么建议么我正在使用Python 3 2 from os import from os path import def dir contents path contents list
Python sqlite3游标没有属性commit

当我运行这段代码时 path Scripts wallpapers single png conn sqlite3 connect Users Heaven Library Application Support Dock desktopp
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
在 matplotlib 中使用 yscale('log') 时缺少误差线

在某些情况下当使用对数刻度时 matplotlib 会错误地显示带有误差条的图假设这些数据例如在 pylab 内 s 19 0 20 0 21 0 22 0 24 0 v 36 5 66 814250000000001 130 177
Matplotlib 图例不工作

自从升级 matplotlib 以来每当尝试创建图例时我都会收到以下错误 usr lib pymodules python2 7 matplotlib legend py 610 UserWarning Legend does not
一起使用 Flask 和 Tornado？

我是以下的忠实粉丝Flask 部分是因为它很简单部分是因为它有很多扩展 http flask pocoo org extensions 然而 Flask 是为了在 WSGI 环境中使用而设计的而 WSGI 不是非阻塞的所以我相信它
.net 的自动完成文本框，支持分隔符

我正在开发一个应用程序它需要一个带有多个单词的自动完成建议下拉的文本框由空格等分隔符分隔就像 StackOverflow 中的标签文本框一样例如我开始输入 app 它应该显示建议列表中以以下内容开头的所有单词app 当我输入
捕获 XSS（跨站脚本）攻击的最佳正则表达式（Java 中）？

杰夫实际上在净化 HTML http refactormycode com codes 333 sanitize html 但他的示例是用 C 编写的而我实际上对 Java 版本更感兴趣有人有更好的 Java 版本吗他的示例是否足以直
从 IMDbPy 结果中的片目中获取电影 ID

我正在尝试创建一个数据集允许我根据 Python IMDb API 中的演员 ID 和电影 ID 加入演员和电影现在我正在尝试从演员的电影作品中提取电影 ID 列表但无法做到例如我知道 Rodney Dangerfield 在
我想找到 C# 代码中所有后面没有括号的 if 语句。通过正则表达式

我想找到所有if声明和for后面没有大括号的语句当你在一个文件中写入一行时if声明您大多不会将其括在大括号中所以我想找到所有这些if and for声明请帮忙就像我想捕捉这个声明 if childNode Name B return
Spark中的count和collect函数抛出IllegalArgumentException

当我使用时抛出此异常时我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效我试图搜索这个问题但没有找到原因看来RDD的分区有问题有任何想法吗先感谢您 sc stop sc Spark
Django 接受 AM/PM 作为表单输入

我试图弄清楚如何使用 DateTime 字段在 Django 中接受 am pm 作为时间格式但我遇到了一些麻烦我尝试在 forms py 文件中这样设置 pickup date time from DateTimeField inpu
如何设置 matplotlib 表中列的背景颜色

我在一个目录中有多个 txt 文件例如 d memdump 0 txt 1 txt 10 txt 示例文本文件如下 Applications Memory Usage kB Uptime 7857410 Realtime 7857410
如何在SQL Server中获取与正则表达式匹配的字符串的一部分

我有一个要求我需要解析列值以获取与其关联的工作请求编号例如列值可能包含致力于 AB 0012589 or AB 0012589 已完成或其中包含工作请求编号的任何内容 Here AB 0012589是工作请求编号工作请求编号的格
SQLAlchemy：避免声明式样式类定义中的重复

我正在使用 SQLAlchemy 并且我的对象模型中的许多类具有相同的两个属性 id 和整数和主键以及名称字符串我试图避免在每个类中声明它们如下所示 class C1 declarative base id Column Inte
在游戏中实现功能

我在完成这部分作业时遇到了麻烦我必须宣布游戏的获胜者然后输入到函数中输入所有 if 语句后我必须创建一个函数def playGame 这必须包括 showRules user getUserChoice computer getCo
Python 枚举子集迭代

我想迭代以下枚举的子集 class Items enum Enum item1 0 item2 1 item3 2 item4 3 item5 4 item6 5 item7 6 item8 7 说我想 for item in Items
从 pandas 数据框中绘制堆积条形图

我有数据框 payout df head 10 复制以下 Excel 绘图的最简单最智能和最快的方法是什么我尝试过不同的方法但无法让一切都到位 Thanks 如果您只想要一个堆积条形图那么一种方法是使用循环来绘制数据框中的每一列并

随机推荐

如何使用 Ctrl-D 终止程序？

I am trying to write a simple program that simulates a calculator I would like the program to exit or turn off when the
Android 按钮 - 如何将 focusable 设置为 true 并在第一次单击时仍然接受 onClick 侦听器？

UPDATE 我通过从按钮样式中删除两条可聚焦线并使用 onClick 事件处理程序来调用来解决了点击问题requestFocusFromTouch 不幸的是我遇到了 requestFocusFromTouch 聚焦错误按钮的问题它始终
SignedXml checksignature 返回 false

我查看了这里有关此问题的其他帖子但似乎没有一个帖子能解决我的情况上周我一直在尝试验证 SAML 断言我有 2 个客户向我发送了 SAML 但我无法验证它主要过程是我们获得一个 Base64 编码的断言并对其进行解码使用 Prese
在 Javascript 中访问私有成员的更好方法

阅读了一些关于 Javascript 的内容后原型继承模型我改变了构建类的风格 var Some Class function this public method function function constructor call t
HttpClient 4.0.1 - 如何释放连接？ [复制]

这个问题在这里已经有答案了我对一堆 URL 进行了循环对于每个 URL 我都执行以下操作 private String doQuery String url HttpGet httpGet new HttpGet url setDefa
Java 8 的字符串去重特性

Since String在 Java 中像其他语言一样会消耗大量内存因为每个字符消耗两个字节 Java 8 引入了一个新功能称为字符串去重它利用了这样一个事实字符数组是字符串和最终的内部数组因此 JVM 可以对它们进行处理我读
如何从 PySpark MultilayerPerceptronClassifier 获取分类概率？

我在 python 中使用 Spark 2 0 1 我的数据集位于 DataFrame 中因此我使用 ML 不是 MLLib 库进行机器学习我有一个多层感知器分类器但只有两个标签我的问题是是否不仅可以获得标签还可以获得或仅该
如何使用#include 编译代码

我正在尝试编译一些使用线程的 C 代码 include
PG::GroupingError：错误：列“events.id”必须出现在 GROUP BY 子句中或在聚合函数中使用

一个事件有一个专栏popularity以及很多关键词关键字具有类别和名称我试图按事件的受欢迎程度对事件进行排序但随后仅返回类别为分类的每个关键字名称中最受欢迎的事件这是我的查询 Event order popularity jo
“innerHTML”和“appendChild”之间的区别

观察 Chrome DevTools 中的节点数量我想知道单击 Button1 后的 dom 树和单击 Button2 后的 dom 树有什么区别索引 html div div class button Execute1 div div
如何在进程之间共享 pandas DataFrame 对象？

这个问题与我之前发布的链接有相同的观点有没有一种好方法可以避免内存深度复制或减少多处理所花费的时间自从我遇到 DataFrame 对象共享问题以来我对此一无所获我简化了示例代码如果有专业人士修改我的代码以在没有 Manager l
MySQL 对列的元素求和

我有一个包含 3 列 A B C 的表我想从表中选择一些行然后 MySQL 返回一行其中在每列上添加了值 A B C 1 2 2 2 2 4 4 4 3 6 7 8 在这种情况下如果我选择所有三行 MySQL 应该返回 A B C
更改文件扩展名

如何在 PHP 中更改文件的文件扩展名例如 filename 234230923 picture bmp 我希望将扩展名更改为jpg newname basename filename bmp jpg rename filename ne
我可以限制 Haskell 中每个函数/monad/线程的内存使用吗？

我正在研究一个旨在作为服务工作的研究编译器项目要求之一是某些用户可能具有有限的内存使用量例如来自 IP 的呼叫a b c d在处理其调用时可能会使用最多 30mb 的堆内存我的原型实现是用 C 编写的只是使用内存池而不是mallo
如何使用通用枚举类型调用 Get Enum Name？

我有一个使用枚举泛型类型的泛型类我的问题如何在该类型的实例上使用 GetEnumName 我创建了一个小型演示类来说明问题 type TEnumSettings
按以特定字符串开头的键对 FormCollection 进行切片

有没有好看的linqy分割a的方法FormCollection into a Dictionary
如何使用线程并行压缩迭代器？

说我有N生成项目流的生成器gs list of generators 我可以轻松地zip它们一起从每个各自的生成器中获得元组生成器gs tuple gen zip gs 这调用next g 在各个g依次在gs并将结果收集在一个元组中但是
如何将数组列表分成相等的部分？

是否有办法将 ArrayList 分成不同的部分直到运行时才知道它的大小我知道有一种方法叫做 list subList a b 但我们需要明确提及列表的起始和结束范围我的问题是我们得到一个包含帐号的数组列表其中包含 2000 40
如何从不等长列表的字典创建DataFrame，并截断到特定长度？

我有一个dict of lists 其长度可变我期待着一种从中创建数据框的有效方法假设我有最小列表长度所以我可以在创建数据框时截断较大列表的大小这是我的虚拟代码 data dict a 1 2 3 4 b 1 2 3 c 2 45
Python 3：使用 REGEX 搜索大型文本文件

我希望使用正则表达式搜索大型文本文件并设置以下代码 import re regex input REGEX SearchFunction re compile regex f open data r encoding utf 8 resul

Python 3：使用 REGEX 搜索大型文本文件

Python 3：使用 REGEX 搜索大型文本文件 的相关文章

随机推荐

热门标签

Python 3：使用 REGEX 搜索大型文本文件的相关文章