re模块----你也可以玩得很溜正则表达式

2023-11-18

目录

re模块

compile(pattern, flags=0)

flag匹配模式

match(pattern, string, flags=0)

search(pattern, string, flags=0)

findall(pattern, string, flags=0)

split(pattern, string, maxsplit=0, flags=0)

sub(pattern, repl, string, count=0, flags=0)

---------------------------------------------------------------------------------------------

re模块

1下载re模块

2导入模块

import re

3 语法

re模块相当于是一个语言模块,拥有自己的语言规则,是爬虫的数据爬取进行数据的提取的三大模块(re xpath bs4 ) 之一,下面介绍re的语法的一些标识符:

(1)匹配单个字符

(2)匹配多个字符

补充一点:使用多字符就会使正则表达式变成贪婪,多字符标记加上个?就会使正则表达式变成非贪婪,下面会有介绍

(3)匹配开头结尾

(4)匹配分组

re.match()

match(pattern, string, flags=0)===>match("正则表达式", 拿来匹配的字符串, 匹配方式)

(1)简单介绍

match(pattern, string, flags=0)===>match("正则表达式", 拿来匹配的字符串, 匹配方式)

这样解释可能一点不友好,下面开始使用match()

(1)使用单字符" . "

现在由我来解释

match()是re里的函数,match利用正则表达式来跟字符串匹配,从头开始匹配,

可以理解为正则表达式有啥,字符串的开头就必须有,

没有就会报错,如下图:

group()是报错的主犯,当match匹配不到时,会返回None,正因group()拿不到匹配到的字符就会报错

group()返回匹配到的字符

flag匹配模式

下面我们简单介绍re.S和re.I

re.I 不区分大小写

re.S 可以换行匹配

search(pattern, string, flags=0)===>search("正则表达式", 拿来匹配的字符串, 匹配方式)

search()的匹配原理是在字符串中找到符合正则表达式的字符就立刻返回,(就是找到第一个就会返回)

findall(pattern, string, flags=0)===>findall("正则表达式", 拿来匹配的字符串, 匹配方式) (直接返回所有匹配到的字符)

findall()和前面的match() search()不同,findall是直接把所有匹配到的字符以列表返回

split(pattern, string, maxsplit=0, flags=0)===>split("正则表达式", 拿来匹配的字符串,最大切割数, 匹配方式)

split就是把匹配到的字符切割(可以理解为去掉字符) ,返回切割后的字符串,和前面不同,前面是返回匹配到的,

sub(pattern, repl, string, count=0, flags=0)===>findall("正则表达式",替换的字符, 拿来匹配的字符串, 匹配方式)

sub()和findall()的匹配类似都是匹配到全部符合的,唯一不同的就是会把匹配到的字符进行替换

总结

以上的方法都是为了更好的匹配字符串,灵活性高,操作性强

简单练习

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

正则表达式

开发语言

python

re模块----你也可以玩得很溜正则表达式的相关文章

如何恢复tensorflow inceptions检查点文件（ckpt）？

I have inception resnet v2 2016 08 30 ckpt文件是预先训练的初始模型我想使用恢复这个模型 saver restore sess ckpt filename 但为此我将需要编写训练该模型时使用的变量
在 Python 中解析 TCL 列表

我需要在双括号上拆分以空格分隔的 TCL 列表例如 OUTPUT 172 25 50 10 01 01 Ethernet 172 25 50 10 01 02 Ethernet Traffic Item 1 172 25 50 10 01
使用 MongoDB 作为我们的主数据库，我应该使用单独的图数据库来实现实体之间的关系吗？

我们目前正在为一家专业公司内部实施类似 CRM 的解决方案由于存储信息的性质以及信息的不同值和键我们决定使用文档存储数据库因为它完全适合目的在本例中我们选择 MongoDB 作为此 CRM 解决方案的一部分我们希望存储实体之间的关
Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

this.$el.querySelectorAll is not a function报错解决

问题描述使用el tree时报错this el querySelectorAll is not a function 导致树无法渲染问题解析参考如下代码片段
[激光原理与应用-66]：激光器-器件 - 二极管

第1章二级管的基本原理 1 1 原理现在的电子产品中元件应用最多的是半导体材料在集成电路中也是应用的半导体单晶硅作为基底通过离子注入技术而添加了硼和磷元素从而构成数以亿计的半导体晶体管对于半导体元件来说发挥作用的是PN结在
5G/NR 随机接入过程之Msg2

21 6 Msg2 UE发送了preamble之后将在RAR时间窗 RA Response window 内监听PDCCH 以接收对应RA RNTI的RAR 此时不考虑可能出现的测量gap 如果在RAR时间窗内没有接收到gNB回复的RAR
RPA经验分享--离线识别普通验证码

了解RPA www i search com cn 学习RPA https support i search com cn 下载RPA https www i search com cn from csdn 前言以下方法适用于简易的验证码
【Linux】进程控制2-进程等待

文章目录进程等待进程等待的必要性 wait函数 waitpid函数进程等待进程等待的必要性我们之前提到过僵尸进程僵尸进程就是子进程先于父进程退出子进程的退出状态信息发送给父进程但是父进程忽略处理子进程就变成了僵尸进程解决僵
programming massively parrellel processors(1)

I have to say this is a very good book to learn more about cuda especially for a novice like me who take interest in par
入职字节两个月，实在卷不动，还是离职了

对自己收入不满意就看下自己每天做了什么把每天记录下来看下自己的时间都用在哪里了对自己的时间分配搞清楚了就可以着手去改进如果一直糊涂的过时间到了报复就来了时间管理很简单不过大多数人是不会重视的别总抱怨自己赚钱少关键你做了
Asgard King（埃氏筛法）

Description Thor had great power but his arrogant and reckless behavior set off an ancient war and he was demoted into t
Mock介绍

mock的定义 what mock是在测试过程中对于一些不容易构造获取的对象创建一个mock对象来模拟对象的行为为什么要使用mock why 在做单元测试过程中经常会有以下的场景 class A 依赖 class B class
14.C++之对象的初始化和清理

学习目标学习内容 1 对象的初始化和清理在C 中每个对象也都会有初始设置以及对象销毁前的清理数据的设置今天介绍两种函数构造函数和析构函数来完成对象的初始化和清理构造函数主要用于为对象的成员属性赋值又编译器自动完成无须手
报错：SyntaxError: (unicode error) ‘unicodeescape‘ codec can‘t decode bytes in position xx: truncated

我给出的错误代码错误原因文件路径输入问题解决方法 1 在前面加r 2 将变为 3 将变为
C++学习日志

小白C 从入门到放弃 1 黑马通讯录管理系统点运算符和箭头运算符 gt 的区别 2 Essential C 中练习2 1 3 Essential C 中练习2 2 4 Essential C 中练习2 3 5 Essential C 中
C++中变量声明和定义

1 声明和定义都规定了变量的名字和类型但是定义会申请内存空间也可能为变量赋一个初始值 2 同一个变量声明可以有多处但定义只能有一处 extern int i 声明i而非定义i int j 声明并定义j extern关键字就是告诉编译器
机器智能学科

机器智能学科简介机器智能 Machine Intelligence MI 是指由机器计算机以及其它计算设备实现的人的智能也被称为人工智能 Artificial Intelligence AI 专指计算机科学中与智能行为自动化有关的一
RAC重建OCR/Voting disk总结

author skatetime 2010 05 10 我的测试环境母系统 win2003虚拟软件 vmware3 2 1guest系统 centos4 7oracle db oracle10 2 1 前两天由于意外原因同事从新插拔下电
Auto-GPT横空出世！

转自公众号放码过来a 千万别关注为怕你看了会上瘾 Auto GPT 顾名思义其独到之处就在于 Auto 可自主实现你设定的任何目标即 Auto GPT 会自己上网查资料自己思考解决方案自己运用相关工具而你要做的就是在屏幕
报错Error : Program type already present: android.support.design.widget.CoordinatorLayout$

方法一 support依赖版本改为27 1 1并添加一下配置 implementation com android support appcompat v7 27 1 1 configurations all exclude group c
工具技能学习（一）：前置技能-makfile、make、.mk

工具技能学习一前置技能 makfile make mk 在构建镜像的时候你肯定看到了很多的makefile文件昨天我们也解读一些一些构建编译的makefile文件但是有些兄弟没有这方面的经验对于makefile文件的格式还是不是很
树莓派4B之Windows XP系统安装游戏（二）

上一篇博文树莓派4B之Windows XP系统安装游戏一上上篇博文树莓派4B安装windows xp windows 95 windows xp windows 95 for raspberry pi 4B 目录一获取游戏下载途
re模块----你也可以玩得很溜正则表达式

目录 re模块 compile pattern flags 0 flag匹配模式 match pattern string flags 0 search pattern string flags 0 findall pattern stri

热门标签