Python 中日期的正则表达式:英国:日-月-年

2024-03-07

我正在尝试使用 python 编写一个 REGEX 来根据(英国:日-月-年)识别日期。

我写了一些随机字符串,如下所示。

string='these are just rubbish 01-13- 00-00- 44-44- 11-2-2222 24-3-1695abc 12-13-1111 32/11/2000\
        these are actual dates -- 4-02-2011 12/12/1990 31-11-1690  11 July 1990 7 Oct 2012\
        these are actual deal-- by 12 December six people died and  by 18 Nov 19902.00 dollar was spent\
        anomalies -- are he gave June 2000 bucks in 5 July. The shares rose 5% on 5 November 1999.'

re.findall('(\
([1-9]|0[1-9]|[12][0-9]|3[01])\
[-/\s+]\
(1[1-2]|0[1-9]|[1-9]|Jan|January|Feb|February|Mar|March|Apr|April|May|Jun|June|Jul|July|\
Aug|August|Sept|September|Oct|October|Nov|November|Dec|December)\
[-/\s+]\
(1[0-9]\d\d|20[0-2][0-5])\
[^\da-zA-Z])', string)

我得到的输出如下:

[('2/11/2000 ', '2', '11', '2000'),
 ('4-02-2011 ', '4', '02', '2011'),
 ('12/12/1990 ', '12', '12', '1990'),
 ('31-11-1690 ', '31', '11', '1690'),
 ('11 July 1990 ', '11', 'July', '1990'),
 ('7 Oct 2012 ', '7', 'Oct', '2012'),
 ('5 November 1999.', '5', 'November', '1999')]

正则表达式格式似乎有效,但是,正则表达式无法识别一些日期:

by **12 December** six people
by **18 Nov** 19902.00 dollar

我如何修改正则表达式,以便它也识别上述日期。


您要求的是使年份成为可选的。所以你应该围绕你的年份部分[-/\s+](1[0-9]\d\d|20[0-2][0-5])带有可选的非捕获组:

(?:[-/\s+](1[0-9]\d\d|20[0-2][0-5]))?

此外,它还匹配 2/11/2000,这是第一行“垃圾”日期的一部分。使用 a 启动正则表达式\b确保它从单词边界开始。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 中日期的正则表达式:英国:日-月-年 的相关文章

  • Perl 非贪婪

    我遇到非贪婪正则表达式 regex 的问题 我已经看到有关于非贪婪正则表达式的问题 但它们没有回答我的问题 Problem 我正在尝试匹配 lol 锚点的 href Note 我知道这可以通过 Perl HTML 解析模块来完成 我的问题是
  • Python 的键盘中断不会中止 Rust 函数 (PyO3)

    我有一个使用 PyO3 用 Rust 编写的 Python 库 它涉及一些昂贵的计算 单个函数调用最多需要 10 分钟 从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理 所以本质上没什么用 最小可重现示例 Ca
  • SQLAlchemy 通过关联对象声明式多对多自连接

    我有一个用户表和一个朋友表 它将用户映射到其他用户 因为每个用户可以有很多朋友 这个关系显然是对称的 如果用户A是用户B的朋友 那么用户B也是用户A的朋友 我只存储这个关系一次 除了两个用户 ID 之外 Friends 表还有其他字段 因此
  • OpenCV Python cv2.mixChannels()

    我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
  • 使用带有关键字参数的 map() 函数

    这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
  • Django:按钮链接

    我是一名 Django 新手用户 尝试创建一个按钮 单击该按钮会链接到我网站中的另一个页面 我尝试了一些不同的例子 但似乎没有一个对我有用 举个例子 为什么这不起作用
  • PyUSB 1.0:NotImplementedError:此平台不支持或未实现操作

    我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位 并从以下地址下载 z
  • 为什么我只得到第一个捕获组?

    https stackoverflow com a 2304626 6607497 https stackoverflow com a 2304626 6607497 and https stackoverflow com a 370042
  • OpenCV 无法从 MacBook Pro iSight 捕获

    几天后 我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回 并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗 示例代码
  • 如何在ipywidget按钮中显示全文?

    我正在创建一个ipywidget带有一些文本的按钮 但按钮中未显示全文 我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
  • 在 SQLite 中搜索时排除 HTML 标签和一些 UNICODE 字符

    更新 4 我已经成功运行了firstchar例如 但现在的问题是使用regex 即使包含头文件 它也无法识别regex操作员 有什么线索可以解决这个问题吗 更新 2 我已经编译了sqlite3我的项目中的库 我现在正在寻找任何人帮助我为我的
  • 如何为俚语和表情符号构建正则表达式 (regex)

    我需要构建一个正则表达式来匹配俚语 即 lol lmao imo 等 和表情符号 即 P 等 我按照以下示例进行操作http www coderanch com t 497238 java java Regular Expression D
  • 如何使用Python创建历史时间线

    So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
  • Pandas:merge_asof() 对多行求和/不重复

    我正在处理两个数据集 每个数据集具有不同的关联日期 我想合并它们 但因为日期不完全匹配 我相信merge asof 是最好的方法 然而 有两件事发生merge asof 不理想的 数字重复 数字丢失 以下代码是一个示例 df a pd Da
  • Fabric env.roledefs 未按预期运行

    On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
  • 如何在 Python 中追加到 JSON 文件?

    我有一个 JSON 文件 其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中 我尝试了这段代码 with open DATA FILENAME a as f json obj js
  • 使用 Python 绘制 2D 核密度估计

    I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
  • 使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

    我想用Python创建不同的图形matplotlib pyplot 然后 我想将其中一些保存到文件中 而另一些则应使用show 命令 然而 show 显示all创建的数字 我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
  • Rocket UniData/UniVerse:ODBC 无法分配足够的内存

    每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
  • 导入错误:没有名为 site 的模块 - mac

    我已经有这个问题几个月了 每次我想获取一个新的 python 包并使用它时 我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误 实际上 我无法使用任何新软件包 因为每次我

随机推荐

  • Firebase 最大项目和应用程序

    我可以从一个帐户在一个项目中创建多少个应用程序 以及可以在 Firebase for Cloud Messaging 中创建多少个项目 截至目前 2017 年 12 月 8 日 我最多获得 5 个项目 我在创建新项目时收到此消息 并且只有
  • 商务/节假日日期处理[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个与 Perl 模块类似的 C 类 库Date Manip http search cpa
  • RDLC过滤嵌套表

    我正在创建一个 RDLC 报告 其中数据集由多个数据表组成 有一张父表和几张子表 我想做的是显示父表中每一行的每个子表的相关数据 这是一个简化的示例 table1 Purchase 具有 PurhcaseID PurchaseNumber
  • 为什么 c++ std::min 在 O0 上编译时不能使用静态字段作为其参数?

    同样的代码 用O0编译 会报错 Name test cpp Author Version Copyright Your copyright notice Description Hello World in C Ansi style inc
  • 制作应用程序时使用的易失性变量

    我是这个领域的新手 以前 我在进行微控制器编程时 使用易失性变量来避免编译器优化 但我从来没有在变量声明之前看到过这样的 volatile 声明 这是否意味着编译是在 Arago 构建中没有进行任何优化的情况下完成的 这里我有两个问题 如何
  • (图书馆问题)

    我正在使用 Sencha Architect 和 Extjs 4 并按照此处的基本示例进行操作 http geoext org tutorials quickstart html basic example http geoext org
  • 如何将时间跨度转换为小数?

    我的值正好是1 08 43 23在我的文本框中 它等于 1d 08 43 23 我想将该值转换为十进制 以便将其乘以另一个十进制值 但是当我使用Convert ToDecimal它返回错误 输入字符串的格式无效 Is Convert ToD
  • 为 Asp.net core web api 启用 HTTPS 安全连接

    我有使用 ASP NET Core 2 1 创建的 REST API 应用程序 REST API 由 WebHostBuilder 创建并由 Kestrel 托管 Startup Kernel kernel restApiServer ne
  • Ajax 自动完成(或自动建议)与 TAB 完成/自动填充类似于 shell 命令行完成?

    我正在实现 AJAX 自动完成 自动建议功能 我不仅想要执行与用户键入的内容类似的常规显示建议 而且还想让用户完成部分完成以节省键入 所以 想象我的字典中有这些值 青苹果 青梨 绿色水果 蓝天 蓝色水 蓝色唤醒 如果用户输入 g 建议应该是
  • GetElementById() 找不到标签?

    我有一个有效的 XML 文件正在由以下 NET C windows 服务读取 有问题的标签 u1 000 绝对在元素中
  • 使用 CUDA 占用计算器

    我正在使用占用率计算器 但我无法理解如何获取每个线程的寄存器 每个块的共享内存 我阅读了文档 我使用 Visual Studio 所以在 CUDA 构建规则下的项目属性中 gt 命令行 gt 附加选项 I添加 ptxas options v
  • Selenium WebDriver 如何解决陈旧元素引用异常?

    我在 Selenium 2 Web 驱动程序测试中有以下代码 该代码在调试时有效 但在构建中运行时大多数情况下都会失败 我知道这一定与页面未刷新的方式有关 但不知道如何解决它 因此任何有关我做错了什么的指示都会受到赞赏 我使用 JSF pr
  • ToArrayAsync() 抛出“源 IQueryable 未实现 IAsyncEnumerable”

    我在 ASP NET Core 上有一个 MVC 项目 我的问题与 IQueryable 和异步有关 我编写了以下搜索方法IQueryable
  • 如何在客户端获取Tomcat JSESSIONID?

    我想在客户端获取Tomcat的JSESSIONID 那可能吗 如果是 怎么办 Thanks 这取决于 JSESSIONID 的传输方式 如果它是会话 cookie 请参阅如何使用javascript获取cookie http www w3s
  • 如果从数据库加载两次,hibernate 是否会加载同一实例的两个单独副本?

    我知道关于延迟加载有很多不同的问题 但我的问题有点不同 假设我有一个实体 A 其中有实体 B 的集合 类似地 在实体 B 中 我有 A 的集合 在这两种情况下 都使用lazy true 选项 Entity A的实例 aA 有 gt Set
  • 如何安装GWT浏览器插件?

    我如何安装适用于 Chrome 的 GWT 浏览器插件 https chrome google com webstore detail gwt developer plugin jpjpnpmbddbjkfaccnmhnkdgjideiei
  • 如何清除应用程序中的远程通知?

    有没有办法从 iPhone 屏幕顶部向下滑动时清除通知横幅中的远程通知 我尝试将徽章编号设置为零 application applicationIconBadgeNumber 0 代表中didFinishLaunchingWithOptio
  • 在代码中访问编译器常量

    是否可以在如下代码中使用编译器定义的常量 If DEALER DEBUG ID12345 Then If Dealer ID DEALER DEBUG Then Do something End If End If 我正在运行批处理 但我的
  • 如何从 MediaCodec 解码器的输出中提取 PCM 样本

    我正在尝试从解码的 mp4 缓冲区获取 PCM 样本以进行进一步处理 我首先从使用手机相机应用程序录制的视频文件中提取音轨 并且确保当我获得 audio mp4 mime 键时已选择音轨 MediaExtractor extractor n
  • Python 中日期的正则表达式:英国:日-月-年

    我正在尝试使用 python 编写一个 REGEX 来根据 英国 日 月 年 识别日期 我写了一些随机字符串 如下所示 string these are just rubbish 01 13 00 00 44 44 11 2 2222 24