从电子邮件文本中解析“发件人”地址

2024-03-10

我正在尝试从电子邮件的纯文本记录中提取电子邮件地址。我拼凑了一些代码来查找地址本身，但我不知道如何让它区分它们；现在它只是输出文件中的所有电子邮件地址。我想让它只吐出以“发件人：”和一些通配符开头，并以“>”结尾的地址（因为电子邮件设置为“发件人[名称]” ）。

现在是代码：

import re #allows program to use regular expressions
foundemail = []
#this is an empty list

mailsrch = re.compile(r'[\w\-][\w\-\.]+@[\w\-][\w\-\.]+[a-zA-Z]{1,4}')
 #do not currently know exact meaning of this expression but assuming
 #it means something like "[stuff]@[stuff][stuff1-4 letters]"

        # "line" is a variable is set to a single line read from the file
# ("text.txt"):
for line in open("text.txt"):

    foundemail.extend(mailsrch.findall(line))

    # this extends the previously named list via the "mailsrch" variable
      #which was named before

print foundemail

试试这个：

>>> from email.utils import parseaddr

>>> parseaddr('From: [email protected] /cdn-cgi/l/email-protection')
('', '[email protected] /cdn-cgi/l/email-protection')

>>> parseaddr('From: Van Gale <[email protected] /cdn-cgi/l/email-protection>')
('Van Gale', '[email protected] /cdn-cgi/l/email-protection')

>>> parseaddr('    From: Van Gale <[email protected] /cdn-cgi/l/email-protection>   ')
('Van Gale', '[email protected] /cdn-cgi/l/email-protection')

>>> parseaddr('blah abdf    From: Van Gale <[email protected] /cdn-cgi/l/email-protection>   and this')
('Van Gale', '[email protected] /cdn-cgi/l/email-protection')

不幸的是，它只找到每行中的第一封电子邮件，因为它需要标题行，但也许这样可以？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

email

Parsing

Text

从电子邮件文本中解析“发件人”地址的相关文章

docker 容器中的“（pygame parachute）分段错误”

尝试在 docker 容器中使用 pygame 时出现以下错误我想从容器中获取显示 Fatal Python error pygame parachute Segmentation Fault 重现 Docker已安装 docker ru
如何同时运行多个功能[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有以下代码 my func1 my func2 my func3 my func4 my func5 是否可以同时计算函数的数据而
Python Requests 库重定向新 url

我一直在浏览 Python 请求文档但看不到我想要实现的任何功能在我的脚本中我设置allow redirects True 我想知道该页面是否已重定向到其他内容新的 URL 是什么例如如果起始 URL 为 www google c
Python speedtest.net，或等效的[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案是否有一个 Python 库可以实现 SpeedTest net 测试或等效的互联网连接速度测试 GitHub上有一个项目叫速度检查 https gi
NSUserNotificationCenter.defaultUserNotificationCenter() 使用 PyInstaller 返回 None

我正在尝试将通知发送到通知中心 Mac OSX 我正在使用 PyObjC 绑定来使用我们的 python 应用程序中的 cocoa api 我正在使用以下代码片段 import Foundation import objc NSUserNo
获取 Keras model.summary() 作为表

我在 Keras 中创建了相当大的模型我正在用 LaTeX 写一篇关于它的文章为了很好地描述 LaTeX 中的 keras 模型我想用它创建一个 LaTeX 表我可以手动实现它但我想知道是否有任何更好的方法来实现这一点我四处
如何知道python运行脚本的路径？

sys arg 0 给我 python 脚本例如 python hello py 返回 sys arg 0 的 hello py 但我需要知道 hello py 位于完整路径中的位置我怎样才能用Python做到这一点 os path a
无法通过 Android 应用程序访问我的笔记本电脑的本地主机

因此我在发布此内容之前做了一项研究我发现的解决方案不起作用更准确地说连接到我的笔记本电脑的 IPv4192 168 XXX XXX 没用连接到10 0 2 2 加上端口不起作用我需要测试使用 Django Rest 框架构建的
Nodemailer：从未收到问候语

当尝试使用 Nodemailer 在 Node 内发送电子邮件时 https github com nodemailer nodemailer https github com nodemailer nodemailer 调用sendMai
Python 在哪些系统上不使用 IEEE-754 双精度浮点数

Python 对 IEEE 754 浮点运算进行了各种引用但不保证1 https docs python org 3 tutorial floatingpoint html 2 https pythondev readthedocs io
使用 ElementTree 在 python 中解析 xml

我对 python 很陌生我需要解析一些脏的 xml 文件这些文件需要先清理我有以下 python 代码 import arff import xml etree ElementTree import re totstring wit
pandas groupby 操作缺少数据

在 pandas 数据框中我有一列如下所示 0 M 1 E 2 L 3 M 1 4 M 2 5 M 3 6 E 1 7 E 2 8 E 3 9 E 4 10 L 1 11 L 2 12 M 1 a 13 M 1 b 14 M 1 c 15
将图与热图（可能是对数）配对？

How to create a pair plot in Python like the following but with heat maps instead of points or instead of a hex bin plot
Python：导入模块一次然后与多个文件共享

我有如下文件 file1 py file2 py file3 py 假设这三个都使用 lib7 py lib8 py lib9 py 目前这三个文件中的每一个都有以下行 import lib7 import lib8 import lib
如何将 URL 添加到 Telegram Bot 的 InlineKeyboardButton

我想制作一个按钮可以从 Telegram 聊天中在浏览器中打开 URL 外部超链接目前我只开发了可点击的操作按钮 update message reply text Subscribe to us on Facebook and Te
数据损坏 C++ 和 Python 之间的管道

我正在编写一些代码从 Python 获取二进制数据将其通过管道传输到 C 对数据进行一些处理在本例中计算互信息度量然后将结果通过管道传输回 Python 在测试时我发现如果我发送的数据是一组尺寸小于 1500 X 1500 的 2
根据标点符号列表替换数据框中的标点符号[重复]

这个问题在这里已经有答案了使用 Canopy 和 Pandas 我有数据框 a 其定义如下 a pd read csv text txt df pd DataFrame a df columns test test txt 是一个单列文件
py2exe ImportError：没有名为的模块

我已经实现了一个名为 myUtils 的包它由文件夹 myUtils 文件组成 init py 和许多名称为 myUtils 的 py 文件该包包含在 myOtherProject py 中当我从 Eclipse 运行它们时可以找到
Chrome 驱动程序和 Chromium 二进制文件无法在 aws lambda 上运行

我陷入了一个问题我需要在 AWS lambda 上做一些抓取工作所以我按照下面提到的博客及其代码库作为起点这非常有帮助并且在运行时环境 Python 3 6 的 AWS lambda 上对我来说工作得很好 https manivan
PyObjC + Python 3.0 问题

默认情况下 Cocoa Python 应用程序使用默认的 Python 运行时版本 2 5 如何配置我的 Xcode 项目以便它使用较新的 Python 3 0 运行时我尝试用新版本替换项目中包含的Python framework 但它不

随机推荐

获取本[周/月/季度/年]最后一天的日期

有什么方法可以获取日期 adatetime pd Timestamp或同等金额本周月季度年的最后一天datetime pandas或其他日期和时间实用程序 Using datetime only gt gt gt d datet
Java 8/Javascript (Nashorn) 长互操作性

在 Java 8 Nashorn 中执行的以下 Javascript 代码的行为不符合预期 if a b do sth a 和 b 是来自 Java 对象的长值例如 1023948 1023949 例如当 a 1023949 且 b 1
如何在 Spark 中使用 Sklearn 模型进行预测？

我使用 sklearn 在 python 中训练了一个模型我们如何使用相同的模型加载 Spark 并在 Spark RDD 上生成预测 Well 我将展示 Sklearn 中的线性回归示例并向您展示如何使用它来预测 Spark RDD
如何使引导导航栏下拉菜单的列表项徽章向右对齐？

在文档中badges http getbootstrap com components badges 徽章嵌套在nav nav pills nav stacked class 但我在导航栏中有一个使用徽章的下拉菜单我认为这是因为它在一个
php curl 能够登录网站但登录后不显示任何数据

HI 我可以使用 php 和 curl 登录该网站但是当我登录后尝试读取数据时如果启用了 CURLOPT RETURNTRANSFER 则显示 string 0 禁用时显示 bool true 我不明白我到底错在哪里非常感谢任何帮助
使用 Cassandra 进行事件重复数据删除

我正在寻找使用 Cassandra 消除重复事件的最佳方法我有很多客户端接收事件 ID 每秒数千个我需要确保每个事件 id 都被处理一次且仅一次并且具有高可靠性和高可用性到目前为止我已经尝试了两种方法使用事件 id 作为分区键然
设置HashMap线程安全吗？

我有一个HashMap在我的程序中它由多个线程访问并且偶尔由单个线程设置例如 Map
在go中获取未安装卷的BLKID

我试图找出是否有一种方法可以通过一些本机 golang 库获取已卸载卷的 blkid 详细信息我对卷的 fstype 特别感兴趣我不认为有一个本地库我找不到一个我想你有3个选择掏出壳 https golang org pkg os
如何显示“助理编辑器”？

https web archive org web 20110604185120 http developer apple com library ios documentation iphone conceptual iPhone101
AngularJs http get 响应未定义，但数据存在于 success 函数中

我是有角度的新手我尝试从 http get 方法获取 json 响应我的代码是 app factory getdata function http q this getlist function alert 1 return http
EnumProcessModulesEx 和 CreateToolhelp32Snapshot 失败 - 无论是 32 位还是 64 位

Edit 这个问题的答案在这里 https stackoverflow com a 27317947 996540 https stackoverflow com a 27317947 996540 在 msvc 中创建项目时默认启用选项
如何隐藏VSCode的Java编译器路径？

当我在 vscode 的集成终端中运行 java 程序时完整的 java 路径显示为一个大文本框有什么办法可以摆脱这个吗 Library Java JavaVirtualMachines jdk 13 0 1 jdk Contents
350 多个错误：类型“blah.blah.blah”已包含定义？

这是什么意思是否因为我有两个不同的 DBML 文件包含相同的数据库表 Error 343 The type mvc Models Bundle already contains a definition for BundleIcon C
将多个值添加到一个 numpy 数组索引

简单版本如果我这样做 import numpy as np a np zeros 2 a 1 1 np array 1 1 I get 0 1 作为输出但我想要 0 2 这是否可能以某种方式使用隐式 numpy 循环而不是我自己循环我
输入是自动关闭的并且不应该有内容

当我加载 Express 网页时出现以下错误表达 500 错误 app views index jade 114 112 TD 2 113 TD 4 年 gt 114 输入是自动关闭的并且不应该有内容 112 td 2 113 td 4
使用数据源和实体框架填充以编程方式声明的 datagridview

只是 c winforms datagridview 存在一些小问题这是我的场景我正在使用实体框架并尝试将某些实体模型绑定到我的 datagridview 数据源 var query from q in context foo sel
PHP 致命错误：未找到接口“JsonSerialized”

我今天已将我的 D8 站点从 Windows 迁移并配置到 Ubuntu 14 04 PC 但是当我运行该网站时我收到以下错误致命错误在第 32 行 var www eCartZone core lib Drupal Componen
提供随机访问的整数序列压缩

我有一个小范围内的 n 个整数序列 0 k 并且所有整数都有相同的频率f 所以序列的大小是n f k 我现在想做的是压缩这个序列同时提供随机访问第 i 个整数是多少实现随机访问的时间不一定是 O 1 我更感兴趣的是以更高的随机访问时间
无法访问 Spring Boot 和 Jersey 应用程序中的某些控制器

我在访问某些控制器时遇到一个小问题当我发送请求至我得到一个 HTTP 404 同样的movies path package com emo server Configuration ComponentScan com emo serve
从电子邮件文本中解析“发件人”地址

我正在尝试从电子邮件的纯文本记录中提取电子邮件地址我拼凑了一些代码来查找地址本身但我不知道如何让它区分它们现在它只是输出文件中的所有电子邮件地址我想让它只吐出以发件人和一些通配符开头并以 gt 结尾的地址因为电子邮件设置为

从电子邮件文本中解析“发件人”地址

从电子邮件文本中解析“发件人”地址 的相关文章

随机推荐

热门标签

从电子邮件文本中解析“发件人”地址的相关文章