使用 emaildata 0.3.4 使用 Python 3.6 读取 .eml 文件

2023-11-21

我正在使用 python 3.6.1，我想读取电子邮件文件（.eml）进行处理。我正在使用电子邮件数据 0.3.4包，但是每当我尝试像文档中那样导入 Text 类时，我都会收到模块错误：

import email
from email.text import Text
>>> ModuleNotFoundError: No module named 'cStringIO'

当我尝试纠正使用这次更新，我收到下一个与以下相关的错误mimetools

>>> ModuleNotFoundError: No module named 'mimetools'

是否可以使用 emaildata 0.3.4 和 python 3.6 来解析 .eml 文件？或者还有其他包可以用来解析 .eml 文件吗？谢谢

使用电子邮件包，我们可以读取.eml 文件。然后，使用BytesParser解析文件的库。最后，使用一个plain首选项（对于纯文本）get_body()方法，以及get_content()获取电子邮件原始文本的方法。

import email
from email import policy
from email.parser import BytesParser
import glob
file_list = glob.glob('*.eml') # returns list of files
with open(file_list[2], 'rb') as fp:  # select a specific email file from the list
    msg = BytesParser(policy=policy.default).parse(fp)
text = msg.get_body(preferencelist=('plain')).get_content()
print(text)  # print the email content
>>> "Hi,
>>> This is an email
>>> Regards,
>>> Mister. E"

当然，这是一个简化的示例 - 没有提及 HTML 或附件。但它基本上完成了问题提出的问题和我想做的事情。

以下是迭代多封电子邮件并将每封电子邮件保存为纯文本文件的方法：

file_list = glob.glob('*.eml') # returns list of files
for file in file_list:
    with open(file, 'rb') as fp:
        msg = BytesParser(policy=policy.default).parse(fp)
        fnm = os.path.splitext(file)[0] + '.txt'
        txt = msg.get_body(preferencelist=('plain')).get_content()
        with open(fnm, 'w') as f:
            print('Filename:', txt, file = f)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

NLP

eml

使用 emaildata 0.3.4 使用 Python 3.6 读取 .eml 文件的相关文章

让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
如何将 GAE 中一种 Kind 中的所有实体复制到另一种 Kind 中，而无需显式调用每个属性

我们如何使用function clone entity 如中所述在 Python 中复制 Google App Engine 数据存储中的实体而无需在编译时知道属性名称 https stackoverflow com question
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Django REST Framework - CurrentUserDefault 使用

我正在尝试使用CurrentUserDefault一个序列化器的类 user serializers HiddenField default serializers CurrentUserDefault 文档说为了使用它请求必须作为
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

使用反射解压数组

我正在尝试解压从反映对象字段获得的数组我将常规字段的值设置为一个对象如果它是一个数组那么我想将我的通用对象转换为数组无论其类型是什么并提取其内容 fields i setAccessible true String key fie
如何直接从IDE读取Python源代码

我目前正在学习Python 我想通过阅读它的源代码来更深入地了解Python是如何工作的我可以手动进入Python安装目录查看源代码我想知道是否可以直接从PyCharm等IDE读取Python源代码我尝试过了control click
如果没有互联网连接，xmlns属性如何工作并被浏览器理解？

一个简单的 XHTML 文档具有最少的所需标签以及xmlns属性有一个 http 链接如果我在 localhost 上工作并且没有 Internet 连接我不能在 XHTML 上工作吗 The content of the docu
导入语句错误“需要“FILENAME”或 ”

我在将 Appirater 集成到我的应用程序中时遇到一些问题我已经正确添加了所有必要的文件并且拥有正确的代码我认为但是在尝试将其实现到我的 AppDelegate m 文件中时出现错误当我做 import Appirater h
使用 MockMvc 在 Spring MVC 中进行单元测试/登录

我有一个使用 Spring MVC 创建的非常简单的 REST 应用程序代码可在GitHub 它有一个简单的WebSecurityConfigurer如下 Override protected void configure HttpSec
是否可以使用android的语音识别而不显示对话框？

我想在 android 中使用语音发送文本 api 但我不想被这些对话框拖慢速度没有它们是否可以使用该功能对的这是可能的您可以使用 API 中的 SpeechRecognizer 类确保它在主线程中使用根据 API 的要求并且
将 MSTest、xUnit 或 NUnit 与 dotnet core 结合使用

TLDR 跳转到答案以获取有关工作 xUnit 或 MSTest 设置的详细信息 xUnit 是最不痛苦的选择我无法让 NUnit 在我的构建服务器上工作因此我尝试了 xUnit 和 MSTest 两者都对我不起作用 MSTest 我只
错误边界禁用交换机内部的路由

For 很长时间在遇到错误边界后我一直试图让路由在我们的应用程序中工作但直到今天我才发现看似与周围许多示例相同的代码有一个重要的区别路由被包裹在Switch 如果启用的话这个简单的更改足以阻止路由工作 Demo 采取以下片段如果我
是否可以从 npm 中下载的 .zip 文件从 git 存储库安装包？

我已经通过手动下载了存储库的主分支Download ZIPGitHub 上的按钮现在我的问题是是否可以从下载的 git 存储库安装包 npm 中的 zip 文件 Running npm install Pobrane lwip mas
通过子网掩码计算IP范围

如果我有一个子网掩码例如255 255 255 0和一个IP地址192 168 1 5 有没有一种简单的方法可以确定该子网内所有可能的IP地址在这种情况下 192 168 1 1 192 168 1 2 192 168 1 3 192
关于使用 Python xarray 将经度数组从 0 - 360 更改为 -180 到 180

我是一名 matlab 用户最近尝试更多地使用 Python 进行计算我正在使用 xarray 并希望将地球物理场的经度数组从 0 360 更改为 180 到 180 但是当我这样做时 df xr open dataset ecmwf
MemberExpression：InvalidOperationExpression 变量“x”从范围“”引用，但未定义

我在用着System Linq Expressions 我试图建立一个简单的Lambda表达式其中包括一个会员表达如果我使用 System Linq Expressions API 显式创建 MemberExpression 例如建立会员
ImagesLoaded 使用 Masonry，对象 #
没有方法 'imagesLoaded'
出现此错误尝试将 Masonry 与 imageLoaded 一起使用对象没有方法 imagesLoaded 必要脚本的链接位于我的标题中这是代码在页脚中的样子 document ready function

从 webview 获取带有路径和过期日期的 cookie

我目前有一个 webview 它在 onPageFinished 中获取 cookie mWebview WebView this findViewById R id myWebView mWebview setWebViewClient

x86 汇编中的操作数大小冲突？

我是一名新手程序员第一次尝试汇编如果这是一个非常蹩脚的问题请提前抱歉我在 EAX 寄存器中存储了一个字符但我需要将其移至 DL 寄存器当我尝试 mov dl eax 时出现错误 C2443 操作数大小冲突我知道 eax 寄存

Android NDK 工具链中的 LLVM 有什么用？

Android NDK 工具链中的 LLVM 有什么用稍微回顾一下我正在 Ubuntu 上使用 Gradlew 构建我的本机项目目标是 arm 和 x86 64 架构看来LLVM用于调用C C 编译器ARM Linux Androi

查看 C++ 中的编译器损坏名称

如何查看 C 中重载函数的编译器生成的损坏名称我正在使用 VC9 但也欢迎其他编译器的答案 Edit 我发现这里所有的答案都很有用接受我最喜欢的那个您可以使用以下命令查看修饰的函数名称依赖步行者在依赖项遍历器中打开任何 DLL EX

如何使用 MSTest 进行 RowTest？

我知道 MSTest 不支持RowTest和类似的测试 What do MSTests用户做什么没有了怎么可能活下去RowTest支持我见过DataDriven测试功能但听起来开销太大是否有任何 3rd 方补丁或工具可以让我这样做R

如何在 Python 中生成 Azure blob SAS URL？

我正在尝试使用以下命令动态生成 blob SAS URLazure storage blob包裹这个解决方案仅当您拥有现已弃用的azure storage包无法再安装我需要一种方法来模仿BlockBlobService generat

使用 emaildata 0.3.4 使用 Python 3.6 读取 .eml 文件

我正在使用 python 3 6 1 我想读取电子邮件文件 eml 进行处理我正在使用电子邮件数据 0 3 4包但是每当我尝试像文档中那样导入 Text 类时我都会收到模块错误 import email from email text
热门标签

I2C协议简介

再造STM32

系统日志

java 有限状态机

冻结表格

技术 Win32平台

弥尔曼定理

节点分析法

网孔分析法

电路等效转换

第7章指针

java 远程连接

深度视觉

php发送邮箱

人工蜂群算法

问答分享

深圳杯

RT

PL

js获取月份的天数

时间对象
Powered by Hwhale

使用 emaildata 0.3.4 使用 Python 3.6 读取 .eml 文件

使用 emaildata 0.3.4 使用 Python 3.6 读取 .eml 文件 的相关文章

随机推荐

热门标签

使用 emaildata 0.3.4 使用 Python 3.6 读取 .eml 文件的相关文章