从 s3 读取文件时 joblib.load 出错

2024-03-17

当尝试从 s3 读取文件时joblib.load()我收到错误ValueError: embedded null byte当尝试读取文件时。

这些文件是由 joblib 创建的，并且可以从本地副本（在上传到 s3 之前在本地制作）成功加载，因此错误可能出在 S3 的存储和检索协议中。

最小代码：

####Imports (AWS credentials assumed)
import boto3
from sklearn.externals import joblib


s3 = boto3.resource('s3')
bucket_str = "my-aws-bucket"
bucket_key = "some-pseudo/folder-set/my-filename.joblib"
joblib.loads(s3.Bucket(bucket_str).Object(bucket_key).get()['Body'].read())

以下代码在输入之前在内存中重建文件的本地副本joblib.load()，从而实现成功加载。

from io import BytesIO
import boto3
from sklearn.externals import joblib

s3 = boto3.resource('s3')
bucket_str = "my-aws-bucket"
bucket_key = "some-pseudo/folder-set/my-filename.joblib"
with BytesIO() as data:
    s3.Bucket(bucket_str).download_fileobj(bucket_key, data)
    data.seek(0)    # move back to the beginning after writing
    df = joblib.load(data)

我假设，但不确定，boto3 分块下载文件的方式中的某些内容会创建一个破坏 joblib 的空字节，并且 BytesIO 在让joblib.load()查看数据流。

附言。在这种方法中，文件永远不会接触本地磁盘，这在某些情况下很有用（例如，具有大 RAM 但磁盘空间很小的节点......）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

amazons3

boto3

从 s3 读取文件时 joblib.load 出错的相关文章

Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何在 python 3.x 中使用 string.replace()

The string replace 在 python 3 x 上已弃用这样做的新方法是什么与 2 x 一样使用str replace https docs python org library stdtypes html str r
Python 3.6.1 安装位置

我在 Ubuntu 16 服务器上安装了 Python 3 6 1 但找不到安装位置我查看了 usr bin 其中提到了除 3 6 1 之外的所有其他版本在哪里可以找到该版本的可执行文件使用命令 whereis python3 6 1
ASCII - Asciimatics - 如何在代码中实现效果/屏幕

几篇文章之前有人建议我研究一下 Python 的 Asciimatics 库我正在尝试使用以下方法来解决它样品 https github com peterbrittain asciimatics tree master sample
sklearn ShuffleSplit 出现“__init__() 获得参数 'n_splits' 的多个值”错误

我正进入状态 init 获得参数 n splits 的多个值该行的错误 cv ShuffleSplit n splits 10 test size 0 2 random state 0 在下面的代码中 import matplotlib
Python 3 列表列表中的列表理解以转换类型

考虑以下列表 list1 1 1 1 2 1 3 2 1 2 2 2 3 要理解字符串列表并将其转换为浮点数可以使用 list1 0 float i for i in list1 0 但我尝试理解浮点数列表的列表并没有完全起作用 list
CNAME 速度慢吗？

我将 CNAME 与 S3 CloudFront 一起使用来提供一些静态文件例如 js css 图像等我这样做是为了使存储桶的 URL 更漂亮因为我认为最好将所有内容都定位到我的网站以防万一将来我想移动这些文件更改应该是透明的今
PHP Amazon SDK，S3 存储桶访问被拒绝

我第一次尝试使用 PHP AWS SDK aws aws sdk php 3 19 来使用 S3 我创建了一个存储桶 myfirstbucket jeremyc 我制定了一项政策 Version 2012 10 17 Statement E
Flask-migrate：更改模型属性并重命名相应的数据库列

我对 Flask 有一些经验但对数据库 Flask migrate alembic SqlAlchemy 不太了解我正在跟进this https blog miguelgrinberg com post the flask mega t
占据花车的地板

我发现了两种在 Python 中占据发言权的方法 3 1415 1 and import math math floor 3 1415 第一种方法的问题是它返回一个浮点数即3 0 第二种方法感觉很笨拙而且太长在 Python 中是否有替
如何使用 Docker 和 DigitalOcean Spaces 部署 TensorFlow Serving

如何配置 TensorFlow Serving 以使用存储在 DigitalOcean Spaces 中的文件重要的是解决方案提供对这两个配置的访问and模型文件提供对数据的非公开访问我已经配置了一个名为your bucket na
导入错误：无法导入名称“FFProbe”

我无法获取ffprobe包 https github com simonh10 ffprobe在 Python 3 6 中工作我使用 pip 安装它但是当我输入import ffprobe it says Traceback most
multiprocessing.Queue 中的 ctx 参数

我正在尝试使用 multiprocessing Queue 模块中的队列实施 https docs python org 3 4 library multiprocessing html exchang objects Between p
如何同时使用不和谐机器人命令和事件？

我需要制作一个机器人来监听服务器中写入的消息同时接受命令 Create the Discord client client discord Client client commands Bot command prefix client
Flask-Admin 具有多对多关系中的附加字段

我有两个表产品成分和产品成分 class ProductIngredient db Model tablename product ingredient id db Column db Integer primary key Tru
加载pickle时出错

无法加载 pickle 文件我正在使用 python 3 5 import pickle data pickle load open D ud120 projects final project final project dataset
无效的选择器：使用 Selenium 时不允许出现复合类名错误

我正在尝试通过 Web Whatsapp 打印聊天中的一条消息我可以通过控制台选项卡中的 Javascript 来完成此操作我就是这样做的 recived msg document getElementsByClassName XE
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
delphi THashSHA2 在大文件上返回错误的 SHA256

Data Cloud CloudAPI pas has class function TCloudSHA256Authentication GetStreamToHashSHA256Hex const Content TStream str
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac

随机推荐

\r 和 \n 之间的区别

有什么区别 r and n在正则表达式中有人可以用例子解释一下吗 r是回车 CR ASCII 字符 13 n是换行 LF ASCII 字符 10 过去每行末尾都有两个 ASCII 字符来告诉打印机要做什么 CR 会告诉打印机返回到纸
在 Eclipse 中更改 Tomcat 服务器的超时

当我尝试运行 Tomcat 时我收到一条消息 Server Tomcat v6 0 Server at localhost was unable to start within 45 seconds If the server requi
如何在 JavaScript 中捕获“History.Back”事件？

是否可以在 JavaScript 中捕获 History Back 事件我想抓住history back 事件和注销用户 P s 有一些关于禁用的代码history back 但对我来说没有用然后设置onunload event 您可以
使 jqGrid 在网络浏览器上响应的方法

我是 jqGrid 的新手我需要在调整网络浏览器窗口大小时调整网格大小我已经申请autowidth true shrinkToFit true 在网格中但这不起作用 CSS的设定width 100 是唯一的一种实现但对于 jqGri
Android：TextInputLayout 总是从顶部留出一些空间

我有这样的布局
PHP 在字符串中搜索电子邮件地址

您好我正在尝试搜索一个字符串以查看它是否包含电子邮件地址然后返回它典型的电子邮件验证器表达式是 eregi a z0 9 a z0 9 a z0 9 a z0 9 a z 2 3 email 但是如果它在字符串中我将如何搜索例如
OpenCart .twig 文件未显示更改

我一直在尝试更改product catalog twig 文件以删除一些不必要的按钮例如添加到愿望清单和比较产品选项这些按钮对于我尝试创建的商店来说毫无用处在主题编辑器上我已从 twig 文件中删除了两个按钮但更改并未显
通过链接打开 Android 应用程序

我正在尝试创建一个可以通过电子邮件发送的链接当在 Android 设备上打开我的应用程序时如果设备上没有该应用程序它将前往 Google 商店并搜索该应用程序你可以这样做在清单中创建一个过滤器来处理某些 URL 例如
Nodemailer 不会向 Outlook.office365 帐户发送电子邮件

我正在尝试从 gmail 帐户发送电子邮件到接收者即我的大学电子邮件 Outlook office365 它适用于gmail到gmail gmail到outlook live gmail到yahoo import as nodemaile
从资产颤振中打开pdf文件

我正在尝试使用 flutter fullpdfview 1 0 12 打开 PDF 文件我的 PDF 文件位于 asset 文件夹下但不知何故我收到错误无法找到文件我尝试了几个选项但没有一个有效并且都返回相同的错误以下是我尝试
为什么这个猪拉丁词转换代码不起作用

Pig 拉丁语单词转换 include
如何使用 MVC RAZOR 将 DataTable 绑定到 DropDownList？

我的模型返回数据表的集合如下所示如何使用 MVC RAZOR 将 DataTable 绑定到 DropDownList 对于每个数据表我想为其创建一个表行和一个下拉列表我尝试了下面的代码 foreach DataTable data
QHash存储大量数据

我有 10 000 000 个 struct int int int int 类型的条目当我使用它们存储时QHash http doc qt io qt 5 qhash html or QMap http doc qt io qt 5 q
使用 Dojo 设置元素的值/文本

我正在开发一个秒表应用程序试图学习 Dojo Toolkit 因此首先我需要将小时分钟秒和毫秒设置为 0 I tried dojo byId hours value 00 还尝试过 domAttr set hours 00 它不起
使用 webpack 编译 less

我想添加一个非常基本的 less 文件到我的project https github com pbrianmackey uiexperiment在 github 上参见这次提交 https github com pbrianmackey
如何使用expressJS提供ReactJS静态文件？

问题我已成功提供 React 应用程序的 index html 文件但是index js取代
从存在缺失值的现有列创建新列

我正在尝试根据这两列创建一个新列假设我想创建一个新列 z 当 y 不丢失时它应该是 y 的值当 y 确实丢失时它应该是 x 的值所以在这种情况下我期望 z 是 1 8 10 8 x y 0 1 NaN 1 2 8 2 4 10
Sympy：化简平方根

Sympy 似乎无法简化涉及变量平方的平方根的表达式 In 28 a x 2 In 29 b a 1 2 In 30 b Out 30 0 5 2 x In 31 b simplify Out 31 0 5 2 x 我无法将此与其他变体一起
使用 PHP 7.2.4 的 Ubuntu 16.04 上缺少 PDO 驱动程序

我想在Kubuntu 16 04上尝试最新版本的PHP 从那时起我似乎无法将pdo与mysql一起使用当我启动 php 时出现以下警告 PHP Warning PHP Startup Unable to load dynamic li
从 s3 读取文件时 joblib.load 出错

当尝试从 s3 读取文件时joblib load 我收到错误ValueError embedded null byte当尝试读取文件时这些文件是由 joblib 创建的并且可以从本地副本在上传到 s3 之前在本地制作成功加载因此错

从 s3 读取文件时 joblib.load 出错

从 s3 读取文件时 joblib.load 出错 的相关文章

随机推荐

热门标签

从 s3 读取文件时 joblib.load 出错的相关文章