如何使用python将文件以块的形式传输到azure blob存储而不写入文件

2023-12-10

我需要将文件从 google 云存储传输到 azure blob 存储。

谷歌提供了一个代码片段来将文件下载到字节变量，如下所示：

# Get Payload Data
req = client.objects().get_media(
        bucket=bucket_name,
        object=object_name,
        generation=generation)    # optional
# The BytesIO object may be replaced with any io.Base instance.
fh = io.BytesIO()
downloader = MediaIoBaseDownload(fh, req, chunksize=1024*1024)
done = False
while not done:
    status, done = downloader.next_chunk()
    if status:
        print 'Download %d%%.' % int(status.progress() * 100)
    print 'Download Complete!'
print fh.getvalue()

我可以通过更改 fh 对象类型来修改它以存储到文件，如下所示：

fh = open(object_name, 'wb')

然后我可以使用上传到azure blob存储blob_service.put_block_blob_from_path.

我想避免在进行传输时写入机器上的本地文件。

我收集了 Google 的代码片段，一次将数据加载到 io.BytesIO() 对象中。我认为我应该使用它一次向 blob 存储写入一个块。

我尝试将整个内容读入内存，然后使用上传put_block_blob_from_bytes，但我遇到内存错误（文件可能太大（~600MB）。

有什么建议么？

根据源代码blobservice.py用于 Azure 存储 and BlobReader适用于谷歌云存储，您可以尝试使用Azure功能blobservice.put_block_blob_from_file从 GCS 类写入流blobreader有这个功能read作为流，请参见下文。

所以参考代码https://cloud.google.com/appengine/docs/python/blobstore/#Python_Using_BlobReader，您可以尝试按如下方式执行此操作。

from google.appengine.ext import blobstore
from azure.storage.blob import BlobService

blob_key = ...
blob_reader = blobstore.BlobReader(blob_key)

blob_service = BlobService(account_name, account_key)
container_name = ...
blob_name = ...
blobservice.put_block_blob_from_file(container_name, blob_name, blob_reader)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Azure

googlecloudstorage

azureblobstorage

如何使用python将文件以块的形式传输到azure blob存储而不写入文件的相关文章

Pandas apply 与 np.vectorize 从现有列创建新列的性能

我正在使用 Pandas 数据框并希望创建一个新列作为现有列的函数我还没有看到关于之间速度差异的很好的讨论df apply and np vectorize 所以我想我会在这里问熊猫apply 功能很慢根据我的测量在一些实验中如下
DataFrame 在函数内部修改

我面临一个我以前从未观察到的函数内数据帧修改的问题有没有一种方法可以处理这个问题以便初始数据帧不被修改 def test df df tt np nan return df dff pd DataFrame data 现在当我打印时d
Python 在 chroot 中运行时出现错误

我尝试在 chroot 中运行一些 Python 程序但出现以下错误 Could not find platform independent libraries
子进程改变目录

我想在子目录超级目录中执行脚本我需要首先进入该子目录超级目录我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
Scikit-learn 的内核 PCA：如何在 KPCA 中实现各向异性高斯内核或任何其他自定义内核？

我目前正在使用Scikit learn 的 KPCA https scikit learn org stable modules generated sklearn decomposition KernelPCA html对我的数据集执行降
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
Pyspark 数据框逐行空列列表

我有一个 Spark 数据框我想创建一个新列其中包含每行中具有 null 的列名称例如原始数据框是 col 1 col 2 col 3 62 45 null 62 49 56 45 null null null null null
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
str.translate 给出 TypeError - Translate 采用一个参数（给定 2 个参数），在 Python 2 中工作

我有以下代码 import nltk os json csv string cPickle from scipy stats import scoreatpercentile lmtzr nltk stem wordnet WordNetL
一行Python和SQLite代码，为什么需要加“，”？ [复制]

这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
Matplotlib 图例不工作

自从升级 matplotlib 以来每当尝试创建图例时我都会收到以下错误 usr lib pymodules python2 7 matplotlib legend py 610 UserWarning Legend does not
pip 安装软件包两次

不幸的是我无法重现它但我们已经见过几次了 pip 将一个软件包安装两次如果卸载第一个第二个就会可见并且也可以被卸载我的问题如果一个包安装了两次如何用 python 检查背景我想编写一个测试来检查这一点 devOp Updat
参数验证，Python 中的最佳实践[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案让我们举一个 API 的例子 def get abs directory self path if os path isdir path ret
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
Spark中的count和collect函数抛出IllegalArgumentException

当我使用时抛出此异常时我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效我试图搜索这个问题但没有找到原因看来RDD的分区有问题有任何想法吗先感谢您 sc stop sc Spark
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
为我的 Azure 功能选择哪个计划：消费计划还是应用服务计划？

我们创建了一个 blob 触发的 azure 函数来处理放置在 blob 存储中的文件该 blob 上的负载将不一致例如在几个小时内每分钟都会有数百甚至数千个文件被放置在该 blob 中另一方面有几个小时我们甚至找不到一个文件
从 pandas 数据框中绘制堆积条形图

我有数据框 payout df head 10 复制以下 Excel 绘图的最简单最智能和最快的方法是什么我尝试过不同的方法但无法让一切都到位 Thanks 如果您只想要一个堆积条形图那么一种方法是使用循环来绘制数据框中的每一列并

随机推荐

GoogleMaps MapView 在 Android 中点击时崩溃？

我目前正在编写一个显示 MapView 的应用程序其中显示谷歌地图我使用了你好地图视图教程http developer android com resources tutorials views hello mapview html
如何在Android中询问相机的运行时权限，运行时存储权限

我正在开发一个应用程序只需单击按钮即可扫描条形码并且它在 Lollipop 版本上运行良好当我来到棉花糖时它就停止工作了这是错误 camerabase 连接到相机 0 时发生错误它迫使我通过以下方式打开权限设置 gt 应用程序
在 InterfaceBuilder 中调整 NavigationController 的大小

这可能是一个愚蠢的问题但是有没有办法调整故事板中导航控制器的大小它只是占用了太多的屏幕空间我的大多数视图都是大小合适的弹出窗口但旁边有一个巨大的 iPad 大小的导航控制器这纯粹是为了 Interface Builder 中的视觉
java.sql.Timestamp 时区是否特定？

我必须将 UTC 日期时间存储在数据库中我已将特定时区中给出的日期时间转换为 UTC 为此我遵循了以下代码我输入的日期时间是 20121225 10 00 00 Z 时区是亚洲加尔各答我的服务器数据库 oracle 在同一时区
如何在Python字符串中包含反斜杠和引号[重复]

这个问题在这里已经有答案了我有一系列特殊字符看起来像这样 specialCharList lt gt 问题是我想包含和字符但不能包含因为它们用于字符串和转义我该如何加入这些角色反斜杠字符用于转义具有特殊含义的字符例如换
违反德米特定律的搜索工具？ [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案有人知道我可以在 C 应用程序中使用一个工具来查找可能违反德米特法则的情况吗我知道它会产生很多误报但我认为它仍然有用尤其是在早期设计过程中如果你只是在寻找something
从 Spark-Scala UDF 返回 Seq[Row]

我正在使用 Spark 和 Scala 来进行一些数据处理我将 XML 数据映射到数据帧我将 Row 作为参数传递给 UDF 并尝试将两个复杂类型对象提取为列表 Spark 给我以下错误线程 main 中的异常 java lang U
IBM Cloud Watson Assistant：如何获取工作区的 ID

我使用 IBM Cloud Watson Assistant 制作了一个聊天机器人我需要在我的 Android 应用程序中使用它这是我的config xml code
错误：supportsScrollBehavior 未声明为可配置

我正在尝试监视一个函数supportsScrollBehavior有角的platform服务如下 import as platform from angular cdk platform describe Supporting Scroll
Node JS mysql 数据库断开连接

我正在使用 Node JS 并尝试连接到 mysql 数据库由于超时它不断断开连接因此我编写了一个函数以便在超时时重新连接尽管我需要它成为连续连接否则我的代码中的引用将不起作用这是我的相关代码 var mysql requir
为 XmlObject 提供参数 SchemaType

我有一个像这样的课程 public class CreditCardDocumentImpl extends org apache xmlbeans impl values XmlComplexContentImpl implements
React Native KeyboardAvoidingView 无法正常工作

我正在尝试使用带有行为 padding 的KeyboardAvoidingView 当我尝试在 TextInput 中输入任何文本时 TextInput 字段不会向上移动我最后添加了一个正在向上移动的小视图但它上面的视图我还有带有偏移
UITableView 中 2 种不同类型的自定义 UITableViewCells

在我的 UITableView 中我想为 rss feed 的第一个新闻设置一个自定义 tableViewCell 可以说是类型 A 并为第二个第三个等其他新闻设置一个自定义 tableViewCell trype B 问题是自定义 t
如何在 Angular 2 中调用标头组件函数到另一个组件？

我想打电话showmodel displayType 从另一个组件如何调用另一个组件的头组件函数标头组件 ts import Component Renderer from angular core import Title DOCU
VS2008 安装项目：共享（所有用户）应用程序数据文件？

类人猿同胞睡莲叶和水轮我正在使用 VS 2008 在 C NET WPF 中开发 Windows 桌面应用程序该应用程序需要在 Vista 和 XP 计算机上安装和运行我正在开发一个安装 Windows 安装程序项目来安装该应用程序
使用 GAC 的优点和缺点是什么？

除此之外是否存在必须使用全局程序集缓存或不能使用它的情况从 GAC 加载程序集意味着更少的开销和安全性您的应用程序将始终加载正确版本的 NET 库您不应该生成 GAC 之外的程序集因为几乎不会获得任何性能提升在许多情况下甚至会损
C# 网格绑定不更新

我有一个绑定到集合的网格由于某种我不知道的原因现在当我在网格中执行某些操作时网格不会更新情况当我单击网格中的按钮时它会增加同一行中的值当我单击时我可以调试并查看值增量但网格中的值不会改变 BUT当我单击按钮最小化并恢复窗
LINQ to Entities 仅支持无参数构造函数和初始值设定项

我在这个 linq 表达式中遇到此错误 var naleznosci from nalTmp in db Naleznosci where nalTmp idDziecko idDziec select new Payments nalTm
QScopedPointers 的 QList

我正在尝试将 QScopedPointers 存储在 QList 中我发现了这个评论还可以使用 QList gt 库巴奥伯 2014 年 1 月 14 日 18 17 对此答案的第一条评论 https stackoverflow co
如何使用python将文件以块的形式传输到azure blob存储而不写入文件

我需要将文件从 google 云存储传输到 azure blob 存储谷歌提供了一个代码片段来将文件下载到字节变量如下所示 Get Payload Data req client objects get media bucket buc

如何使用python将文件以块的形式传输到azure blob存储而不写入文件

如何使用python将文件以块的形式传输到azure blob存储而不写入文件 的相关文章

随机推荐

热门标签

如何使用python将文件以块的形式传输到azure blob存储而不写入文件的相关文章