如何使用 Estimator 在 sagemaker 中保存 model.tar.gz 文件

2024-01-01

我无法使用以下代码将模型工件保存在 S3 存储桶中。我成功地将结果保存在输出数据路径中，并且训练作业已成功完成。我正在使用下面的代码。

任何人都可以确认我们如何使用以下代码将 model_artifacts 保存在 model-dir 中。

# train.py code
#!/usr/bin/env python

from __future__ import print_function
import os
import sys
import pandas as pd

prefix = '/opt/ml/'

input_dir = prefix + 'input/data'
output_data_dir = os.path.join(prefix, 'output/data')
model_dir = os.path.join(prefix, 'model')

channel_name='training'
training_path = os.path.join(input_dir, channel_name)

# The function to execute the training.
def train():
    print('Starting the training.')
    # Take the set of files and read them all into a single pandas dataframe
    input_files = [ os.path.join(training_path, file) for file in os.listdir(training_path) ]
    raw_data = [ pd.read_csv(file, header=None) for file in input_files ]
    input_data = pd.concat(raw_data)
    
    print(pd.DataFrame(input_data))
    
    output_data = input_data.to_csv(os.path.join(output_data_dir, 'output.csv'), header=False, index=False)
    

if __name__ == '__main__':
    train()

# Below are the S3 input and output paths :
output_path = "s3://{}/{}".format(bucket, prefix_output)
S3_input = "s3://{}/{}".format(bucket, prefix)

#Estimator Code

test_estimator = sagemaker.estimator.Estimator(ecr_image,                                # ECR image arn,
                                          role=role,                                 # execution role
                                          instance_count=1,                     # no. of sagemaker instances
                                          instance_type='ml.m4.xlarge',         # instance type
                                          output_path=output_path,              # output path to store model outputs
                                          base_job_name='sagemaker-job1',       # job name prefix
                                          sagemaker_session=session             # session
                                         )

# Launch instance and start training
test_estimator.fit({'training':S3_input})

这段代码缺少什么？

Sagemaker 自动保存到output_path模型目录中的所有内容，因此其中的所有内容/opt/ml/model。如果训练作业成功完成，最后 Sagemaker 会获取该文件夹中的所有内容，创建一个model.tar.gz并上传到您的output_path在与训练作业同名的文件夹中（sagemaker 创建此文件夹）。您还可以使用环境变量SM_OUTPUT_DATA_DIR，默认情况下指向/opt/ml/output/data并放置非模型训练工件（例如评估结果），Sagemaker 将从名为output.tar.gz并将其上传到同一文件夹中model.tar.gz on S3.

我不明白你所说的“结果”是什么意思，但是无论你想把什么内容放入该档案中，都取决于你将其保存在你的model_dir。例如，我如何将模型保存在 json 和 H5 中，第一个将在output.tar.gz存档，后者在model.tar.gz

output_artifacts = os.environ.get('SM_OUTPUT_DATA_DIR')

with open(os.path.join(output_artifacts,"model.json"), "w") as json_file:
        json_file.write(model_json) 

model_directory = os.environ.get('SM_MODEL_DIR')
model.save(os.path.join(model_directory, 'model.h5'))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

amazonsagemaker

如何使用 Estimator 在 sagemaker 中保存 model.tar.gz 文件的相关文章

在 AWS Sagemaker 上安装 graphviz

我在使用 Python3 的 Jupyter 笔记本上尝试使用如下代码绘制一棵树 import xgboost as xgb from xgboost import plot tree plot tree model num trees 4
将 S3 数据加载到 AWS SageMaker Notebook 中

我刚刚开始尝试使用 AWS SageMaker 并希望将 S3 存储桶中的数据加载到我的 SageMaker python jupyter 笔记本中的 pandas 数据框中进行分析我可以使用 boto 从 S3 获取数据但我想知道是否
当我从 sagemaker 端点获得预测时，端点会做什么？

在 sagemaker 中文档讨论了需要具有 4 个特定函数的推理脚本当我们得到预测时 Python SDK 会向端点发送请求然后推理脚本运行但我找不到 SDK 中运行推理脚本的位置当我浏览 sdk 代码时Predictor pr
如何使用 dockerfile 在 aws sagemaker 中运行 python 文件

我有一个 python 代码和一个经过预先训练的模型并且有一个 model pkl 文件与我在代码所在的同一目录中现在我必须运行它或将其部署到 aws sagemaker 但没有得到任何解决方案由于aws sagemaker仅支持两个命
如何使用 AWS SageMaker Notebook 实例部署预训练模型？

我有一个预先训练的模型正在从 S3 存储桶加载到 AWS SageMaker 笔记本实例中并在提供用于从 S3 存储桶进行预测的测试图像后它会根据需要为我提供准确的结果我想部署它以便拥有一个端点可以进一步与 AWS Lambda
没有足够的权限访问 S3 中的数据

我正在关注以下教程入门控制台 Amazon Personalize https docs aws amazon com personalize latest dg getting started console htmlAmazon Sa
AWS SageMaker - 在本地训练但部署到 AWS？

我在使用 SageMaker 时面临以下挑战我已经下载了一本教程笔记本 https github com awslabs amazon sagemaker examples blob master sagemaker python sdk
在 AWS Sagemaker pytorch-1.10-cpu-py38 应用程序上使用 htop 出现段错误

我正在尝试在 Pytorch 1 10 Python 3 8 CPU 优化的 AWS Sagemaker 容器中启动 htop 命令这在我迄今为止使用过的其他图像中工作得很好但在这一个图像中该命令因段错误而失败 htop htop o
aws sagemaker模型训练中是否有某种持久的本地存储？

我用aws sagemaker做了一些实验从S3下载大数据集的时间是非常有问题的特别是当模型仍处于开发阶段并且你想要某种相对较快的初始反馈时是否有某种本地存储或其他方式来加快速度 EDIT我指的是批量训练服务它允许您以 Docke
AWS Sagemaker 自定义用户算法：如何利用额外实例

这是一个基本的 AWS Sagemaker 问题当我使用 Sagemaker 的内置算法之一进行训练时通过增加训练算法的 instance count 参数我能够利用将作业分配到许多实例所带来的巨大加速然而当我打包自己的自定义算法
使用对象检测算法进行 SageMaker 托管 Spot 训练

我正在尝试使用新的托管点训练功能从现有模型开始训练对象检测模型创建估计器时使用的参数如下 od model sagemaker estimator Estimator get image uri sagemaker Session bot
ValueError：未找到 SavedModel 包！尝试将 TF2.0 模型部署到 SageMaker 时

我正在尝试将 TF2 0 模型部署到 SageMaker 到目前为止我成功地训练了模型并将其保存到 S3 存储桶中但是当我调用 deploy 方法我从 cloudWatch 收到以下错误 ValueError no SavedMode
AWS SageMaker - 如何加载经过训练的 sklearn 模型以用于推理？

我正在尝试将使用 sklearn 训练的模型部署到端点并将其作为预测的 API 我只想使用 sagemaker 来部署和使用我序列化的服务器模型joblib 仅此而已我读过的每篇博客和 sagemaker python 文档都表明 sk
Sagemaker：如何在 Predictor 中设置 content_type（Sagemake > 2.0）？

请求帮助解决以下错误调用 InvokeEndpoint 时发生错误 ModelError 操作从模型收到客户端错误 415 和消息不支持内容类型应用程序八位字节流支持内容类型是文本 csv 文本 libsvm 这是相关代码 fr
我们可以在 CloudWatch 中为 Sagemaker 笔记本实例生成自定义日志吗？

CloudWatch 默认记录 Sagemaker 实例的日志例如内核启动内核关闭笔记本保存等不过我想列出一些自定义日志以及这些默认日志请看一下所附图片 Sagemaker 笔记本实例的默认日志在 CloudWatch 中的外观
借助 AWS SageMaker，是否可以使用 sagemaker SDK 部署预先训练的模型？

我试图避免将现有模型训练过程迁移到 SageMaker 并避免创建自定义 Docker 容器来托管我们训练过的模型我的希望是将我们现有的经过训练的模型注入到 AWS 通过以下方式提供的预构建的 scikit learn 容器中 sage
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
Sagemaker LDA 主题模型 - 如何访问训练模型的参数？还有一种简单的方法来捕捉连贯性吗

我是 Sagemaker 的新手正在运行一些测试来衡量 AWS 上的 NTM 和 LDA 与 LDA mallet 和本机 Gensim LDA 模型相比的性能我想检查 Sagemaker 上经过训练的模型并查看诸如哪些单词对每个主题
GPU 上的 AWS SageMaker [已关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在尝试在 AWS 上训练神经网络 Tensorflow 我有一些 AWS 积分据我了解 AWS
Amazon SageMaker 不支持的内容类型应用程序/x-image

我在 Sagemaker 中部署了基于 TensorFlow keras 的 CNN 模型现在为了调用推论我遵循了这个tutorial https aws amazon com blogs machine learning classi

随机推荐

Spacy - 保存自定义管道

我正在尝试集成自定义PhraseMatcher 将组件添加到我的 nlp 管道中这样我就可以加载自定义 Spacy 模型而无需在每次加载时将自定义组件重新添加到通用模型中如何加载包含自定义管道组件的 Spacy 模型我创建该组件将
我的 Xamarin Forms 应用程序因未知原因崩溃

Visual Studio 的输出窗口中显示以下消息执行本机代码时收到 SIGSEGV 这通常表示单声道运行时或应用程序使用的本机库之一中存在致命错误导航到包含以下内容的视图时应用程序崩溃ListView 这种情况仅第一次发生之后就没
使用 create-react-app 生成单个物理 javascript 文件

这可能是一个新手问题我使用 create react app 创建了一个小型的 ReactJS 应用程序并且我看到 Bundle js 文件正在从http localhost 3000 static js bundle js http
运算符<<必须只接受一个参数[重复]

这个问题在这里已经有答案了 a h include logic h class A friend ostream operator lt lt ostream A 逻辑 cpp include a h ostream logic opera
如何通过 API 从 Hipchat 获取某个房间的所有消息历史记录？

我当时用的是Hipchat API https github com hipchat hipchat rb v2 今天遇到了一个奇怪的问题我无法真正调出房间的所有历史记录例如当我查询特定日期时它似乎只会检索给定日期的一小部分历史记录
POST 请求的 HttpURLConnection App Engine Java 示例不起作用

我正在尝试在应用程序引擎应用程序下使用 urlfetch 执行 POST 请求我已按照从 App Engine 文档此处https developers google com appengine docs java urlfetch u
为什么即使 bean 是 @ViewScoped，@PostConstruct 回调每次都会触发？日本科学基金会

我在页面上使用数据表并使用绑定属性将其绑定到我的支持 bean 这是我的代码
将附加参数传递给 django 登录名和模板

我的应用程序使用 django contrib auth views login 中的 Django 登录视图以及我制作的自定义模板我想向我的模板传递一个附加参数它将以几种方式更改登录页面实际上我正在尝试根据 URL 显示不同的登录
如何在 ASP.NET Boilerplate 中使用 LDAP（免费启动模板）

我想使用 Boilerplate 的免费启动模板版本通过 Active Directory 将身份验证集成到我的 net Core 应用程序中我按照中的说明进行操作文档 https aspnetboilerplate com Pages
如何使用 PY4J 从 python 调用 java

我想用 Py4J 库从 python 调用 java from py4j java gateway import JavaGateway gateway JavaGateway connect to the JVM gateway jvm
覆盖 NPM 项目的“npm install”脚本

我有一个 NPM 项目当npm install正在运行我想运行自定义脚本我尝试在 package json 中使用它 scripts ng ng start ng serve install scripts install sh lt
安装grape依赖项时如何排除本地maven存储库

我想在我的项目中安装一些葡萄依赖项 grape install org codehaus groovy modules http builder http builder 0 6 如何排除从我的 Maven 本地存储库下载因为默认情况下它
阻止零件可拆卸

我想停下来Parts在 Eclipse RCP 4 中不可分离目前如果我右键单击Part我可以选择分离由此我可以关闭选项卡即使Part isn t Closeable 在 RCP 3 中当分离时View关闭后它会返回到原来的位置
Python 图像哈希

我目前正在尝试从 python 中的图像获取哈希值我已经成功完成了此操作并且它有效somewhat 但是我有这个问题 Image1 和 image2 最终具有相同的哈希值尽管它们不同我需要一种更准确和精确的散列形式图片1 Imag
如何在R中设置日期的默认语言

我用了别人写的R包在包中应该创建一个名为 Mar 12 的文件然而在我的系统中文件名是三月 12 因为我在中文操作系统 Windows 10 上运行它我已在 Rconsole 文件中将显示语言更改为英语但没有帮助我是想知道
Flask-WTForms 字段中的自定义参数

forms py my field TextField u Enter a number validators Required This Field is Required my form html table tr td form my
使用 jQuery 隐藏日期选择器

我正在使用 struts2 jquery 插件的 datepicker 如下
使用 Kerberos 进行身份验证时出现登录错误

我们面临着一个有趣的问题用户使用 Kerberos 身份验证登录到应用程序他们很少成功但突然他们面临用户登录信息被锁定的情况并且他们在屏幕上看到以下错误 Login error com ibm security krb5 KrbEx
对 PANDAS DataFrame“单元格”中的所有整数求和

我有一个 PANDAS DF 对象其中每个单元格都是元组列表 d seen A 4 B 4 C 3 A 1 C 4 unseen B 2 C 2 A 4 B 2 C 2 A 4 C 1 df pd DataFrame d df 这是结
如何使用 Estimator 在 sagemaker 中保存 model.tar.gz 文件

我无法使用以下代码将模型工件保存在 S3 存储桶中我成功地将结果保存在输出数据路径中并且训练作业已成功完成我正在使用下面的代码任何人都可以确认我们如何使用以下代码将 model artifacts 保存在 model dir 中 t

如何使用 Estimator 在 sagemaker 中保存 model.tar.gz 文件

如何使用 Estimator 在 sagemaker 中保存 model.tar.gz 文件 的相关文章

随机推荐

热门标签

如何使用 Estimator 在 sagemaker 中保存 model.tar.gz 文件的相关文章