pytorch部署新利器TorchServer

2023-11-02

pytorch的爬坑指南

排坑不易转载请注明出处！
参考文档 https://github.com/pytorch/serve
由于本地下载pytorch==1.7有问题【刚又瞅一眼现在是需要1.6？】，所以采用了docker部署

上干货：

1.docker版本不能太低，我装的19.03.13

2.下载项目文件

git clone https://github.com/pytorch/serve.git
cd serve/docker

3.构建docker image（cpu版本）

DOCKER_BUILDKIT=1 docker build --file Dockerfile -t torchserve:latest .

或者

docker pull pytorch/torchserve:latest

可用所有tags https://hub.docker.com/r/pytorch/torchserve/tags

4.将训练好的模型及环境打包

# 加载模型
checkpoint = torch.load(checkpoint_dir)
bertconfig = BertConfig(vocab_size=int(vocab_size), num_hidden_layers=3)
model = Bert_Sentiment_Analysis(config=bertconfig)
# 校验
model.eval()
# 加载参数
model.load_state_dict(checkpoint["model_state_dict"])
# model input sample
texts_tokens_ = torch.randint(0, 100, (1,127))
positional_enc = torch.randn((1, 127, 384), dtype=torch.float32)
# 打包并保存
traced_script_module = torch.jit.trace(model, (texts_tokens_, positional_enc))
traced_script_module.save("sentiment_test.pt")

5.完成handle.py文件对接torchServer

注意 preprocess方法接收的data[0].get(“data”)数据类型为bytes

# 模板
class ModelHandler(BaseHandler):
    """
    A custom model handler implementation.
    """

    def __init__(self):
        self._context = None
        self.initialized = False

    def initialize(self, context):
        """
        Initialize model. This will be called during model loading time
        :param context: Initial context contains model server system properties.
        :return:
        """
        self._context = context
        self.initialized = True
        properties = context.system_properties
        
        #  load the model
        self.manifest = context.manifest
        model_dir = properties.get("model_dir")
        self.device = torch.device("cuda:" + str(properties.get("gpu_id")) if torch.cuda.is_available() else "cpu")

        # Read model serialize/pt file
        serialized_file = self.manifest['model']['serializedFile']
        model_pt_path = os.path.join(model_dir, serialized_file)
        if not os.path.isfile(model_pt_path):
            raise RuntimeError("Missing the model.pt file")

        self.model = torch.jit.load(model_pt_path)
        self.model.to(self.device)
		
		...
		
        self.initialized = True

    def preprocess(self, data: list):
        """
        Transform raw input into model input data.
        :param batch: list of raw requests, should match batch size
        :return: list of preprocessed model input data
        """
        # Take the input data and make it inference ready
        text = data[0].get("data") or data[0].get("body")
        # 异常判断
        if text is None:
            warnings.warn("data params is none")
            raise Exception("no data")
        else:
	        text = text.decode()
        # 预处理, 获取batch
        ...

    def inference(self, texts_tokens_, positional_enc):
        """
        Internal inference methods
        :param model_input: transformed model input data
        :return: list of inference output in NDArray
        """
        # Do some inference call to engine here and return output
        predictions = self.model.forward(texts_tokens_, positional_enc)
		...

    def postprocess(self, inference_output):
        """
        Return inference result.
        :param inference_output: list of inference output
        :return: list of predict results
        """
        # Take output from network and post-process to desired format
        postprocess_output = inference_output
        return postprocess_output

    def handle(self, data, context):
        """
        Invoke by TorchServe for prediction request.
        Do pre-processing of data, prediction using model and postprocessing of prediciton output
        :param data: Input data for prediction
        :param context: Initial context contains model server system properties.
        :return: prediction output
        """
        self.preprocess(data)
        self.inference()
		self.postprocess(model_output)
		...


service = ModelHandler()

def handle(data, context):
    if not service.initialized:
        service.initialize(context)
    if data is None:
        return None
    return service.handle(data, context)

6.打包模型预测需要的文件

torch-model-archiver --model-name sentiment_test --version 1.0 --serialized-file /home/model-server/model-store/sentiment_test.pt \
--export-path /home/model-server/model-store \
--extra-files  /home/model-server/model-store/bert_word2idx.json \
--handler model_handler:handle -f

--model-name: 模型的名称，后来的接口名称和管理的模型名称都是这个
--serialized-file: 模型环境及代码及参数的打包文件
--export-path: 本次打包文件存放位置
--extra-files: handle.py中需要使用到的其他文件
--handler: 指定handler函数。（模型名:函数名）
-f 覆盖之前导出的同名打包文件

执行完会发现在/home/model-server/model-store目下多了一个以.mar结尾的文件，这个就是我们要在模型服务中使用的最终的打包文件

7.启动docker服务

将.mar文件放到宿主机的/home/model-server/model-store目录下

docker run --rm -it -p 3000:8080 -p 3001:8081 --name sentiment_test \
 -v /home/model-server/model-store:/home/model-server/model-store \
 torchserve:latest
# docker 可选参数 --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 \
# 切换到后台
ctrl + p

8.torchserver接口

8.1模型管理相关接口

# 注冊模型并为模型分配资源
curl -v -X POST "http://localhost:3001/models?initial_workers=1&synchronous=false&url=sentiment_test.mar&batch_size=8&max_batch_delay=200"

# 修改分配worker数量
curl -v -X PUT "http://localhost:3001/models/sentiment_test?min_worker=3"

# 查看指定模型当前状态
curl http://192.168.5.135:3001/models/sentiment_test

8.2模型预测接口（handler.py文件中的逻辑）

curl -X POST http://localhost:3000/predictions/sentiment_test -d "data=这也太难吃了把？再也不来了"

9.进入docker 镜像停止或运行程序

# 进入docker容器
docker exec -it [容器名称] /bin/bash

# 停止服务
torchserve --stop

# 启动服务
torchserve --start --ncs --model-store /home/model-server/model-store --models sentiment_test.mar

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

Docker

Pytorch

服务器

pytorch部署新利器TorchServer 的相关文章

Docker - 如何在 postgres 容器中运行 psql 命令？

我想在 postgres 映像中使用 psql 以便对数据库运行一些查询但不幸的是当我附加到 postgres 容器时我收到错误 psql 命令未找到对我来说如何在容器中运行 postgresql 查询或命令是一个谜如何在pos
Google Cloud Kubernetes 访问私有 Docker Hub 托管映像

是否可以将私有镜像从 Docker Hub 拉取到 Google Cloud Kubernetes 集群是否建议这样做或者我是否需要将我的私有映像也推送到 Google Cloud 我阅读了文档但没有发现任何内容可以清楚地解释这一点
docker run -e 的环境变量

这是我的 Dockerfile FROM ubuntu 16 04 RUN apt get update RUN apt get install y default jdk ADD sample docker 1 0 SNAPSHOT ja
无法使用 Django 应用程序从容器连接到 MySQL docker 容器

当我尝试从运行 Django 应用程序的 docker 容器连接到运行 MySQL 的容器时出现以下错误 django db utils OperationalError 2003 Can t connect to MySQL serve
从 Docker 容器发送多播数据包（到多播组）

我有一个通过 UDP 多播发送消息的应用程序我一直试图将其放在 docker 下我在尝试从 Docker 容器发送多播数据包时遇到了很大的阻力我已经能够通过 net host运行 docker 容器的选项然而我想坚持使用桥接配置
自动备份远程托管服务器的最佳实践

我正在尝试设置一个用于团队笔记的服务器我想知道自动备份其数据又称我的笔记的最佳方法是什么目前我计划在 docker 镜像中运行服务器 docker 镜像将由托管服务例如 Google 托管我找到了一个适合我的需求的免费托管服务
无法在jupyter笔记本中导入torch

系统 macOS 10 13 6 蟒蛇 3 7 蟒蛇3 我遇到麻烦时import torch在 jupyter 笔记本中 ModuleNotFoundError No module named torch 这是我安装 pytorch 的方法
docker build 如何知道 Dockerfile RUN 或 COPY 行是否可以使用缓存？

如果我的 Python 项目的 Dockerfile 如下所示 FROM python 3 7 Set env variables ENV PYTHONDONTWRITEBYTECODE 1 ENV PYTHONUNBUFFERED 1 S
带有 npm 启动脚本的 Nodejs 应用程序

我对nodejs很陌生在我的docker化环境中我想为nodejs应用程序提供appdynamics支持这要求每个应用程序都要求将以下内容作为其应用程序的第一行 require appdynamics profile controll
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
如何在“Docker for Windows”中启用docker远程API

I have 适用于 Windows 的 Docker 桌面1 12 1 stable 内部版本 7135 安装在我的 Windows 10 计算机上我想使用以下方式访问 docker远程API https docs docker com
docker 非 root 绑定安装权限，WITH --userns-remap

all 尝试让绑定安装权限正常工作我的目标是在容器中绑定安装卷以便 a 容器不以 root 用户身份运行入口点二 docker daemon 配置了 userns remap 这样容器主机上没有 root c 我可以绑定挂载和读写
在 docker 构建期间设置 DNS 选项

由于本地网络配置我必须将 dns 和 dns search 选项添加到我的 docker run 命令中如下所示 docker run dns XX XX 1 1 dns search companydomain t mycontain
如何使环境变量可用于 docker-compose 中的 Docker RUN 命令？

我有一个 Dockerized 应用程序我想在代理和非代理主机环境中运行我试图通过将普通环境变量例如 http proxy 复制到容器中当且仅当它们存在于主机中时来解决此问题我可以通过跑步完成 90 的任务 set grep i
诊断“功能主机未运行。”在码头工人

我正在尝试将几个基于 dotnet 的功能应用程序 v3 迁移到 docker 容器为此我们使用来自mcr microsoft com azure functions dotnet https hub docker com micros
Netstat不显示docker暴露的端口

因为某些原因netstat没有列出 docker 暴露的端口按照建议here https stackoverflow com questions 36454955 docker and netstat netstat is not sho
Bash 实例未嵌套在 Dockerfile `RUN` 中

嵌套 bash 实例会递增 SLVL 环境变量 http tldp org LDP abs html internalvariables html http tldp org LDP abs html internalvariables h
CUDA 与 DataParallel：为什么有区别？

我有一个简单的神经网络模型我应用cuda or DataParallel 在模型上如下所示 model torch nn DataParallel model cuda OR model model cuda 当我不使用 DataPara
每次我执行 docker compose up 时，Docker 都会创建一个新卷

我有一个 docker compose 文件可以启动多个服务我刚刚收到一条错误消息指出我的磁盘空间不足因此我输入 docker system df 并看到我有 21 个卷如果我有 3 个 docker 容器每个容器都附加一个卷
为什么 Docker 不支持多租户？

我看了这个关于 Docker 的 YouTube 视频 https www youtube com watch v vb7U 9AO7Ww22 00 演讲者 Docker 产品经理说道您可能会想 Docker 不支持多租户您是对的但

随机推荐

刷脸支付生物技术提升支付效率

移动支付具有数据营销服务功能移动支付免去了收找零等问题有完整的数据报表方便店铺管理人员对账单进行整理更重要的是可以收集海量消费者的消费数据对消费者进行人群画像特征消费习惯消费偏好等进行数据分析也有助于店铺经营者实现数字化营销
ToLua框架下C#与Lua代码的互调

本篇文章转自 https www jianshu com p f083bbaa048a 感谢作者的分享 Lua是目前国内使用最多的热更语言基于Lua的热更框架也非常多最近学习了一下ToLua的热更框架主要使用的问题在于C 和Lua之间
华为机试岛屿问题c语言代码,力扣(LeetCode)刷题，简单题(第13期)

目录力扣 LeetCode 定期刷题每期10道题业务繁重的同志可以看看我分享的思路不是最高效解决方案只求互相提升第1题字符的最短距离试题要求如下解答思路从左向右遍历记录上一个字符 C 出现的位置 prev 那么答案就是
软件测试原则的6个基本原则

文章目录 1 测试应基于客户需求 2 测试要尽早进行 3 穷尽测试是不可能的 4 遵循GoodEnough原则 5 测试缺陷要符合二八定理 6 避免缺陷免疫软件测试经过几十年的发展人们提出了很多测试的基本原则用于指导软件测试工作制
腾讯云DNSPod域名解析全面支持IPv6-only

自2016年6月1日起苹果要求所有提交App Store的iOS应用必须支持IPv6 only环境根据苹果开发者网站的声明大部分现有应用程序已经通过NSURLSession和CFNetwork APIs兼容该协议依然使用IPv4 A
个人关于模块化的理解

个人对于模块化的探索前一段时间我们前端的项目组有一个分兴趣小组的计划因为那时候整个小组只有9个人所以就分了三个小组分别是性能优化模块化新技术三个小组而我那进了模块化研究小组所以嘞研究模块化以及如何让项目的模块化更加
Cocos2dx-OpenGL ES2.0教程:初识MVP(3)

在上一篇文章中我在介绍vertex shader的时候挖了一个坑 CC MVPMatrix 它其实是一个uniform 每一个cocos2d x预定义的shader都包含有这个uniform 但是如果你在shader里面不使用这个变量的话
认识区块链，认知区块链— —区块链开发

区块链应用形态不同对应的开发技术也会略有不同比如中心化的钱包交易所 APP应用等等可以认为跟区块链关系不大完全可以采用互联网技术完成只有做一些真正贴合区块链概念特征的才会使用到对应的技术当然区块链中本身也没有新的技术都是些老
时序预测

作者简介热爱科研的Matlab仿真开发者修心和技术同步精进 matlab项目合作可私信个人主页 Matlab科研工作室个人信条格物致知内容介绍一种基于LSTM模型的股票预测方法和系统属于股票预测技术领域本发明技术方法通过搭
python笔记

1 函数的多个返回值 2 交换两个变量使用中间变量 c a a b b c 不用中间变量 a a b b a b a a b python专用用元组 a b b a 3 函数内部使用赋值语句修改参数不会修改外部的实参 4 函数内部调用
怎么通过通过 p 名称空间配置 bean以及怎么去引用/注入其它 bean 对象--ref和怎么去引用/注入内部 bean 对象-内部 bean 对象

前言本章是spring基于XML 配置bean系类中第2篇讲解怎么通过通过 p 名称空间配置 bean以及怎么去引用注入其它 bean 对象 ref和怎么去引用注入内部 bean 对象个人主页尘觉主页个人简介大家好我是尘觉
Fragment里面加一个轮播图

首先先在Fragment中加入banner
Eclipse中创建的新项目没src和JRE System Library

src JRE System Library 因为现有的JRE System Library不是适合的版本这时更改版本方法一项目右键 Build Path Configure Build path remove删去原有JRE Syst
adb connect不成功，提示由于目标计算机积极拒绝，无法连接。

在Windows的命令窗口敲命令 adb connect 192 168 2 X 连接Android电视adb的时候出现下面的错误提示 unable to connect to 192 168 2 X 5555 cannot connec
量化投资学习-2：股票与美女2-美女的类型

人生股票的起点差不多人生股票的终点差不多人生股票的过程却大相径庭你会选择哪个美女还是普通女还是丑女还是妖艳头牌大家闺秀美女还是网红美女几天的邂逅激情还是一段美好的旅程的还是天长地久关注的人多价格就高
GO基础知识总结

一 GO关键字25个引导程序整体结构8个关键字 package import const var func defer go return 声明复合数据结构的4个关键字 struct interface map chan 控制程序结构的1
log4cplus源码分析

1 引题虽然从本科起就学的C 然后在工作的2年时间中也不断的在用C 写代码虽然基本的语法和一些常用的库函数已经滚瓜烂熟可是总觉得自己写的代码还不是很专业特别是看到那些老外们写得代码从设计到编码风格再到各种编程技法的使用有很多都
opencv-python图像处理 ---图像轮廓检测与代码实现

一轮廓检测边缘检测虽然能够检测边缘但是其边缘并不是连续的图像轮廓用于检测一个整体来用于后续进行其他处理 opencv提供了两个函数来完成这些操作 findContours 该函数可以查找轮廓 drawContours 绘制轮廓轮
用keil的时候没有安装对应MCU的库，以STM32F103F为例

安装keil的时候没有用到这个芯片就没有安装对应的库重新安装之后遇到的几个坑打开keil显示没有这个型号解决方法是安装对应的库 STM32F103F要安装Keil STM32F1xx DFP 2 4 1 pack 安装完库之后点击O
pytorch部署新利器TorchServer

pytorch的爬坑指南排坑不易转载请注明出处参考文档 https github com pytorch serve 由于本地下载pytorch 1 7有问题刚又瞅一眼现在是需要1 6 所以采用了docker部署上干货 1 dock