手把手带你linux部署清华大学大模型最新版 chaglm2-6b

2023-11-05

准备工作：

# 下载项目源代码
git clone https://github.com/THUDM/ChatGLM2-6B
# 切换到项目根目录
cd ChatGLM2-6B
# 安装依赖
pip install -r requirements.txt
# 安装web依赖
pip install gradio

如果安装出现问题，可尝试手动分别安装torch
1 # 1第一步安装虚拟环境并激活环境

conda create -n ChatGLM2 python=3.10.6
conda activate ChatGLM2

2nvidia-smi查看cuda版本，12.0

在这里插入图片描述
3 安装torch第一种方式
pytorch官网：https://pytorch.org/

在这里插入图片描述

经过多次尝试，发现conda装，真的很快，真香。前几次尝试用pip装torch都会出现timeout的错误，这个跟服务器有关系，视情况而定。
在这里插入图片描述

# 安装依赖
pip install -r requirements.txt

在这里插入图片描述
二、准备工作。安装依赖包的同时，也可以先手动下载模型包：

1、工程文件准备
整个工程需要从两个远程仓库克隆，一个是 github 上的源码，一个是 HuggingFace 上的模型。

对于源码，由于总体积较小，因此可直接从网页下载 zip 包后解压，也可使用 git 命令（电脑需要提前装好 git ）克隆至本地文件夹中：

git clone https://github.com/THUDM/ChatGLM2-6B

对于模型，由于存在7个体积较大的 checkpoint 文件，若直接 clone 可能耗时过久或网络连接不够稳定，可以采用大、小文件分别下载的方式。其中大文件可从清华云手动下载，小文件主要为模型实现文件，数量不多且体积较小（算上 tokenizer.model 一共11个文件），可采用两种方式下载，一种是在 HuggingFace 页面手动一个一个下载，另一种是利用 GIT_LFS_SKIP_SMUDGE 参数跳过大文件一次性克隆整个工程（电脑需要提前装好 Git LFS）：

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm2-6b

最后再将前面手动下载好的大文件拷入替换，构成完整的模型。

需要注意的坑：

1）该命令在 powershell 中会报错，提示不认识 GIT_LFS_SKIP_SMUDGE 命令，放在 git bash 终端中则可顺利执行；

2）被该命令跳过的“大文件”不仅有 7 个 .bin 文件，还包括 1.02MB 的 tokenizer.model。

模型文件理论上可存放于任意位置，参考官方演示视频将其平行于源码文件夹，即整个工程文件的目录结构如下：

在这里插入图片描述

根据目录结构，修改源码目录下的 web_demo.py 文件，将两处 THUDM/chatglm2-6b 替换为 model ：

tokenizer = AutoTokenizer.from_pretrained("model", trust_remote_code=True)
model = AutoModel.from_pretrained("model", trust_remote_code=True).cuda()

在这里插入图片描述

如果想使用命令行与模型交互，则需要修改 cli_demo.py。web_demo2.py 同理。

三、运行模型
文件夹层面 cd 至web_demo.py文件夹，环境层面激活 chatglm2-6b，然后执行：

python web_demo.py

在这里插入图片描述
运行完之后就会弹出该页面：

需要注意的坑：

1）使用 web_demo 时不能开 VPN，否则会弹出 Expecting value: line 1 column 1 (char 0)错误；

2）如使用 web_demo2，则需要按官网提示额外安装 streamlit 和 streamlit-chat，且启动命令为

streamlit run web_demo2.py 。

四、体验
推理速度相比上一代有明显的提升，但性能提升感知不强。期待团队未来推出13B、30B、65B等更大规模的模型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

chaglm2

大模型

手把手带你linux部署清华大学大模型最新版 chaglm2-6b 的相关文章

Visual Studio 2022 常用快捷键，记录一下别忘记~

Visual Studio 2022 常用快捷键记录一下别忘记 Ctrl E C 注释代码 Ctrl E U 取消注释代码 Ctrl E D 格式化全部代码 Ctrl Shift A 新建类 Ctrl R G 删除无效Using Ctrl
RestTemplate的详解

引言在SpringCloud微服务中通过引入 ribbon实现了服务消费者的客户端负载均衡功能在这个过程中使用了一个非常有用的对象 RestTemplate 该对象会使用 Ribbon 的自动化配置同时通过配置 LoadBalanc
MATLAB 程序设计

文章目录前言一 M文件操作介绍 M文件的创建与打开 1 建立新的M文件 2 打开已有的文件 3 脚本文件的运行二输入输出语句 1 输入函数 input 2 输出函数 display和disp 3 格式化输出函数 fprintf 4

随机推荐

把单元格一分为二_excel如何把一个单元格分成两个 excel单元格拆分为二行

excel如何把一个单元格分成两个 excel单元格拆分为二行 excel助手今天为大家分享一篇干货知识如何设置excel单元格拆分为二行今天的分享角度是从工作中常用的角度谈的正如标题提到的 excel如何把一个单元格分成两个 ex
线性代数笔记 2 - 矩阵的初等变换

矩阵的初等变换初等行变换对换两行对换i j 两行记作 r i r j
abp web.mvc项目中的菜单加载机制

abp中的菜单加载机制在abp中菜单的定义与我们传统写的框架不一样它是在编写代码的时候配置而我们一般写的通用权限管理系统中是后期在后台界面中添加的这一点有很大不同 abp关于菜单的定义及管理挺复杂的与菜单相关的结构类接口及扩展
ArcGIS Server Linux 10.7压缩包

ArcGIS Server Linux 10 7压缩包链接 https pan baidu com s 1GYjElpbXZN0938 vWyWSOA 提取码 nkbp
分享一个去水印接口，完全免费，早点下手啊

上传到任意空间或者服务器访问即可用目前支持很多平台抖音快手皮皮虾西瓜红书微视最右哔哩哔哩皮皮搞笑等常见平台而且还是免费的该接口测试完全免费如果那天收费了大家可以直接放弃使用
linux下如何清理缓存

手头的路由本身内存就比较少上面又跑了一个nginx php的环境简直慢的爆炸 check的时候发现内存经常被占了很多 linux的虚拟内存机制很多时候回导致内存得不到及时释放有时候内存很少了 kill了很多进程但是内存还是没有释放
React_井字棋

该项目是跟着react官网写的由于是初学就只用来记录自己的代码如果和我一样是初学react建议看官网 react import React from react import ReactDOM from react dom clien
C++的范围for语句详解附易错实例

博客内容 C 读取一行内个数不定的整数的方式作者陈大大陈个人简介一个正在努力学技术的准前端专注基础和实战分享欢迎私信欢迎大家这里是CSDN 我总结知识和写笔记的地方喜欢的话请三连有问题请私信范围for语句是C 引入的
深度学习做分类时出现list index out of range解决办法之一

error list index out of range 索引出了问题首先检查一下自己的数组索引是不是真的有问题如果没问题就是自己读入的文件里包含不能识别的字符比如空格参考 https blog csdn net weixin 3
Ubuntu 12.04 下安装ncurses-devel

解决Ubuntu 12 04 使用 make menuconfig 配置Linux 内核时出现缺少 ncurses devel 库支持 Unable to find the ncurses libraries or the require
Instrusive 【HDU - 5040】【2014 北京 BFS】

题目链接一道有着很多需要细节的地方需要注意的题挺不错的这题的数据也是给的很好然后讲一下题意吧题意有一个N N的网格有起点M和终点T 我们从起点需要走到终点每一步需要花费的时间是单位一但是呢我们不能被摄影机拍摄到摄影机是
halcon21.11安装教程详解

文章目录 1 软件下载 2 安装过程 halcon21 11安装教程详解 1 软件下载 a 官网 https www mvtec com cn b 百度网盘下载链接 https pan baidu com s 1 Bdz1l54PQWxb
Pycharm-Python 下载安装第三方库

Pycharm Python 下载安装第三方库一安装第三方库 00 新建项目 02 两种安装方式通过代码提示安装 pip install 安装二小结最近我使用 pip install 安装第三方库时出现了一些问题不知道为什么
nvidia自动更新带来的问题

实验室的ubuntu 14 04 lts server 上的gpu突然不能用了使用 nvidia smi 查看gpu信息时显示 Failed to initialize NVML GPU access blocked by the ope
leetcode 54. 螺旋矩阵 python

题目描述题解 1 逆时针的遍历顺序为右下左上定义一个directions的list 分别对应这四个方向如果当前方向的下一个位置到达matrix边界或者已经被访问过则变换为下一个方向 2 定义一个和输入matrix大小相同的f
scala学习-Description Resource Path Location Type value toDF is not a member of org.apache.spark.rdd.R

编译如下代码时出现value toDF is not a member of org apache Spark rdd RDD People 错误 val rdd RDD People sparkSession sparkContext
单例模式详解----懒汉式/饿汉式（C++实现）

单例模式单例模式是一种常用的软件设计模式它的核心结构中只包含一个被称为单例的特殊类通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问从而方便对实例个数的控制并节约系统资源如果希望在系统中某个类的对象只能存在一个单
强化学习算法回顾 Q-learning 玩 OpenAI 的 Taxi 游戏

这里使用的是 OpenAI Taxi V3 环境这里有 4 个地点分别用 4 个字母表示任务是要从一个地点接上乘客送到另外 3 个中的一个放下乘客越快越好成功运送一个客人获得 20 分奖励每走一步损失 1 分希望尽快送到目的
JVM内存泄露与溢出

内存泄漏和内存溢出内存泄露申请的内存空间没有被正确释放导致内存空间被占用并且之后也不会使用内存溢出申请的内存空间超过了空闲内存空间即内存不够使用所以说内存泄漏可能会导致内存溢出我们需要注意有可能会导致内存泄漏的情况常见
手把手带你linux部署清华大学大模型最新版 chaglm2-6b

准备工作下载项目源代码 git clone https github com THUDM ChatGLM2 6B 切换到项目根目录 cd ChatGLM2 6B 安装依赖 pip install r requirements txt 安装

手把手带你linux部署清华大学大模型最新版 chaglm2-6b

2nvidia-smi查看cuda版本，12.0

手把手带你linux部署清华大学大模型最新版 chaglm2-6b 的相关文章

随机推荐

热门标签