ChatGLM-6B本地cpu部署

2023-05-16

ChatGLM-6B是清华团队研发的机器人对话系统，类似ChatGPT，但是实际相差很多，可以当作一个简单的ChatGPT。

ChatGLM部署默认是支持GPU加速，内存需要32G以上。普通的机器无法运行。但是可以部署本地cpu版本。

本地部署，需要的环境：

python3.9及以上
gcc

这个框架本身就是python编写的，所以需要python环境。另外，运行的时候，需要加载cpu内核，所以需要编译本地内核，gcc环境就是用来编译quantization_kernels.c和quantization_kernels_parallel.c文件的。

gcc环境在windows上，可以通过mingw来安装，也可以通过tdm-gcc来安装。

我本地的相关环境：

1、克隆源码

git clone https://github.com/THUDM/ChatGLM-6B

2、安装依赖

cd ChatGLM-6B
pip install -r requirements.txt

3、改变源码web_demo.py支持cpu

默认代码：

修改支持cpu:

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b-int4", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b-int4", trust_remote_code=True).float()
model = model.eval()

模型的名字由THUDM/chatglm-6b改为THUDM/chatglm-6b-int4

gpu模型源码中.half().cuda()替换为.float()

4、运行python web_demo.py

python web_demo.py

模型第一次加载会去https://huggingface.co/THUDM/chatglm-6b-int4下载pytorch_model.bin模型文件。

还会使用安装的gcc编译quantization_kernels.c和quantization_kernels_parallel.c文件，生成动态库quantization_kernels.so和quantization_kernels_parallel.so。

5、运行成功，会打开浏览器，并直接显示对话框，可以输入问题，不过这个回答很慢：

提出问题，并不是秒回，很慢，感觉还是内存的问题，我的机器16G内存，效果好像也不是很好。

几个抽风的问题：

1、我昨天在电脑上运行好好的，结果今天来测试，直接运行python web_demo.py就报了这样的错误：504 Server Error: Gateway Time-out for url: https://huggingface.co/api/models/THUDM/chatglm-6b

这个错误有点蛋疼，貌似是去下载模型文件，但是远程地址不知道为什么就504了，好在这些模型可以通过加载本地缓存的模型，解决办法就是手动下载这些模型文件到一个指定目录。

https://huggingface.co/THUDM/chatglm-6b-int4/tree/main ，把这里的文件，包括json文件全部下载到项目路径下的models目录中：

改动web_demo.py文件内容：

tokenizer = AutoTokenizer.from_pretrained("./models", trust_remote_code=True)
model = AutoModel.from_pretrained("./models", trust_remote_code=True).float()
model = model.eval()

2、找不到模块transformers_modules，如下所示：

我昨天运行好好的，也就是说这个模块肯定是有的，不知道今天抽什么风，竟然没有，解决办法就是把当前transformers=4.27.1版本降级到4.26.1：

最后再来感受一下chatglm对话：

这个结果全部显示完，用了差不多10分钟，哈哈，挤牙膏似的。

完。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGLM

CPU

ChatGLM-6B本地cpu部署的相关文章

AndroidStudio生成aar包和如何使用aar包

我用的是android studio 2 0正式版 1 简介 aar包是Android studio下打包android工程中src res lib后生成的aar文件 xff0c aar包导入其他android studio 工程后 xff

随机推荐

C++智能指针详解：shared_ptr

C 43 43 没有内存回收机制 xff0c 每次程序员new出来的对象需要手动delete xff0c 流程复杂时可能会漏掉delete xff0c 导致内存泄漏于是C 43 43 引入智能指针 xff0c 可用于动态资源管理 xff0
C++算法题：关于树的算法

问题1 xff1a 输入一棵二元查找树 xff0c 将该二元查找树转换成一个排序的双向链表要求不能创建任何新的结点 xff0c 只调整指针的指向什么是二元查找树 xff1f 比如 xff1a 转换成双向链表的顺序是 xff1a 1 3
C++算法题：递归和栈的算法

问题1 xff1a 跳台阶问题具体描述 xff0c 一个台阶总共有n级 xff0c 如果一次可以跳1级 xff0c 也可以跳2级求总共有多少总跳法 xff0c 并分析算法的时间杂度相当于从下往上跳 xff0c 最后剩一个 xff08
Linux的.service服务实现程序开机自启

一 service文件的位置所有可用的单元文件存放在 lib systemd system 和 etc systemd system 目录我们需要在 lib systemd system 下存放 service文件 xff0c 当sys
计算机网络复习提纲（完整版）

第一章概述计算机网络 xff1a 利用通信线路和通信设备 xff0c 将地理位置和功能不同的多台计算机互联起来 xff0c 用完善的网络软件实现资源共享和信息传递的网络组成 xff1a 计算机 xff0c 网络操作系统 xff0c 传
无人机多任务寻径仿真软件与实验平台（一）

项目背景 xff1a 近年来 xff0c 无人机的应用领域已经得到了极大的拓展 xff0c 旋翼无人机凭借较大的载荷 xff0c 稳定的飞行状态与对高空环境的高度适应 xff0c 成为了应用最为广泛的一类无人机在欧洲 xff0c 北美洲等
无人机实验平台(七) 实验平台的坐标转换（上）

为什么要做坐标转换 xff1f 大疆提供的sdk中指出 xff0c 无人机通常情况下通过两个坐标系来控制方向 xff1a 自身坐标系 xff08 Body xff09 和地面坐标系 xff08 N E D xff09 这两个坐标系可以相互转
无人机实验平台（十）室内悬停问题

VirtualStick Mode VirtualStick Mode是Sdk提供的一种底层控制模式 xff0c 通过模拟物理摇杆的运动向无人机按照一定频率发送摇杆差分信息 xff0c 使得无人机按照类似于被物理摇杆控制的方式运行 xff0
第30章 ADC—电压采集—零死角玩转STM32-F429系列

第30章 ADC 电压采集全套 200 集视频教程和 1000 页 PDF 教程请到秉火论坛下载 xff1a www firebbs cn 野火视频教程优酷观看网址 xff1a http i youku com firege 本章参考资料
大数据安全考试提纲

范围划得虽大 xff0c 但是主题不多 xff0c 和往常一样记录一下重点考试范围 1 大数据安全概念及目标 2 传统访问控制技术和基于密码的访问控制技术 3 角色挖掘的算法 4 对称密码 xff0c 非对称密码 xff0c hash算法
算法设计与分析（小总结）

原先一直没注意这一门 xff0c 大概是因为学这些算法的时候 xff0c 板子都不知道背多少遍了可是考试毕竟不一样 xff0c 如果来个证明很容易抓瞎看了往年的试题 xff0c 可能确实因为难度高 xff0c 范围一缩再缩 xff0c
软件测试技术

引论为什么进行软件测试 xff1f 软件存在缺陷 xff0c 只有通过测试才可以发现缺陷 xff0c 只有发现缺陷才能把缺陷从产品中清除出去软件中缺陷带来的损失是巨大的测试是所有工程学科的基本组成单元软件测试 xff1a 验证 43
c语言自定义tcp协议实现socket通信(windows版本)

前面一篇博客介绍了mac linux下通过C语言自定义协议实现socket通信的示例 xff0c 因为大部分api与windows还有很多区别 xff0c 这里就特意把windows下的tcp通信实例给介绍一下无论是linux xff0c
opencv for java给图片添加水印中文问题

opencv提供的给图片添加文字的方法Imgproc putText 可以给图片添加文字 xff0c 最后类似一个添加水印的效果 xff0c 但是这个方法对中文支持不好 xff0c 在没有字体支持的情况下 xff0c 默认中文显示如下图所
社区版Intellij IDEA安装Spring Boot Assistant插件解决yml无提示问题

如题所示 xff0c 我们如果个人使用免费社区版的IDEA xff0c 它缺失了很多功能 xff0c 使用起来没有专业版那么强大 xff0c 比如无法直接创建springbootinit项目 xff0c spring配置yml文件没有提示
IDEA安装spotbugs插件替代findbugs插件

相信最近想在IDEA上安装findbugs插件的朋友 xff0c 遇到与我一样的问题 xff0c findbugs与IDEA不兼容 xff1a https plugins jetbrains com plugin 3847 findbugs
第40章 CAN—通讯实验—零死角玩转STM32-F429系列

第40章 CAN 通讯实验全套 200 集视频教程和 1000 页 PDF 教程请到秉火论坛下载 xff1a www firebbs cn 野火视频教程优酷观看网址 xff1a http i youku com firege 本章参考资料
easyexcel读取excel合并单元格数据

普通的excel列表 xff0c easyexcel读取是没有什么问题的但是 xff0c 如果有合并单元格 xff0c 那么它读取的时候 xff0c 能获取数据 xff0c 但是数据是不完整的如下所示的单元格数据 xff1a 我们通过简
clion + opencv环境搭建

clion是一个jetbrains提供的c 43 43 开发环境 xff0c 和idea pycharm等开发工具类似 xff0c 界面有很多相似的地方 clion内置了一个mingw的编译环境 xff0c 自带了gcc g 43 43 等
ChatGLM-6B本地cpu部署

ChatGLM 6B是清华团队研发的机器人对话系统 xff0c 类似ChatGPT xff0c 但是实际相差很多 xff0c 可以当作一个简单的ChatGPT ChatGLM部署默认是支持GPU加速 xff0c 内存需要32G以上普通的机

ChatGLM-6B本地cpu部署

ChatGLM-6B本地cpu部署 的相关文章

随机推荐

热门标签

ChatGLM-6B本地cpu部署的相关文章