位置: IT常识 - 正文

ChatGLM-6B (介绍相关概念、基础环境搭建及部署)

编辑:rootadmin
ChatGLM-6B (介绍相关概念、基础环境搭建及部署) 文章目录前言一、ChatGLM-6B是什么?二、安装虚拟的python环境1.下载2.安装3.设置国内源(危险)4.虚拟环境使用简介三、部署ChatGLM-6B1. clone代码2. 运行1.创建虚拟环境2.装包2.1 找到合适的pytorch版本2.1 安装依赖2.2 验证pytorch是否为GPU版本3.运行四、部署过程中遇到的问题1. 问题12.问题23.问题34.问题4总结参考文章前言

推荐整理分享ChatGLM-6B (介绍相关概念、基础环境搭建及部署),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

最近chatgpt比较火,正好看到国内有个类似开源的框架,那不得试试、

一、ChatGLM-6B是什么?

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6GB显存。

二、安装虚拟的python环境

ChatGLM-6B 代码中有一些python3.7支持的语法,所以要有python3.7+ 的环境。我们使用conda来管理python环境 conda分为anaconda和miniconda。anaconda是包含一些常用包的版本,miniconda则是精简版.本文中我们将使用anaconda

1.下载

可以在官网中找到自己需要的版本进行下载,如果你系统也是ubutu 64位的,也可以使用我下载的版本进行安装

2.安装

在上一步下载的安装包同级,使用命令行执行以下命令

# 此处需写实际下载名称bash Anaconda3-2023.03-Linux-x86_64.sh

然后根据提示操作即可

3.设置国内源(危险)

可以参考此文章。当然,如果不换源可以顺利装所有的包的话,尽量不要执行此操作。我就因为换了源,导致后边出了很多小问题。

4.虚拟环境使用简介# 创建虚拟环境conda create -n xxx python=3.8# 进入虚拟环境conda activate xxx# 退出当前虚拟环境conda deactivate# 查看本地虚拟环境conda info --env# 删除虚拟环境conda remove -n xxx --all三、部署ChatGLM-6B1. clone代码git clone https://github.com/THUDM/ChatGLM-6B.git2. 运行1.创建虚拟环境# 新建chatglm环境conda create -n chatglm python=3.8# 激活chatglm环境conda activate chatglm2.装包2.1 找到合适的pytorch版本

我们可以通过以下命令查看自己的cuda及cuda驱动版本

nvidia-smiChatGLM-6B (介绍相关概念、基础环境搭建及部署)

我们可以看到,cuda版本是11.5,驱动版本是493.44,然后我们去官网寻找合适的pytorch装包指令,官网链接如下: https://pytorch.org/get-started/locally/ https://pytorch.org/get-started/previous-versions/ 如果找不到对应版本的话,可以参考此链接,通过驱动找到合适的cuda toolkit版本,然后再去官网寻找合适的装包指令 注:驱动是向下兼容的,其决定了可安装的CUDA Toolkit的最高版本。

2.1 安装依赖# 根据上一步找到的安装指令进行安装:pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113# 安装gradio用于启动图形化web界面pip install gradio# 安装运行依赖pip install -r requirement.txt2.2 验证pytorch是否为GPU版本import torchtorch.cuda.is_available() ## 输出应该是True3.运行

在运行前,我们需要修改一些文件内容

# web_demo.py# 1. 新增mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models,下载模型使用清华源tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models')model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models').half().cuda()# 2. 增加server_name和server_port参数demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)四、部署过程中遇到的问题1. 问题1

报错如下:

ERROR: Could not find a version that satisfies the requirement protobuf<3.20.1,>=3.19.5 (from versions: none)ERROR: No matching distribution found for protobuf<3.20.1,>=3.19.5

原因及解决方案: 是因为上一步换了国内的镜像源,所以只需要指定装包路径即可l sls

pip install -r requirements.txt -i https://pypi.Python.org/simple/2.问题2

报错如下:

ImportError: Using SOCKS proxy, but the 'socksio' package is not installed. Make sure to install httpx using `pip install httpx[socks]`.

原因及解决方案: 是因为我在命令行设置了“科学上网”,关掉即可

# 因为我设置的是临时的,所以在命令行输入如下代码即可unset http_proxyunset https_proxy3.问题3

报错如下:

RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 7.40 GiB already allocated; 53.19 MiB free; 7.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

原因及解决方案: 默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:

# int4精度加载,需要6G显存# web_demo.pymodel = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()4.问题4

报错如下:

RuntimeError: Library cudart is not initialized

原因及解决方案: 我是用conda管理的环境,此时应该是cudatoolkit有问题,参考此issue

# 使用conda安装cudatoolkitconda install cudatoolkit=11.3 -c nvidia总结

例如:整个部署其实最难的应该还是环境了,虽然项目的README写的比较简单,但是真实搭建起来确实各种问题,希望此文章能给大家一些帮助吧。

参考文章

清华大学开源中文版ChatGPT模型——ChatGLM-6B发布 PyTorch、CUDA Toolkit 及显卡驱动版本对应关系 验证pytorch是否为GPU版本

本文链接地址:https://www.jiuchutong.com/zhishi/283910.html 转载请保留说明!

上一篇:显示器有必要买4k高分辨率吗?高分辨显示器值得(显示器有必要买240hz吗)

下一篇:最高超频记录的CPU是什么(最强超频)

  • 苹果手机如何查看已拉黑联系人(苹果手机如何查找对方手机位置)

    苹果手机如何查看已拉黑联系人(苹果手机如何查找对方手机位置)

  • 魅族18x中框材质(魅族17中框材质)

    魅族18x中框材质(魅族17中框材质)

  • d盘压缩后c盘无法扩展(d盘压缩后c盘无法扩展win10)

    d盘压缩后c盘无法扩展(d盘压缩后c盘无法扩展win10)

  • 荣耀30有防水防尘功能吗(荣耀30手机防水性能)

    荣耀30有防水防尘功能吗(荣耀30手机防水性能)

  • ios13可以清空流量统计吗(ios清空流量数据)

    ios13可以清空流量统计吗(ios清空流量数据)

  • 华为荣耀20青春版防不防水(华为荣耀20青春版多少钱)

    华为荣耀20青春版防不防水(华为荣耀20青春版多少钱)

  • ipad app内购买是什么意思(ipadapp内购买项目要钱吗)

    ipad app内购买是什么意思(ipadapp内购买项目要钱吗)

  • 荣耀20掉水里了但能正常使用(荣耀掉水里了怎么办)

    荣耀20掉水里了但能正常使用(荣耀掉水里了怎么办)

  • 魅族应用商店怎么下载(魅族应用商店怎么改地区)

    魅族应用商店怎么下载(魅族应用商店怎么改地区)

  • 抖音内测版有什么区别(抖音内测版和普通版区别)

    抖音内测版有什么区别(抖音内测版和普通版区别)

  • 移动数据是什么意思(移动数据是什么流量)

    移动数据是什么意思(移动数据是什么流量)

  • 抖音怎么不合成钻卡(抖音合成不了怎么回事)

    抖音怎么不合成钻卡(抖音合成不了怎么回事)

  • 手机内存足够却很卡怎么办(手机内存足够却安装不了QQ)

    手机内存足够却很卡怎么办(手机内存足够却安装不了QQ)

  • 文件夹的最终目的是用于存储文件吗(文件最终状态如何设置)

    文件夹的最终目的是用于存储文件吗(文件最终状态如何设置)

  • iphone7热点怎么开(苹果七热点在哪)

    iphone7热点怎么开(苹果七热点在哪)

  • 手机怎么更换浏览器(手机怎么更换浏览器已下载文件的打开方式)

    手机怎么更换浏览器(手机怎么更换浏览器已下载文件的打开方式)

  • mate30怎么打开无线反向充电(mate30怎么打开无线充电)

    mate30怎么打开无线反向充电(mate30怎么打开无线充电)

  • word正文字体大小怎么调(word文字正常大小)

    word正文字体大小怎么调(word文字正常大小)

  • 手机怎样退出炫彩桌面(手机上怎么退出)

    手机怎样退出炫彩桌面(手机上怎么退出)

  • 微信头像右上角有个圈是什么意思(微信头像右上角的数字怎么弄)

    微信头像右上角有个圈是什么意思(微信头像右上角的数字怎么弄)

  • 微信不能收款了怎么办(微信不能收款了 提示需要人脸)

    微信不能收款了怎么办(微信不能收款了 提示需要人脸)

  • excel表格页边距标准(excel表格页边距调整不了)

    excel表格页边距标准(excel表格页边距调整不了)

  • 小红书入驻条件(小红书入驻条件要求)

    小红书入驻条件(小红书入驻条件要求)

  • Win7系统下,无法打开系统注册表是怎么回事?(win7系统里没有无线网络连接)

    Win7系统下,无法打开系统注册表是怎么回事?(win7系统里没有无线网络连接)

  • 在浏览器集成AI(chatgpt、new bing、bard )的必备扩展插件(浏览器集成什么意思)

    在浏览器集成AI(chatgpt、new bing、bard )的必备扩展插件(浏览器集成什么意思)

  • 外商投资合伙企业的性质与特征
  • 以前年度损益调整在借方是什么意思
  • 厂区地面硬化属于土建还是市政
  • 汇算清缴的费用会计怎么做账
  • 发票已经做账但要退款账不平咋办
  • 长期待摊费用如何摊销计算
  • 营业外支出影响损益吗
  • 房租收据样式
  • 两免三减半的范围
  • 忘记先抄税再申报了怎么办
  • 代理缴费业务主要包括
  • 企业自建固定资产
  • 固定资产的净收益和净损失怎么计算
  • 销售收入打折后怎么算
  • 变更法人流程具体流程图
  • 公司借别的公司的钱再借给别的公司
  • 跨年发票冲红重新开具购买方做账不
  • 销售利润率如何提高
  • 销售货物收入与营业收入
  • 超限量领购发票审批通过后
  • 过路费去年的票还可以用吗
  • 一件商品若卖100元
  • 交税四舍五入差额怎么处理
  • 公允价值变动损益属于损益类的
  • 股权转让怎么缴纳个人所得税
  • 承兑汇票怎么换算
  • 电子发票逾期未报税怎么办
  • 进项税和销项税抵扣的会计分录
  • 供应商把价格算错了怎么办
  • 物业公司收的电梯费如何做账
  • 办劳务发票需要什么资料
  • 运输途中发生货物丢失
  • 核销坏账应具备的条件
  • c盘满了清理什么
  • 实发工资和报税工资
  • linux增加inode
  • 电脑进程ace是什么
  • 政府性基金收入怎么收
  • php guzzle 异步
  • 公司买的公文包会计怎么做
  • MAE详解
  • php标准数据类型共有四种
  • php运用
  • dir命令参数
  • MS Excel: COUNTIF Function (WS)
  • 预收账款是否需入账
  • 工程运维预缴增值税税率
  • 食堂购买固定资产会计处理
  • 企业自产自用的产品需要缴纳增值税吗
  • 2021年财政部令68号
  • 付款人和开票人必须相符吗
  • 小规模定额征收和查账征收哪个更好一些
  • 转出未交增值税会计处理
  • 存货计划成本法的优点
  • 帮客户代付保证金合法吗
  • 铁路运输印花税按什么比例交
  • 租户押金抵房租
  • 加油充值卡有优惠吗
  • etc发票申请流程
  • 税务局退以前年度的税款怎样记账
  • 纳税人延期缴纳税款
  • 税金及附加科目余额在借方还是贷方
  • 应付账款核算的项目
  • 445端口 关闭
  • windows运行.sh
  • 搜索不到WiFi信号是怎么回事
  • window7qq登录失败
  • elf.exe是什么程序
  • win7系统的话筒在哪设置
  • win10周年版
  • window10打补丁
  • ubuntu操作
  • android内存工具
  • shell脚本case语句判断成绩
  • bootstrap按钮图标
  • [置顶]马粥街残酷史
  • js校验密码复杂度
  • 走出JavaScript初学困境—js初学
  • SpringMVC restful 注解之@RequestBody进行json与object转换
  • 企业个税申报系统密码忘记了在哪能找回呢?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设