位置: IT常识 - 正文

ChatGLM-6B (介绍相关概念、基础环境搭建及部署)

编辑:rootadmin
ChatGLM-6B (介绍相关概念、基础环境搭建及部署) 文章目录前言一、ChatGLM-6B是什么?二、安装虚拟的python环境1.下载2.安装3.设置国内源(危险)4.虚拟环境使用简介三、部署ChatGLM-6B1. clone代码2. 运行1.创建虚拟环境2.装包2.1 找到合适的pytorch版本2.1 安装依赖2.2 验证pytorch是否为GPU版本3.运行四、部署过程中遇到的问题1. 问题12.问题23.问题34.问题4总结参考文章前言

推荐整理分享ChatGLM-6B (介绍相关概念、基础环境搭建及部署),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

最近chatgpt比较火,正好看到国内有个类似开源的框架,那不得试试、

一、ChatGLM-6B是什么?

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6GB显存。

二、安装虚拟的python环境

ChatGLM-6B 代码中有一些python3.7支持的语法,所以要有python3.7+ 的环境。我们使用conda来管理python环境 conda分为anaconda和miniconda。anaconda是包含一些常用包的版本,miniconda则是精简版.本文中我们将使用anaconda

1.下载

可以在官网中找到自己需要的版本进行下载,如果你系统也是ubutu 64位的,也可以使用我下载的版本进行安装

2.安装

在上一步下载的安装包同级,使用命令行执行以下命令

# 此处需写实际下载名称bash Anaconda3-2023.03-Linux-x86_64.sh

然后根据提示操作即可

3.设置国内源(危险)

可以参考此文章。当然,如果不换源可以顺利装所有的包的话,尽量不要执行此操作。我就因为换了源,导致后边出了很多小问题。

4.虚拟环境使用简介# 创建虚拟环境conda create -n xxx python=3.8# 进入虚拟环境conda activate xxx# 退出当前虚拟环境conda deactivate# 查看本地虚拟环境conda info --env# 删除虚拟环境conda remove -n xxx --all三、部署ChatGLM-6B1. clone代码git clone https://github.com/THUDM/ChatGLM-6B.git2. 运行1.创建虚拟环境# 新建chatglm环境conda create -n chatglm python=3.8# 激活chatglm环境conda activate chatglm2.装包2.1 找到合适的pytorch版本

我们可以通过以下命令查看自己的cuda及cuda驱动版本

nvidia-smiChatGLM-6B (介绍相关概念、基础环境搭建及部署)

我们可以看到,cuda版本是11.5,驱动版本是493.44,然后我们去官网寻找合适的pytorch装包指令,官网链接如下: https://pytorch.org/get-started/locally/ https://pytorch.org/get-started/previous-versions/ 如果找不到对应版本的话,可以参考此链接,通过驱动找到合适的cuda toolkit版本,然后再去官网寻找合适的装包指令 注:驱动是向下兼容的,其决定了可安装的CUDA Toolkit的最高版本。

2.1 安装依赖# 根据上一步找到的安装指令进行安装:pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113# 安装gradio用于启动图形化web界面pip install gradio# 安装运行依赖pip install -r requirement.txt2.2 验证pytorch是否为GPU版本import torchtorch.cuda.is_available() ## 输出应该是True3.运行

在运行前,我们需要修改一些文件内容

# web_demo.py# 1. 新增mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models,下载模型使用清华源tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models')model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models').half().cuda()# 2. 增加server_name和server_port参数demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)四、部署过程中遇到的问题1. 问题1

报错如下:

ERROR: Could not find a version that satisfies the requirement protobuf<3.20.1,>=3.19.5 (from versions: none)ERROR: No matching distribution found for protobuf<3.20.1,>=3.19.5

原因及解决方案: 是因为上一步换了国内的镜像源,所以只需要指定装包路径即可l sls

pip install -r requirements.txt -i https://pypi.Python.org/simple/2.问题2

报错如下:

ImportError: Using SOCKS proxy, but the 'socksio' package is not installed. Make sure to install httpx using `pip install httpx[socks]`.

原因及解决方案: 是因为我在命令行设置了“科学上网”,关掉即可

# 因为我设置的是临时的,所以在命令行输入如下代码即可unset http_proxyunset https_proxy3.问题3

报错如下:

RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 7.40 GiB already allocated; 53.19 MiB free; 7.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

原因及解决方案: 默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:

# int4精度加载,需要6G显存# web_demo.pymodel = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()4.问题4

报错如下:

RuntimeError: Library cudart is not initialized

原因及解决方案: 我是用conda管理的环境,此时应该是cudatoolkit有问题,参考此issue

# 使用conda安装cudatoolkitconda install cudatoolkit=11.3 -c nvidia总结

例如:整个部署其实最难的应该还是环境了,虽然项目的README写的比较简单,但是真实搭建起来确实各种问题,希望此文章能给大家一些帮助吧。

参考文章

清华大学开源中文版ChatGPT模型——ChatGLM-6B发布 PyTorch、CUDA Toolkit 及显卡驱动版本对应关系 验证pytorch是否为GPU版本

本文链接地址:https://www.jiuchutong.com/zhishi/283910.html 转载请保留说明!

上一篇:显示器有必要买4k高分辨率吗?高分辨显示器值得(显示器有必要买240hz吗)

下一篇:最高超频记录的CPU是什么(最强超频)

  • appstore将推出免费试用功能 可以先用后付钱(appstore免费项目免密码)

    appstore将推出免费试用功能 可以先用后付钱(appstore免费项目免密码)

  • 天然气显示e6是什么意思(天然气e6是什么故障)

    天然气显示e6是什么意思(天然气e6是什么故障)

  • 华为平板恢复出厂设置在哪里(华为平板恢复出厂设置后怎么激活设备)

    华为平板恢复出厂设置在哪里(华为平板恢复出厂设置后怎么激活设备)

  • realme gt neo2应用锁怎么设置(realme gt neo2百度百科)

    realme gt neo2应用锁怎么设置(realme gt neo2百度百科)

  • 抖音被限流了是什么意思(抖音被限流了是否还能补救)

    抖音被限流了是什么意思(抖音被限流了是否还能补救)

  • 正在联系ipad软件更新服务器什么意思(正在联系ipad软件更新服务器没反应)

    正在联系ipad软件更新服务器什么意思(正在联系ipad软件更新服务器没反应)

  • vivox20深色模式怎么开(vivo x23深色模式)

    vivox20深色模式怎么开(vivo x23深色模式)

  • 自己冻结微信怎么解除(自己冻结微信号)

    自己冻结微信怎么解除(自己冻结微信号)

  • 笔记本白屏怎么关机(笔记本白屏怎么解决)

    笔记本白屏怎么关机(笔记本白屏怎么解决)

  • 恢复网速发什么到10086(恢复网速发什么短信给10086)

    恢复网速发什么到10086(恢复网速发什么短信给10086)

  • 手机不玩也耗电怎么解决(手机不玩也耗电怎么解决OPPO)

    手机不玩也耗电怎么解决(手机不玩也耗电怎么解决OPPO)

  • 华为freebuds3怎么关机(华为freebuds3怎么样)

    华为freebuds3怎么关机(华为freebuds3怎么样)

  • 下划线怎么设置一样长(红色下划线怎么设置)

    下划线怎么设置一样长(红色下划线怎么设置)

  • 手机没输入法怎么办(手机没输入法怎么输入)

    手机没输入法怎么办(手机没输入法怎么输入)

  • 快手怎么删除订单记录(快手怎么删除订单了还是显示常购好物)

    快手怎么删除订单记录(快手怎么删除订单了还是显示常购好物)

  • 怎么把抖音评论背景改成黑色(怎么把抖音评论区图片保存到手机)

    怎么把抖音评论背景改成黑色(怎么把抖音评论区图片保存到手机)

  • 美团评论第二天才能看到吗(美团评论第二天才能看到怎么开启歇业保护)

    美团评论第二天才能看到吗(美团评论第二天才能看到怎么开启歇业保护)

  • 小米cc9e防水吗(小米cc9e有防水吗)

    小米cc9e防水吗(小米cc9e有防水吗)

  • 国外定位怎么调中文(在国外怎么把定位改到国内)

    国外定位怎么调中文(在国外怎么把定位改到国内)

  • 开发植物识别app有何用途(植物识别软件哪个最好)

    开发植物识别app有何用途(植物识别软件哪个最好)

  • 车前草的功效与作用及禁忌(车前草的功效与作用及禁忌症)

    车前草的功效与作用及禁忌(车前草的功效与作用及禁忌症)

  • 【TFS-CLUB社区 第4期赠书活动】〖Flask Web全栈开发实战〗等你来拿,参与评论,即可有机获得(tf fans club)

    【TFS-CLUB社区 第4期赠书活动】〖Flask Web全栈开发实战〗等你来拿,参与评论,即可有机获得(tf fans club)

  • 运输发票抵扣联丢了
  • 美团收取的佣金怎么开票
  • 银行证书年费计入什么科目
  • 个人所得税年底返税
  • 汇算清缴产生的企业所得税如何做账
  • 通行费进项抵扣政策
  • 人力资源代缴社保合法吗
  • 耕地占用税如何做账
  • 收到技术咨询费摘要
  • 深圳报关费用是多少
  • 工业企业税负率一般控制在多少?
  • 价税合计啥意思
  • 金三系统打印控件下载及报税流程
  • 最新增值税申报实操
  • 预提 冲销
  • 无偿取得土地使用权的会计分录
  • 调整暂估有差价怎么办
  • 大宗物资吧
  • 支付给业主的赔偿金
  • 城建附加减半征收文件
  • 注销税务登记后多久注销工商登记
  • 应付账款少付怎么做账
  • 华为鸿蒙系统耗电量快吗
  • 长期闲置的机器叫什么
  • win7为什么这么多人用
  • 安卓手机数据迁移到红米手机
  • 坏账的税务处理方法
  • 增值税价外费用如何开票
  • isass是什么程序
  • 同一控制下的控股合并与非同一控制下的控股合并
  • php编程基础与案例开发
  • phpopendir
  • 土地增值税的计算
  • 购买原材料产生的费用
  • php输出对象
  • 深入理解php中的数字
  • 增值税折扣发票有折扣字样
  • 房地产企业出售房产增值税
  • 酒店押金的账务处理
  • 微擎框架是开源的吗
  • 资产减值损失如何确定
  • 个人注册投资有限公司
  • 土地补偿款会议纪要
  • 个税手续费返还要交企业所得税吗
  • 小型微利企业季度所得税怎么计算
  • SQL2005 provider: 命名管道提供程序 error: 40 无法打开到 SQL Server 的连接
  • 增值税留抵退税的账务处理
  • 商场返券计算公式
  • 出口海运费222011
  • 建筑施工企业在12个月内第三次发生生产安全事故的
  • 短期借款明细账采用什么格式
  • 工会经费账务处理流程
  • 一正一负发票要做凭证吗
  • 金蝶的数量金额明细账是怎么做的
  • 怎么用两台电脑登录同一个微信
  • 企业内部银行转账怎么记账
  • 一般纳税人厂房租赁增值税税率是多少
  • 转账支票有效期6个月
  • sql解析器是什么
  • sqlserver存储过程在哪
  • sql server删除重复数据保留一条
  • UNIX系统中文件的索引表结构
  • ubuntu 网络设置命令
  • win10系统无法运行exe文件
  • iptables 增加
  • win7共享设置(详细图文步骤)
  • win8怎么改系统
  • react-native-navigation
  • android按钮点击效果的实验报告
  • cacls命令怎么运用
  • javascript高级程序设计电子书
  • scrapy python
  • Android 仿 iphone 自定义滚动选择器
  • 最简单的十个菜
  • jquery 模态窗口
  • 云南省国家税务局APP
  • 山东地方税务局官网
  • 深圳企业公积金更改代扣银行
  • 河北省国家税务局长简介
  • 税务局有事业单位编制吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设