位置: IT常识 - 正文

ChatGLM-6B (介绍相关概念、基础环境搭建及部署)

编辑:rootadmin
ChatGLM-6B (介绍相关概念、基础环境搭建及部署) 文章目录前言一、ChatGLM-6B是什么?二、安装虚拟的python环境1.下载2.安装3.设置国内源(危险)4.虚拟环境使用简介三、部署ChatGLM-6B1. clone代码2. 运行1.创建虚拟环境2.装包2.1 找到合适的pytorch版本2.1 安装依赖2.2 验证pytorch是否为GPU版本3.运行四、部署过程中遇到的问题1. 问题12.问题23.问题34.问题4总结参考文章前言

推荐整理分享ChatGLM-6B (介绍相关概念、基础环境搭建及部署),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

最近chatgpt比较火,正好看到国内有个类似开源的框架,那不得试试、

一、ChatGLM-6B是什么?

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6GB显存。

二、安装虚拟的python环境

ChatGLM-6B 代码中有一些python3.7支持的语法,所以要有python3.7+ 的环境。我们使用conda来管理python环境 conda分为anaconda和miniconda。anaconda是包含一些常用包的版本,miniconda则是精简版.本文中我们将使用anaconda

1.下载

可以在官网中找到自己需要的版本进行下载,如果你系统也是ubutu 64位的,也可以使用我下载的版本进行安装

2.安装

在上一步下载的安装包同级,使用命令行执行以下命令

# 此处需写实际下载名称bash Anaconda3-2023.03-Linux-x86_64.sh

然后根据提示操作即可

3.设置国内源(危险)

可以参考此文章。当然,如果不换源可以顺利装所有的包的话,尽量不要执行此操作。我就因为换了源,导致后边出了很多小问题。

4.虚拟环境使用简介# 创建虚拟环境conda create -n xxx python=3.8# 进入虚拟环境conda activate xxx# 退出当前虚拟环境conda deactivate# 查看本地虚拟环境conda info --env# 删除虚拟环境conda remove -n xxx --all三、部署ChatGLM-6B1. clone代码git clone https://github.com/THUDM/ChatGLM-6B.git2. 运行1.创建虚拟环境# 新建chatglm环境conda create -n chatglm python=3.8# 激活chatglm环境conda activate chatglm2.装包2.1 找到合适的pytorch版本

我们可以通过以下命令查看自己的cuda及cuda驱动版本

nvidia-smiChatGLM-6B (介绍相关概念、基础环境搭建及部署)

我们可以看到,cuda版本是11.5,驱动版本是493.44,然后我们去官网寻找合适的pytorch装包指令,官网链接如下: https://pytorch.org/get-started/locally/ https://pytorch.org/get-started/previous-versions/ 如果找不到对应版本的话,可以参考此链接,通过驱动找到合适的cuda toolkit版本,然后再去官网寻找合适的装包指令 注:驱动是向下兼容的,其决定了可安装的CUDA Toolkit的最高版本。

2.1 安装依赖# 根据上一步找到的安装指令进行安装:pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113# 安装gradio用于启动图形化web界面pip install gradio# 安装运行依赖pip install -r requirement.txt2.2 验证pytorch是否为GPU版本import torchtorch.cuda.is_available() ## 输出应该是True3.运行

在运行前,我们需要修改一些文件内容

# web_demo.py# 1. 新增mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models,下载模型使用清华源tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models')model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models').half().cuda()# 2. 增加server_name和server_port参数demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)四、部署过程中遇到的问题1. 问题1

报错如下:

ERROR: Could not find a version that satisfies the requirement protobuf<3.20.1,>=3.19.5 (from versions: none)ERROR: No matching distribution found for protobuf<3.20.1,>=3.19.5

原因及解决方案: 是因为上一步换了国内的镜像源,所以只需要指定装包路径即可l sls

pip install -r requirements.txt -i https://pypi.Python.org/simple/2.问题2

报错如下:

ImportError: Using SOCKS proxy, but the 'socksio' package is not installed. Make sure to install httpx using `pip install httpx[socks]`.

原因及解决方案: 是因为我在命令行设置了“科学上网”,关掉即可

# 因为我设置的是临时的,所以在命令行输入如下代码即可unset http_proxyunset https_proxy3.问题3

报错如下:

RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 7.40 GiB already allocated; 53.19 MiB free; 7.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

原因及解决方案: 默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:

# int4精度加载,需要6G显存# web_demo.pymodel = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()4.问题4

报错如下:

RuntimeError: Library cudart is not initialized

原因及解决方案: 我是用conda管理的环境,此时应该是cudatoolkit有问题,参考此issue

# 使用conda安装cudatoolkitconda install cudatoolkit=11.3 -c nvidia总结

例如:整个部署其实最难的应该还是环境了,虽然项目的README写的比较简单,但是真实搭建起来确实各种问题,希望此文章能给大家一些帮助吧。

参考文章

清华大学开源中文版ChatGPT模型——ChatGLM-6B发布 PyTorch、CUDA Toolkit 及显卡驱动版本对应关系 验证pytorch是否为GPU版本

本文链接地址:https://www.jiuchutong.com/zhishi/283910.html 转载请保留说明!

上一篇:显示器有必要买4k高分辨率吗?高分辨显示器值得(显示器有必要买240hz吗)

下一篇:最高超频记录的CPU是什么(最强超频)

  • vivox70如何切换经典桌面(vivox70如何切换快充)

    vivox70如何切换经典桌面(vivox70如何切换快充)

  • 苹果手机可以测量尺寸吗(苹果手机可以测体温吗)

    苹果手机可以测量尺寸吗(苹果手机可以测体温吗)

  • 苹果长按不出现复制(苹果长按不出现换行)

    苹果长按不出现复制(苹果长按不出现换行)

  • Word如何删除文章中的空行(word如何删除文本框的边线)

    Word如何删除文章中的空行(word如何删除文本框的边线)

  • 手机视频播放失败如何处理(手机视频播放失败是什么原因)

    手机视频播放失败如何处理(手机视频播放失败是什么原因)

  • 如何下载qq已过期文件(如何下载qq已过期的图片)

    如何下载qq已过期文件(如何下载qq已过期的图片)

  • 有没有ipad支持wifi6(ipad2020支持无线)

    有没有ipad支持wifi6(ipad2020支持无线)

  • 手写文件怎么扫描成电子版(手写文件怎么扫描成电子版的软件)

    手写文件怎么扫描成电子版(手写文件怎么扫描成电子版的软件)

  • 无线网显示无ip分配是什么意思(无线网无网络连接)

    无线网显示无ip分配是什么意思(无线网无网络连接)

  • 笔记本cpu温度90度正常吗(笔记本cpu温度90度会烧坏吗)

    笔记本cpu温度90度正常吗(笔记本cpu温度90度会烧坏吗)

  • 苹果7p只能关机才可以充电(苹果7p只能关机充电怎么回事)

    苹果7p只能关机才可以充电(苹果7p只能关机充电怎么回事)

  • 钉钉悬浮窗记录时长吗(钉钉设置悬浮窗会记录时间吗)

    钉钉悬浮窗记录时长吗(钉钉设置悬浮窗会记录时间吗)

  • 苹果耳机黄灯什么意思(苹果耳机出现黄灯)

    苹果耳机黄灯什么意思(苹果耳机出现黄灯)

  • 什么是腾讯会议(什么是腾讯会议号)

    什么是腾讯会议(什么是腾讯会议号)

  • 手机一直显示3g怎么回事(手机一直显示3G信号怎么回事)

    手机一直显示3g怎么回事(手机一直显示3G信号怎么回事)

  • 苹果6为什么没有4g网络(苹果6为什么没信号无服务)

    苹果6为什么没有4g网络(苹果6为什么没信号无服务)

  • lctrl是哪个键(lctrl在哪)

    lctrl是哪个键(lctrl在哪)

  • 桌面横着怎么调过来(桌面横屏了怎么设置回来)

    桌面横着怎么调过来(桌面横屏了怎么设置回来)

  • qq多久不用会自动注销(qq多久不用自己会注销)

    qq多久不用会自动注销(qq多久不用自己会注销)

  • 微信账号已通过手机自助冻结是啥意思(微信账号已通过手机自助冻结别人可以解冻吗)

    微信账号已通过手机自助冻结是啥意思(微信账号已通过手机自助冻结别人可以解冻吗)

  • 怎么设置动态锁屏软件(怎么设置动态锁屏自定义)

    怎么设置动态锁屏软件(怎么设置动态锁屏自定义)

  • 开机一键还原win7系统(开机一键还原win7系统按哪个键)

    开机一键还原win7系统(开机一键还原win7系统按哪个键)

  • vivo手机显示hd收费吗(vivo手机显示hd什么意思)

    vivo手机显示hd收费吗(vivo手机显示hd什么意思)

  • 华为mate20pro能用水洗吗(华为mate20pro能用6a数据线吗)

    华为mate20pro能用水洗吗(华为mate20pro能用6a数据线吗)

  • wps怎样删除不要的页

    wps怎样删除不要的页

  • 苹果11可以微信分身吗(苹果11可以微信视频小界面吗)

    苹果11可以微信分身吗(苹果11可以微信视频小界面吗)

  • oppoa9微信视频能美颜吗(oppo手机微信视频的时候可以美颜吗)

    oppoa9微信视频能美颜吗(oppo手机微信视频的时候可以美颜吗)

  • 什么协议用于将电子邮件交付给internet(什么协议用于将电子邮件交付给英特尔上的邮件服务器)

    什么协议用于将电子邮件交付给internet(什么协议用于将电子邮件交付给英特尔上的邮件服务器)

  • 带息负债融资成本率意义
  • 为职工垫付的水电费应计入
  • 全年一次性奖金个税计算
  • 改革性补贴是否属于规范的津贴补贴
  • 怎样根据税负率调账
  • 土地增值税计入固定资产清理
  • 专门借款资本化时点
  • 个税身份验证不通过
  • 建筑业预收账款如何缴税
  • 煤矸石算能源吗
  • 境外保险是什么意思
  • 行政单位的会计要素
  • 应付债券利息调整科目理解
  • 房屋租赁发票能抵扣几个点
  • 小微企业减免的增值税账务处理
  • 反倾销税税率查询
  • 发票查询显示无数据怎么回事
  • 税收六项减免
  • 会计对帐是银行账户吗
  • ah股溢价是什么意思 搬砖
  • 从租计征房产税租金收入含税吗
  • 注册资金印花税怎么算
  • 生活中都交了哪些朋友
  • 资产收购的特殊性税务处理方法
  • 民营医院实收资本科目
  • 一般纳税人销售二手车增值税税率
  • 服务器数据迁移到新的服务器
  • win10任务栏隐藏正在运行的程序
  • 交易性金融资本
  • PHP:json_last_error()的用法_JSON函数
  • php nl2br
  • PHP:imagesetbrush()的用法_GD库图像处理函数
  • 农村土地承包经营权证丢失怎么补办
  • 兼职如何交税款
  • 企业租赁发票税率是多少2023年
  • 纽格尔官网
  • 前端的基础知识
  • 自学前端,你必做的事
  • 租房发票怎么缴税
  • 保障金计入什么科目
  • 商品流通企业购入的商品采用售价金额法核算的
  • 企业投资收益要交增值税吗
  • 应退或应补税额是负数
  • 公司注册流程百度百科
  • 个体经营部能抵扣个税吗
  • 发放工资的转账支票收款人
  • 金税盘地区编号怎么查
  • 公款私存个人检讨
  • 医院发票丢失怎么补办
  • 什么是叫资产负债表项目
  • 小微企业所得税优惠政策最新2023
  • 实收资本实务处理办法
  • 税种分类及其税率
  • 年末本年利润没有结转影响报税吗
  • 对公账户怎么打印
  • 餐饮业怎样做账
  • 会计主体包括哪些四种
  • 按不同要求分类
  • win8.1无法进入系统
  • windowxp宽带连接
  • Mac OSX通过homebrew卸载formula的方法
  • 如何用pe弄双系统引导
  • youphone.exe是什么
  • windows7无法关闭密码保护共享
  • linux中病毒了怎么处理
  • python ftp storbinary
  • Android studio第一行报错
  • unity改vs版本
  • python中闭包的作用
  • python redis incr
  • unity ui控件
  • 纳税人不如实申报税收怎么办
  • 重庆税筹公司
  • 广东省广州市国家安全局
  • 进口设备需要资质吗
  • 光伏发电地方税收
  • 国家税务局增值税发票平台
  • 出口退税函调管理办法
  • 北京地税app
  • 电子专票在哪里接收
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设