位置: IT常识 - 正文

ChatGLM-6B (介绍相关概念、基础环境搭建及部署)

编辑:rootadmin
ChatGLM-6B (介绍相关概念、基础环境搭建及部署) 文章目录前言一、ChatGLM-6B是什么?二、安装虚拟的python环境1.下载2.安装3.设置国内源(危险)4.虚拟环境使用简介三、部署ChatGLM-6B1. clone代码2. 运行1.创建虚拟环境2.装包2.1 找到合适的pytorch版本2.1 安装依赖2.2 验证pytorch是否为GPU版本3.运行四、部署过程中遇到的问题1. 问题12.问题23.问题34.问题4总结参考文章前言

推荐整理分享ChatGLM-6B (介绍相关概念、基础环境搭建及部署),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

最近chatgpt比较火,正好看到国内有个类似开源的框架,那不得试试、

一、ChatGLM-6B是什么?

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6GB显存。

二、安装虚拟的python环境

ChatGLM-6B 代码中有一些python3.7支持的语法,所以要有python3.7+ 的环境。我们使用conda来管理python环境 conda分为anaconda和miniconda。anaconda是包含一些常用包的版本,miniconda则是精简版.本文中我们将使用anaconda

1.下载

可以在官网中找到自己需要的版本进行下载,如果你系统也是ubutu 64位的,也可以使用我下载的版本进行安装

2.安装

在上一步下载的安装包同级,使用命令行执行以下命令

# 此处需写实际下载名称bash Anaconda3-2023.03-Linux-x86_64.sh

然后根据提示操作即可

3.设置国内源(危险)

可以参考此文章。当然,如果不换源可以顺利装所有的包的话,尽量不要执行此操作。我就因为换了源,导致后边出了很多小问题。

4.虚拟环境使用简介# 创建虚拟环境conda create -n xxx python=3.8# 进入虚拟环境conda activate xxx# 退出当前虚拟环境conda deactivate# 查看本地虚拟环境conda info --env# 删除虚拟环境conda remove -n xxx --all三、部署ChatGLM-6B1. clone代码git clone https://github.com/THUDM/ChatGLM-6B.git2. 运行1.创建虚拟环境# 新建chatglm环境conda create -n chatglm python=3.8# 激活chatglm环境conda activate chatglm2.装包2.1 找到合适的pytorch版本

我们可以通过以下命令查看自己的cuda及cuda驱动版本

nvidia-smiChatGLM-6B (介绍相关概念、基础环境搭建及部署)

我们可以看到,cuda版本是11.5,驱动版本是493.44,然后我们去官网寻找合适的pytorch装包指令,官网链接如下: https://pytorch.org/get-started/locally/ https://pytorch.org/get-started/previous-versions/ 如果找不到对应版本的话,可以参考此链接,通过驱动找到合适的cuda toolkit版本,然后再去官网寻找合适的装包指令 注:驱动是向下兼容的,其决定了可安装的CUDA Toolkit的最高版本。

2.1 安装依赖# 根据上一步找到的安装指令进行安装:pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113# 安装gradio用于启动图形化web界面pip install gradio# 安装运行依赖pip install -r requirement.txt2.2 验证pytorch是否为GPU版本import torchtorch.cuda.is_available() ## 输出应该是True3.运行

在运行前,我们需要修改一些文件内容

# web_demo.py# 1. 新增mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models,下载模型使用清华源tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models')model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models').half().cuda()# 2. 增加server_name和server_port参数demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)四、部署过程中遇到的问题1. 问题1

报错如下:

ERROR: Could not find a version that satisfies the requirement protobuf<3.20.1,>=3.19.5 (from versions: none)ERROR: No matching distribution found for protobuf<3.20.1,>=3.19.5

原因及解决方案: 是因为上一步换了国内的镜像源,所以只需要指定装包路径即可l sls

pip install -r requirements.txt -i https://pypi.Python.org/simple/2.问题2

报错如下:

ImportError: Using SOCKS proxy, but the 'socksio' package is not installed. Make sure to install httpx using `pip install httpx[socks]`.

原因及解决方案: 是因为我在命令行设置了“科学上网”,关掉即可

# 因为我设置的是临时的,所以在命令行输入如下代码即可unset http_proxyunset https_proxy3.问题3

报错如下:

RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 7.40 GiB already allocated; 53.19 MiB free; 7.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

原因及解决方案: 默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:

# int4精度加载,需要6G显存# web_demo.pymodel = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()4.问题4

报错如下:

RuntimeError: Library cudart is not initialized

原因及解决方案: 我是用conda管理的环境,此时应该是cudatoolkit有问题,参考此issue

# 使用conda安装cudatoolkitconda install cudatoolkit=11.3 -c nvidia总结

例如:整个部署其实最难的应该还是环境了,虽然项目的README写的比较简单,但是真实搭建起来确实各种问题,希望此文章能给大家一些帮助吧。

参考文章

清华大学开源中文版ChatGPT模型——ChatGLM-6B发布 PyTorch、CUDA Toolkit 及显卡驱动版本对应关系 验证pytorch是否为GPU版本

本文链接地址:https://www.jiuchutong.com/zhishi/283910.html 转载请保留说明!

上一篇:显示器有必要买4k高分辨率吗?高分辨显示器值得(显示器有必要买240hz吗)

下一篇:最高超频记录的CPU是什么(最强超频)

  • 四个步骤,让用户对你的产品立马上瘾!(四个步骤要求)

    四个步骤,让用户对你的产品立马上瘾!(四个步骤要求)

  • jkm-aloo华为什么型号(JKmAloo华为什么型号)

    jkm-aloo华为什么型号(JKmAloo华为什么型号)

  • 文件夹里面的图片怎么显示出来(文件夹里面的图片怎么排序)

    文件夹里面的图片怎么显示出来(文件夹里面的图片怎么排序)

  • 小红书删别人评论会提醒吗(小红书删别人评论会有什么影响)

    小红书删别人评论会提醒吗(小红书删别人评论会有什么影响)

  • 私房红包怎么激活(私房红包怎么找便宜东西)

    私房红包怎么激活(私房红包怎么找便宜东西)

  • 微信早上自动发消息怎么设置(微信早上自动发图片怎么设置)

    微信早上自动发消息怎么设置(微信早上自动发图片怎么设置)

  • 哔哩哔哩怎么删除自己的作品(哔哩哔哩怎么删除作品视频)

    哔哩哔哩怎么删除自己的作品(哔哩哔哩怎么删除作品视频)

  • 华为手机拦截骚扰电话怎么设置(华为手机拦截骚扰电话及短信)

    华为手机拦截骚扰电话怎么设置(华为手机拦截骚扰电话及短信)

  • 手机qq怎么自动刷屏(手机qq怎么自动登录)

    手机qq怎么自动刷屏(手机qq怎么自动登录)

  • vivox50处理器是什么(vivox50处理器是骁龙多少)

    vivox50处理器是什么(vivox50处理器是骁龙多少)

  • 1.0gbps是千兆网卡吗(1000mbps与1gbps)

    1.0gbps是千兆网卡吗(1000mbps与1gbps)

  • vivox30微信视频美颜在哪里设置(vivox30微信视频怎么美颜在哪里设置)

    vivox30微信视频美颜在哪里设置(vivox30微信视频怎么美颜在哪里设置)

  • 别人点赞为什么看不见(别人点赞为什么不显示)

    别人点赞为什么看不见(别人点赞为什么不显示)

  • b站怎么关注直播间(bilibili如何关注直播间)

    b站怎么关注直播间(bilibili如何关注直播间)

  • 发完消息再拉黑对方能收到吗(发完消息再拉黑对方能看到吗)

    发完消息再拉黑对方能收到吗(发完消息再拉黑对方能看到吗)

  • 有光驱和无光驱的区别(有光驱和无光驱哪个好)

    有光驱和无光驱的区别(有光驱和无光驱哪个好)

  • ipad扩容有什么坏处(ipad扩容有什么风险)

    ipad扩容有什么坏处(ipad扩容有什么风险)

  • 红米手机如何截长图(红米手机如何截长屏图片)

    红米手机如何截长图(红米手机如何截长屏图片)

  • 苹果的时间规划局在哪里(苹果的时间规划怎么设置)

    苹果的时间规划局在哪里(苹果的时间规划怎么设置)

  • win7怎么进入pe系统(win7怎么进入pe系统启动U盘)

    win7怎么进入pe系统(win7怎么进入pe系统启动U盘)

  • 一个邮箱可以注册几个苹果id(一个邮箱可以注册几个任天堂账号)

    一个邮箱可以注册几个苹果id(一个邮箱可以注册几个任天堂账号)

  • 红米k20pro什么时候发布(红米k20pro什么时候)

    红米k20pro什么时候发布(红米k20pro什么时候)

  • oppoa9怎么没有呼吸灯(oppoa9呼叫等待怎么设置找不到)

    oppoa9怎么没有呼吸灯(oppoa9呼叫等待怎么设置找不到)

  • 个人所得税申报操作流程2023
  • 纯外贸出口企业出售固定
  • 未能确认收入的原因
  • 固定资产原值包含进项税吗
  • 社团组织缴纳的社保
  • 知道含税价,税率,怎么算税金
  • 其他综合收益税后净额影响净利润吗
  • 个税专项扣除中途贷款改租房
  • 企业所得税公益性捐赠扣除标准
  • 个体工商户销售自己使用过的物品
  • 开立基本账户所需资料
  • 已认证抵扣的进项发票,次月开具红字发票信息表,凭证
  • 增值税发票价格低于进项
  • 小规模纳税人物流服务税率
  • 不用发票可以报销吗
  • 农副产品收购发票申请
  • 公司开出的发票
  • 收到分包公司工程发票收入怎么做账
  • 抵扣联和发票联算一张发票吗
  • 跨年度暂估未取得发票如何处理
  • 拆迁的支出费用包括哪些
  • 鸿蒙系统通知栏和控制
  • 王者荣耀中扁鹊的克星是谁
  • php8底层内核
  • 超市预售卡怎么记账
  • 做胃镜多少钱了
  • nginx隐藏后缀
  • 企业购进固定资产其入账成本应包括
  • 某建筑公司因施工期紧迫,事先未能与有关
  • php自定义header
  • 如何免费使用超级简历
  • 俄勒冈zip
  • AI - stable-diffusion(AI绘画)的搭建与使用
  • thinkphp框架设计原理
  • 隐藏php后缀
  • index.php怎么修改
  • 装订好的凭证可以拆开吗
  • 一般纳税人怎么申报增值税
  • 税控盘全额抵扣发票怎么勾选
  • 税务三流一致是什么意思
  • 担保贷款借款人征信不好有影响吗
  • 迭代器实现原理
  • 织梦的首页怎么换图片
  • 政府扶持资金所得税税率
  • 资产负债表应交税费为负数
  • 丢失增值税发票已报税证明单取消
  • 出售专利技术收增值税吗
  • 公司为职工承担社保费用
  • 出口退税率为0的账务处理
  • 代金券抵帐怎么退款
  • 主营业务收入记多栏还是三栏
  • 以前年度的费用忘记入账怎么办
  • 企业应付账款的借方余额反映的是
  • 营业外收入主要来源
  • 预付账款无法取得发票如何做账
  • 会计凭证审核标准有哪些
  • 固定资产明细账范本
  • MySQL修改root账号密码的方法
  • mysql 5.7.33安装
  • 微软推出新系统发布会
  • ubuntu无法正常开机
  • 比较常见的成语有哪些
  • win7大小写提示图标
  • win8.1桌面图标消失
  • Win10预览版拆弹
  • win10系统应用更新
  • 常见的css样式
  • unity游戏开发入门经典
  • css渐变文本效果在哪
  • python排列代码
  • node作为中间件做接口转发
  • unity给物体添加重力
  • 财税刘毅
  • 国家税务总局,河北省税务局
  • 电子税务局财务报表利润表本期金额
  • 税务总局地位
  • 医保断交一年怎么续交
  • 个人所得税选择那种方式更好
  • 杭州没有户口可以上幼儿园吗
  • 13%增值税发票怎么抵扣
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设