位置: IT常识 - 正文

ChatGLM-6B (介绍以及本地部署)

编辑:rootadmin
ChatGLM-6B (介绍以及本地部署) 中文ChatGPT平替——ChatGLM-6BChatGLM-6B简介官方实例本地部署1.下载代码2.通过conda创建虚拟环境3.修改代码4.模型量化5.详细代码调用示例ChatGLM-6B简介

推荐整理分享ChatGLM-6B (介绍以及本地部署),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

ChatGLM-6B (介绍以及本地部署)

ChatGLM 参考了 ChatGPT 的设计思路,在千亿基座模型 GLM-130B1 中注入了代码预训练,通过有监督微调(Supervised Fine-Tuning)等技术实现人类意图对齐。ChatGLM 当前版本模型的能力提升主要来源于独特的千亿基座模型 GLM-130B。它是不同于 BERT、GPT-3 以及 T5 的架构,是一个包含多目标函数的自回归预训练模型。2022年8月,我们向研究界和工业界开放了拥有1300亿参数的中英双语稠密模型 GLM-130B1,该模型有一些独特的优势:

双语: 同时支持中文和英文。高精度(英文): 在公开的英文自然语言榜单 LAMBADA、MMLU 和 Big-bench-lite 上优于 GPT-3 175B(API: davinci,基座模型)、OPT-175B 和 BLOOM-176B。高精度(中文): 在7个零样本 CLUE 数据集和5个零样本 FewCLUE 数据集上明显优于 ERNIE TITAN 3.0 260B 和 YUAN 1.0-245B。快速推理: 首个实现 INT4 量化的千亿模型,支持用一台 4 卡 3090 或 8 卡 2080Ti 服务器进行快速且基本无损推理。可复现性: 所有结果(超过 30 个任务)均可通过我们的开源代码和模型参数复现。跨平台: 支持在国产的海光 DCU、华为昇腾 910 和申威处理器及美国的英伟达芯片上进行训练与推理。

官方实例>>> from transformers import AutoTokenizer, AutoModel>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()>>> response, history = model.chat(tokenizer, "你好", history=[])>>> print(response)你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。>>> response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)>>> print(response)晚上睡不着可能会让你感到焦虑或不舒服,但以下是一些可以帮助你入睡的方法:1. 制定规律的睡眠时间表:保持规律的睡眠时间表可以帮助你建立健康的睡眠习惯,使你更容易入睡。尽量在每天的相同时间上床,并在同一时间起床。2. 创造一个舒适的睡眠环境:确保睡眠环境舒适,安静,黑暗且温度适宜。可以使用舒适的床上用品,并保持房间通风。3. 放松身心:在睡前做些放松的活动,例如泡个热水澡,听些轻柔的音乐,阅读一些有趣的书籍等,有助于缓解紧张和焦虑,使你更容易入睡。4. 避免饮用含有咖啡因的饮料:咖啡因是一种刺激性物质,会影响你的睡眠质量。尽量避免在睡前饮用含有咖啡因的饮料,例如咖啡,茶和可乐。5. 避免在床上做与睡眠无关的事情:在床上做些与睡眠无关的事情,例如看电影,玩游戏或工作等,可能会干扰你的睡眠。6. 尝试呼吸技巧:深呼吸是一种放松技巧,可以帮助你缓解紧张和焦虑,使你更容易入睡。试着慢慢吸气,保持几秒钟,然后缓慢呼气。如果这些方法无法帮助你入睡,你可以考虑咨询医生或睡眠专家,寻求进一步的建议。本地部署1.下载代码git clone https://github.com/THUDM/ChatGLM-6B.git2.通过conda创建虚拟环境# 新建chatglm环境conda create -n chatglm python=3.8# 激活chatglm环境conda activate chatglm# 安装PyTorch环境(根据自己的cuda版本选择合适的torch版本)pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113# 安装gradio用于启动图形化web界面pip install gradio# 安装运行依赖pip install -r requirement.txt3.修改代码在web_demo.py的最后一句demo.queue().launch(share=True),加两个server_name=“0.0.0.0”, server_port=1234参数。demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)4.模型量化

默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:

GPU# FP16精度加载,需要13G显存model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()# int8精度加载,需要10G显存model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(8).cuda()# int4精度加载,需要6G显存model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()CPU#32G内存model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).float()#16G内存model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).bfloat16()5.详细代码from transformers import AutoModel, AutoTokenizerimport gradio as grtokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)# model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()# 按需修改,目前只支持 4/8 bit 量化model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()model = model.eval()MAX_TURNS = 20MAX_BOXES = MAX_TURNS * 2def predict(input, history=[]): response, history = model.chat(tokenizer, input, history) updates = [] for query, response in history: updates.append(gr.update(visible=True, value=query)) updates.append(gr.update(visible=True, value=response)) if len(updates) < MAX_BOXES: updates = updates + [gr.Textbox.update(visible=False)] * (MAX_BOXES - len(updates)) return [history] + updateswith gr.Blocks() as demo: state = gr.State([]) text_boxes = [] for i in range(MAX_BOXES): if i % 2 == 0: label = "提问:" else: label = "回复:" text_boxes.append(gr.Textbox(visible=False, label=label)) with gr.Row(): with gr.Column(scale=4): txt = gr.Textbox(show_label=False, placeholder="Enter text and press enter").style(container=False) with gr.Column(scale=1): button = gr.Button("Generate") button.click(predict, [txt, state], [state] + text_boxes)demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)调用示例

本文链接地址:https://www.jiuchutong.com/zhishi/295855.html 转载请保留说明!

上一篇:用JavaScript实现文件的上传与下载(javascript编写程序)

下一篇:全网详细解决Set-Location : 找不到接受实际参数“xxx”的位置形式参数。 所在位置 行:1 字符: 1的错误,并深究该错误的原因。(set0)

  • 苹果怎么设置录视频功能(苹果怎么设置录屏的清晰度)

    苹果怎么设置录视频功能(苹果怎么设置录屏的清晰度)

  • 三星s8充电太慢怎么调整(三星s8充电慢解决方法)

    三星s8充电太慢怎么调整(三星s8充电慢解决方法)

  • wps发送文档咋是个问号(wps发送文档咋是乱码了)

    wps发送文档咋是个问号(wps发送文档咋是乱码了)

  • 八位数qq多少年的(八位数qq号的人大概多大的年龄)

    八位数qq多少年的(八位数qq号的人大概多大的年龄)

  • iphonese支持无线充电吗(iphonese可以用无线充电吗)

    iphonese支持无线充电吗(iphonese可以用无线充电吗)

  • 为什么苹果更新不了13.5(为什么苹果更新系统后北京公交app闪退)

    为什么苹果更新不了13.5(为什么苹果更新系统后北京公交app闪退)

  • 手机无线装置已关闭怎么回事(手机无线装置已关闭是什么意思)

    手机无线装置已关闭怎么回事(手机无线装置已关闭是什么意思)

  • 华为p40是双系统吗

    华为p40是双系统吗

  • 抖音号多久可以改一次(抖音号多久可以注销成功)

    抖音号多久可以改一次(抖音号多久可以注销成功)

  • 滴滴账号正常听不到单(滴滴为什么老是听单异常)

    滴滴账号正常听不到单(滴滴为什么老是听单异常)

  • 打电话没网络怎么解决(打电话没网络怎么弄)

    打电话没网络怎么解决(打电话没网络怎么弄)

  • usb配件是什么意思(usb配件在哪里打开)

    usb配件是什么意思(usb配件在哪里打开)

  • 高德用的北斗还是gps(高德地图使用的是北斗)

    高德用的北斗还是gps(高德地图使用的是北斗)

  • 小米怎么打开开发者选项(小米如何打开)

    小米怎么打开开发者选项(小米如何打开)

  • 手机上出现耳机模式怎么取消(手机上出现耳机模式没有声音)

    手机上出现耳机模式怎么取消(手机上出现耳机模式没有声音)

  • 手机qq怎么查多少人特别关心我(手机qq怎么查多年的好友)

    手机qq怎么查多少人特别关心我(手机qq怎么查多年的好友)

  • 为什么趣步认证老是失败(趣步为什么要改名字)

    为什么趣步认证老是失败(趣步为什么要改名字)

  • airpods pro怎么切歌(airpods pro怎么切换歌曲)

    airpods pro怎么切歌(airpods pro怎么切换歌曲)

  • 华为分屏功能怎么使用(华为分屏功能怎么使用视频)

    华为分屏功能怎么使用(华为分屏功能怎么使用视频)

  • 微信文件损坏什么情况(微信出现文件损坏是手机的事还是微信的事)

    微信文件损坏什么情况(微信出现文件损坏是手机的事还是微信的事)

  • 戴尔g7 风扇能设置吗(戴尔g7 风扇能设置转速吗)

    戴尔g7 风扇能设置吗(戴尔g7 风扇能设置转速吗)

  • 拼多多销量排名怎么算(拼多多销量排名第一有用吗)

    拼多多销量排名怎么算(拼多多销量排名第一有用吗)

  • 淘集集二维码在哪里看(淘集集东西能买吗)

    淘集集二维码在哪里看(淘集集东西能买吗)

  • 苹果8p充电口防水吗(苹果8p充电口进水了怎么办)

    苹果8p充电口防水吗(苹果8p充电口进水了怎么办)

  • win10适配器wlan不见了(win10 wifi适配器)

    win10适配器wlan不见了(win10 wifi适配器)

  • 抖音怎么看上热门了(抖音怎么看上热门了没有)

    抖音怎么看上热门了(抖音怎么看上热门了没有)

  • 在excel中,单元格地址是指(在excel中单元格的条件格式在什么菜单中)

    在excel中,单元格地址是指(在excel中单元格的条件格式在什么菜单中)

  • Win11截图工具“此应用程序无法打开”怎么办?(附解决方法)(Win11截图工具怎么设置快捷键)

    Win11截图工具“此应用程序无法打开”怎么办?(附解决方法)(Win11截图工具怎么设置快捷键)

  • HelpHost.exe进程查询 HelpHost是什么进程 有什么作用(windows 查询进程)

    HelpHost.exe进程查询 HelpHost是什么进程 有什么作用(windows 查询进程)

  • 漫天花雨HTML特效+3D相册(漫天花雨异闻)

    漫天花雨HTML特效+3D相册(漫天花雨异闻)

  • Windows OpenGL 图像曝光度调节(opengl开发图形界面)

    Windows OpenGL 图像曝光度调节(opengl开发图形界面)

  • 劳动收入与报酬的具体形式有哪些
  • 总公司汇总缴纳所得税升为一般纳税人分公司受影响吗
  • 公司刻一套章子多少钱
  • 房地产土地增值税计税依据
  • 公司从个人手中租房不能取得发票
  • 怎么填报清算所得税申报表?
  • 土地前期开发费用计征契税
  • 用银行存款上交各种税费
  • 补税款的分录应该怎么写
  • 认缴制需要多久交完
  • 金税盘要钱不
  • 印花税按主营业务成本计算吗
  • 发票普票冲红
  • 未结转是什么意思
  • 水费差额征税税率
  • 未计提印花税会计分录
  • 个体户怎
  • 如何查看本机的ip 网关 和dns配置
  • 临时股东大会的召开情形
  • 联想随身充评测
  • 进口应税消费品会计分录
  • 抵扣联和发票联丢失怎么办
  • 国企收到财政补贴
  • 运输企业成本核算内容有哪些?
  • 备用金会涨额度吗
  • 在Yii2特定页面如何禁用调试工具栏Debug Toolbar详解
  • yii框架连接数据库
  • 到2023年
  • 常用的绘图比例有哪些?
  • 学python真的好就业吗
  • wallengine
  • php文件上传下载代码
  • php功能实现
  • 兼职工作是单位工作吗
  • 税控会计分录
  • 农民工工资专用账户打款比例
  • 其他综合收益在资产负债表中如何填列
  • phpcms怎么用
  • 帝国cms破解授权
  • kppw源码
  • okhttp源码
  • 模具费收入计入什么科目
  • PostgreSQL中的OID和XID 说明
  • 企业发生的职工福利费支出,不超过工资
  • 一般纳税人可以给小规模开专票吗
  • 增值税税负率是多少
  • 餐饮赠送的菜品需要缴税吗
  • 不动产初始登记证明
  • 资产负债表的作用体现在哪些方面
  • 材料自产自销的会计科目
  • 参展企业收到展览费用
  • 一般纳税人主表中的25是怎么来的
  • 普通发票的开具是怎样?
  • 财政登记证取消了吗
  • 新会计准则待摊费用还有吗
  • 赠送客户的商品怎么入账
  • 会计账务做得混乱的原因
  • 如何安装win2000
  • 手机苹果操作系统
  • mac book视频
  • centos which
  • ebr.ahrcu
  • linux服务器的mac地址怎么查
  • linux常用命令cat
  • linux windows转linux
  • win系统找回删除文件
  • 免安装版怎么用
  • 安卓笔记软件squid使用教程
  • android 动态布局
  • 批处理setlocal
  • node.js解析excel
  • 简述javascript
  • python多线程操作
  • unity中播放视频
  • unity mul函数
  • javascript !
  • android常见问题及解决方法
  • 税收效应分析供求曲线
  • 杭州市税务局举报
  • 刚成立小公司的流程
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设