位置: IT常识 - 正文

训练自己的GPT2-Chinese模型(训练自己的GPT)

编辑:rootadmin
训练自己的GPT2-Chinese模型 文章目录效果抢先看准备工作环境搭建创建虚拟环境训练&预测项目结构模型预测续写训练模型遇到的问题及解决办法显存不足生成的内容一样文末效果抢先看

推荐整理分享训练自己的GPT2-Chinese模型(训练自己的GPT),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:训练自己的GPT模型,训练自己的GPT模型,训练自己的gpt 问答库,训练自己的大语言模型,训练自己的GPT模型,训练自己的GPT,训练自己的gpt模型有什么用,训练自己的gpt模型有什么用,内容如对您有帮助,希望把文章链接给更多的朋友!

准备工作

从GitHub上拉去项目到本地,准备已训练好的模型百度网盘:提取码【9dvu】。

gpt2对联训练模型gpt2古诗词训练模型gpt2通用中文模型gpt2通用中文小模型gpt2文学散文训练模型gpt2中文歌词模型环境搭建配置好GPU的pytorch环境 a. 安装Anaconda环境 b. NIVIDA配置流程 桌面右键鼠标,找到NVIDIA控制面板,在左边找到开发者下管理GPU性能计数器,导航栏点击桌面选择启用开发者设置,弹出的系统信息中找到组件,找到产品名前缀为NVIDIA CUDA的那一条,记住其后面的版本号。 c. 进入NVIDIA官网下载CUDA,找到上一步记录的NVIDIA CUDA后的版本号相对应的链接。如版本信息为11.4就选择11.4 d. 下载完点击安装就行了 e. 安装cuDNN,选择相应的版本。这个地方要登录账号,没有账号可以注册,也可以选择QQ或微信登录,选择刚才的CUDA版本,下载压缩包 f. 下载完成后解压缩,并修改根目录名为cudnn g. 将整个文件复制到xxx\NVIDIA GPU Computing Toolkit\CUDA\v11.4目录下 h. 设置变量环境,添加两个环境变量路径,根据自己的实际情况目录修改

pytorch配置 a. 去pytorch官网找到相应的gpu版本或cpu版本,找到后安装命令会出现在command栏 找不到自己的版本点击previous version链接 b. 使用管理员身份执行cmd,否则会安装失败

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

安装完成之后执行命令conda list查看是否安装成功

训练自己的GPT2-Chinese模型(训练自己的GPT)

打开终端输入python,使用以下代码查看torch显示GPU不可用状态

>>>import torch>>>torch.cuda.is_available()False

c. 标准查看torch版本

>>>import torch>>>torch.__version__1.10.2

pytorch轮子配置 a. whl轮子配置,根据CUDA版本选择相应的版本。其中cu表示GPU版本,cpu表示CPU版本 b. 下载完成之后本地使用pip install 安装

pip install .\torchvision-0.13.1+cpu-cp39-cp39-win_amd64.whlpip install .\torch-1.10.2+cu113-cp39-cp39-win_amd64.whl

c. 安装完成之后验证torch

>>>import torch>>>torch.cuda.is_available()True创建虚拟环境为了能够顺利使用环境,推荐使用python3.7.1版本conda create -n venv_name python=3.7.1激活 虚拟环境conda activate venv_namepip安装所需库pip install transformers==2.1.1pip install tensorflow==2.0.0 pip install numpypip install tqdmpip install sklearnpip install keraspip install tb-nightlypip install futurepip install thulacpip install setuptools==59.5.0pip install torch==1.10.2+cu113 torchvision==0.3.0 --extra-index-url 训练&预测项目结构config: 存放模型的配置文件data: 存放训练数据model: 存放模型cache: 用于模型训练之前的数据预处理sample: 用于存放生成样本的目录generate.py: 生成代码train.py: 训练多文本启动代码train_single.py: 训练但文本启动代码tokenizations: 用于文本数据转换tokenizations的脚本模型预测续写

参数说明:

length: 生成的最长长度prefix: 文章开头fast_pattern: 快速生成模式save_samples: 保存生成文本结果的位置temperature: 越小越遵循训练样本,续写的内容的思维越发散# 通用模型预测文本python ./generate.py --length=100 --nsamples=4 --prefix=天津是一座美丽的城市。 --fast_pattern --save_samples ----model_path=model/use_model --model_config=config/model_config_small.json --topk=8 --temperature=0.8 --batch_size=2# 制定模型输出python ./generate.py --length=300 --nsamples=4 --prefix=萧炎,斗之力。 --fast_pattern --save_samples --model_path=model/model_epoch18 --model_config=model/model_epoch18/config.json --topk=8 --temperature=1 --batch_size=1

其他参数参考:

训练模型

将训练语料以train.json的格式放入data目录中

如果文件格式为train.json格式,那么将train.py文件中的读取方式为:lines = json.load(f) 如果文件格式为train.txt格式,即数据格式为[”正文1“, ”正文2“, ”正文3“],那么将train.py文件中的读取方式为:lines = f.readlines()

运行train.py文件并设定--raw参数,会自动预处理数据,预处理完成之后,会自动执行训练。

python train.py --raw遇到的问题及解决办法显存不足语料太大:在config文件中选择小一点的json文件batch_size过大:默认训练是8,可以改成4或者6尝试生成的内容一样修改generate.py中的batch_size=1文末

此训练结果生成比较简单的文章还可以,但是需要达到理想的效果,还需要更大的数据体系和语料以及长期的模型训练,基于原有的算法二次开发,门槛也比较高,而且这种业务比较吃硬件资源。

本文链接地址:https://www.jiuchutong.com/zhishi/298719.html 转载请保留说明!

上一篇:路由懒加载及实现方式(vue-router)(路由加载的几种方式)

下一篇:2022前端面经---改变this指向问题(call、apply、bind)(2021年前端面试)

  • 淘宝怎么绑定支付宝(淘宝怎么绑定支付宝账户)

    淘宝怎么绑定支付宝(淘宝怎么绑定支付宝账户)

  • 华为p40来电闪光灯如何设置(华为p40来电闪光灯怎么弄)

    华为p40来电闪光灯如何设置(华为p40来电闪光灯怎么弄)

  • cad圆怎么等分(cad圆怎么等分后怎么测量)

    cad圆怎么等分(cad圆怎么等分后怎么测量)

  • 一淘邀请别人有什么奖励(一淘邀请好友有提成吗)

    一淘邀请别人有什么奖励(一淘邀请好友有提成吗)

  • 外观方正有棱角的手机(外观方正有棱角的笔记本)

    外观方正有棱角的手机(外观方正有棱角的笔记本)

  • 华为手机开机出现绿色机器人(查找我的华为手机)

    华为手机开机出现绿色机器人(查找我的华为手机)

  • 苹果漏电如何检查(iphone漏电怎么修)

    苹果漏电如何检查(iphone漏电怎么修)

  • 微信对方拒收是拉黑了吗(微信对方拒收是拉黑了还是删除了)

    微信对方拒收是拉黑了吗(微信对方拒收是拉黑了还是删除了)

  • 照片hdr是什么意思(照片中hdr)

    照片hdr是什么意思(照片中hdr)

  • 苹果手机怎么切换听筒和扬声器(苹果手机怎么切换手写输入法)

    苹果手机怎么切换听筒和扬声器(苹果手机怎么切换手写输入法)

  • 在关系数据模型中域是指(在关系数据模型中通常可以把什么称为属性)

    在关系数据模型中域是指(在关系数据模型中通常可以把什么称为属性)

  • vivox27的ai键是什么(vivox23的ai键是什么)

    vivox27的ai键是什么(vivox23的ai键是什么)

  • 电子保修卡激活啥意思(电子保修卡激活后可以撤回吗)

    电子保修卡激活啥意思(电子保修卡激活后可以撤回吗)

  • 为什么抖音没有美颜功能(为什么抖音没有点赞作品推荐给朋友)

    为什么抖音没有美颜功能(为什么抖音没有点赞作品推荐给朋友)

  • 怎样二次修改微信账号(如何二次更改vx号)

    怎样二次修改微信账号(如何二次更改vx号)

  • 苹果手机怎么设置黑名单(苹果手机怎么设置门禁卡NFC)

    苹果手机怎么设置黑名单(苹果手机怎么设置门禁卡NFC)

  • 手机上怎么买动车票(手机上怎么买动车学生票)

    手机上怎么买动车票(手机上怎么买动车学生票)

  • 抖音有没有已读功能(抖音有没有读弹幕的人)

    抖音有没有已读功能(抖音有没有读弹幕的人)

  • 蓝牙耳机tws是什么意思(tws蓝牙耳机百度百科)

    蓝牙耳机tws是什么意思(tws蓝牙耳机百度百科)

  • 手机锁屏时间在哪里设置(华为手机设置锁屏时间在哪里)

    手机锁屏时间在哪里设置(华为手机设置锁屏时间在哪里)

  • 微信手机通讯录怎么关闭(微信手机通讯录好友怎么关闭)

    微信手机通讯录怎么关闭(微信手机通讯录好友怎么关闭)

  • 8p双卡双待吗(iphone 8p 双卡双待)

    8p双卡双待吗(iphone 8p 双卡双待)

  • 华为nova5是无线充电吗(华为nova 5有没有无线充电)

    华为nova5是无线充电吗(华为nova 5有没有无线充电)

  • word如何显示修改痕迹(word如何显示修改人的名字)

    word如何显示修改痕迹(word如何显示修改人的名字)

  • SchSvr.exe - SchSvr是什么进程  有什么作用

    SchSvr.exe - SchSvr是什么进程 有什么作用

  • 资产负债表债务法是什么意思
  • 个税里的工资薪金
  • 主营业务收入科目按其所反映的经济内容不同
  • 公司向法人借款会计分录
  • 公司车辆过户给个人需要交多少税
  • 学校食堂支出
  • 销项发票导出是什么意思
  • 全年一次性奖金税收计算器
  • 转租不动产需要预缴增值税吗
  • 小规模增值税做那个费用科目
  • 应付账款多计怎么处理
  • 应收账款客户少了几毛没有付怎么处理
  • 企业中由特定人员所承担的一项
  • 税务是如何处理违章的
  • 减免所得税额和抵免所得税额的区别
  • 营改增后二手房转让 一般计税 可以差额
  • 个体纳税申报核定销售额填不填
  • 其他应付款不需要支付是债务重组么
  • 增值税预缴税款表项目编号是什么
  • 营业执照原件丢失后果
  • 代开专票不满10万的要交附加吗?
  • 垃圾费随水费征收
  • 收购发票哪一联做帐
  • 劳务公司怎么做进项
  • window10解压
  • php require的用法
  • timit数据集
  • win7系统安装包多大
  • php 正则表达式
  • 转回已核销的坏账
  • 蒙特雷景点
  • composer安装不知道这样的主机
  • php+mysql+jquery实现日历签到功能
  • php递归算法1加到100
  • 发票校验码不清晰
  • zgrep命令详解
  • bg命令 将作业放到后台运行
  • hash操作
  • phpcms模块
  • 营业执照贴印花税票吗
  • 税务自查报告要盖什么章
  • 利润分配的基本原则是( )
  • mongodb简单使用
  • 织梦tag标签怎么用
  • 物品数量怎么填写
  • 最新减免税申报表填写举例
  • 接受现金捐赠怎么做会计分录
  • 销售商品成本核算
  • 房屋建筑物固定资产标牌图片
  • 制造费用折旧费编码
  • 股东退股取现怎么处理
  • 公司注销退回投资款如何账务处理
  • 固定资产计提完折旧报废的账务处理
  • 防伪税控服务费全额抵扣政策
  • 总账的建账过程
  • 合法有效的凭证是什么
  • mysql性能比较
  • MySQL 5.5.x my.cnf参数配置优化详解
  • mysql中binlog_format模式与配置详细分析
  • Sqlserver聚集索引和非聚集索引的区别
  • windows正版光盘
  • linux rootkit查杀
  • windows的小技巧
  • 重装系统开机出现几个系统
  • 歌词特效是怎么弄的
  • Linux如何使用命令
  • 使用jQuery获取data-的自定义属性
  • 音频焦点是什么
  • windows恢复版本
  • html里id
  • Linux CentOS系统下安装node.js与express的方法
  • 增值税纳税申报表附列资料(一)
  • 黑龙江税务局副局长
  • 个人可以免费开店的平台有哪些
  • 广州市番禺区国丹信息管理有限公司
  • 深圳国税app官方下载
  • 税收优惠政策有经营和居民住宅出租
  • 深圳国税系统
  • 服务承诺口号八个字
  • 草地耕地占用税征收标准
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设