位置: IT常识 - 正文

pytorch对已有模型的更改(常用的操作)(pytorch model.module)

编辑:rootadmin
pytorch对已有模型的更改(常用的操作)

推荐整理分享pytorch对已有模型的更改(常用的操作)(pytorch model.module),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:pytorch有哪些模型,pytorch model.predict,pytorch_model.bin,pytorch model.predict,pytorch_model.bin,pytorch modules,pytorch model.parameters,pytorch model.module,内容如对您有帮助,希望把文章链接给更多的朋友!

本文会做经常性的更改,如有错误或者其他补充的,请各位大佬不吝指点。

如图所示为我们的示例输出的网络结构。

引入创建的模型:

import torchimport simple_modulemod = simple_module.Module()

一、模型的保存与读取

1.整个模型的保存与读取

# 保存整个模型torch.save(mod, '../parameters/mod.pth')# 读取整个模型mod_load = torch.load('../parameters/mod.pth')

2.模型参数的保存与读取(以字典方式保存和读取)

# # 保存模型的参数(以字典的方式保存)torch.save(mod.state_dict(), '../parameters/mod_parameter.pth')# 查看保存了哪些参数print(mod.state_dict().keys())print(mod.state_dict()['feature.0.0.bias'])# 读取模型的参数(以字典的方式读取)mod.load_state_dict(torch.load('../parameters/mod_parameter.pth'))odict_keys(['feature.0.0.weight', 'feature.0.0.bias', 'feature.0.1.weight','feature.0.1.bias', 'feature.0.1.running_mean', 'feature.0.1.running_var', 'feature.0.1.num_batches_tracked', 'feature.1.0.weight', 'feature.1.0.bias', 'feature.1.1.weight', 'feature.1.1.bias', 'feature.1.1.running_mean', 'feature.1.1.running_var', 'feature.1.1.num_batches_tracked', 'classifier.1.weight','classifier.1.bias'])tensor([-0.1721, -0.1222, 0.1023, -0.1484, -0.0547, -0.1922, -0.0796, -0.1784, -0.0233, -0.0271, -0.1018, 0.1875])pytorch对已有模型的更改(常用的操作)(pytorch model.module)

二、模型更改某一层

# 模型修改某一层mod.classifier[1] = torch.nn.Linear(in_features=3072, out_features=20, bias=True)

三、模型删除某些层

# 删除某一层,可以将该层设置为空序列mod.classifier[1] = torch.nn.Sequential()# 可以采用切片的方式删除,这样删除更加彻底mod.classifier = torch.nn.Sequential(*list(mod.classifier.children())[:-1])# 或者直接删除mod.classifier.__delattr__('1')

四、模型添加层(貌似只能在某一个块的末尾添加,后续再查找资料,有大佬可以指点一下)

# 模型添加层mod.classifier.add_module(name='liner', module=torch.nn.Linear(in_features=3072, out_features=100, bias=True))

五、冻结某些层,使得训练时不进行参数更行

1.冻结某一层

# 冻结某一层mod.feature[0][0].weight.requires_grad = False

2.冻结所有的参数

# 冻结所有的参数for param in mod.parameters(): param.requires_grad = False

3.冻结前面某部分的参数,可先将参数名称罗列出来,然后选择一部分的参数名称,利用参数的名称进行冻结。这种方式可以任意地冻结自己想要冻结的层。

no_grad = []for name, value in mod.named_parameters(): # print(name) no_grad.append(name)no_grad = no_grad[:-4]for name, value in mod.named_parameters(): if name in no_grad: value.requires_grad = False else: value.requires_grad = True

 4.还有一种方式,就是只冻结前面几层

i = 0for name, value in mod.named_parameters(): value.requires_grad = False i = i + 1 if i == 4: break;

或者

model_parameters = model.named_parameters()for i in range(freeze): name, value = next(model_parameters) value.requires_grad = False

这是我目前想到的一个方法,还有其他方法的请大佬不吝指点。 

无论哪种方式,都是将对应层的weight的requires_grad设置为False。

5.最后还需要给优化器设置过滤器

# 定义一个fliter,只传入requires_grad=True的模型参数optimizer = optim.SGD(filter(lambda p : p.requires_grad, mod.parameters()), lr=1e-2)
本文链接地址:https://www.jiuchutong.com/zhishi/288943.html 转载请保留说明!

上一篇:vue表单验证rules以及validator验证器的使用(vue表单验证数字)

下一篇:厄勒布鲁附近湖上的仲夏之光,瑞典 (© Anders Jorulf/Getty Images)(厄勒布鲁赛程500)

  • 代扣代缴境外增值税可以抵扣
  • 公司收到待报解预算收入会计分录
  • 应收账款余额百分比法会计分录
  • 无形资产计提折旧是当月还是次月
  • 视同销售的销售额如何确定
  • 三栏式明细账月结
  • 保险企业汇算清缴规定
  • 小规模纳税人申请一般纳税人流程
  • 账务处理和税前扣除如何处理
  • 邀请境外机构提出申请
  • 提供有形动产租赁服务适用税率为13%
  • 货物的运输费用怎么算
  • 预付账款是
  • 企业怎么申请无运输工具承运资质
  • 自行开发的软件如何确认为无形资产
  • 临时工工资作为人员成本如何做账
  • 外单位人员能在单位借款吗
  • 残保金补报
  • 常见的审计调整事项
  • 钢结构施工速度快吗
  • 账面销项税额与申报表不一致怎么处理
  • 小规模普通发票可以抵扣吗
  • 商誉减值测试的方法有哪些
  • 账面上挂的其他应付款怎么冲平?
  • win10更新补丁怎么关闭
  • 劳务费和服务费一样吗
  • bios设置光驱为第一启动项
  • 银行承兑汇票有纸质的吗
  • 赔绿化损失费的法律依据
  • 公积金补缴上月算断缴吗
  • 材料暂估的会计分录怎么做
  • vmware10虚拟机安装
  • 仓储费计入存货成本吗
  • iframe更改自身src
  • 混合筹资的定义
  • 工业企业制造费用核算范围
  • 收到短期借款会计分录怎么写
  • 没有审计报告的情况说明
  • php获取表单数据的方法和区别
  • 港股上市公司股票代码
  • 应收代垫款
  • 增值税进项税如何申报
  • 查账征收利润50万交多少税
  • 税控盘全额抵扣政策
  • sql server异常怎么处理
  • mac怎么下载postman
  • mongodb4
  • 运输公司汽车折旧能直接进主营成本吗
  • 盈余公积提取多了
  • 进项税转出年底怎么结转
  • 多计提的城建税怎么冲减
  • 公司接待考察团的费用入哪个科目
  • 工程进度开票如何入账
  • 印花税退还
  • 给职工发放的米面油记入什么
  • 贴发票要按时间顺序吗
  • Linux CentOS MySQL数据库安装配置教程
  • MySql 5.6.35 winx64 安装详细教程
  • 深度Win7 64位系统默认输入法图标如何个性化设置
  • windf9
  • linux 图形
  • 重装win7系统后鼠标键盘不能用
  • iptables用法
  • win7系统安全软件
  • window无法正常启动怎么办
  • unity接入安卓sdk
  • 直线画画
  • js实现日历效果
  • Please ensure that adb is correctly located at 'D:Androidandroid-sdkplatform-toolsadb.exe' and
  • python标准库参考手册
  • Android之Service
  • html5table
  • 新疆省国税局
  • 飞机票其他税费包括什么内容
  • 陕西地方水利建设基金减免政策2023
  • 个人所得税完税证明怎么开具
  • 江苏发票真伪查询系统官网
  • 办理供票资格申请
  • 以房产作价投资增值税怎么算
  • 商品房增值税如何算
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设