位置: IT常识 - 正文

MMDetection系列 | 5. MMDetection运行配置介绍(mmdetection optimizer)

编辑:rootadmin
MMDetection系列 | 5. MMDetection运行配置介绍

推荐整理分享MMDetection系列 | 5. MMDetection运行配置介绍(mmdetection optimizer),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mmdetection中文手册,mmdetection中文手册,mmdetection optimizer,mmdetection resume,mmdetection介绍,mmdetection介绍,mmdetection详解,mmdetection介绍,内容如对您有帮助,希望把文章链接给更多的朋友!

如有错误,恳请指出。

开门见山,基于mmdet的官方文档直接介绍如何进行我们的运行配置。个人觉得,继承于default_runtime.py这个文件之后,主要需要自己稍微更改下的配置主要有7个,分别是:优化器配置、学习率配置、工作流程配置、检查点配置、日志配置、评估配置、训练设置。具体的配置流程如下所示。

如果需要其他钩子函数的实现与配置,具体可以查看参考资料1.

文章目录1. 优化器配置2. 学习率配置3. 工作流程配置4. 检查点配置5. 日志配置6. 评估配置7. 训练设置1. 优化器配置optimizer = dict(type='SGD', lr=0.02, momentum=0.9, weight_decay=0.0001)optimizer_config = dict(grad_clip=None)使用梯度剪辑来稳定训练optimizer_config = dict( _delete_=True, grad_clip=dict(max_norm=35, norm_type=2))

其中,_delete_=True将用新键替换backbone字段中的所有旧键

2. 学习率配置lr_config = dict( policy='step', warmup='linear', warmup_iters=500, warmup_ratio=0.001, step=[8, 11]) # 表示初始学习率在第8和11个epoch衰减10倍

还有其他的配置方案:

Poly schedulelr_config = dict(policy='poly', power=0.9, min_lr=1e-4, by_epoch=False)ConsineAnnealing schedulelr_config = dict( policy='CosineAnnealing', warmup='linear', warmup_iters=1000, warmup_ratio=1.0 / 10, min_lr_ratio=1e-5)使用动量调度加速模型收敛

支持动量调度器根据学习率修改模型的动量,这可以使模型以更快的方式收敛。Momentum 调度器通常与 LR 调度器一起使用

lr_config = dict( policy='cyclic', target_ratio=(10, 1e-4), cyclic_times=1, step_ratio_up=0.4,)momentum_config = dict( policy='cyclic', target_ratio=(0.85 / 0.95, 1), cyclic_times=1, step_ratio_up=0.4,)3. 工作流程配置

工作流是 (phase, epochs) 的列表,用于指定运行顺序和时期。默认情况下,它设置为:

workflow = [('train', 1)]

这意味着运行 1 个 epoch 进行训练。有时用户可能想要检查验证集上模型的一些指标(例如损失、准确性)。在这种情况下,我们可以将工作流设置为

[('train', 1), ('val', 1)]

这样 1 个 epoch 的训练和 1 个 epoch 的验证将被迭代运行。而验证集的损失同样会被计算出来。如果想先进行验证,再进行训练,还可以设置如下:

[('val', 1), ('train', n)]

这样设置表示先对验证集进行验证与损失计算,再进行n个epoch的计算。

4. 检查点配置checkpoint_config = dict(interval=20) # 20个epoch保存一次权重

参数说明见:https://mmcv.readthedocs.io/en/latest/api.html#mmcv.runner.CheckpointHook

CLASSmmcv.runner.CheckpointHook(interval: int = - 1, by_epoch: bool = True, save_optimizer: bool = True, out_dir: Optional[str] = None, max_keep_ckpts: int = - 1, save_last: bool = True, sync_buffer: bool = False, file_client_args: Optional[dict] = None, **kwargs)

interval (int) – The saving period. If by_epoch=True, interval indicates epochs, otherwise it indicates iterations. Default: -1, which means “never”.by_epoch (bool) – Saving checkpoints by epoch or by iteration. Default: True.save_optimizer (bool) – Whether to save optimizer state_dict in the checkpoint. It is usually used for resuming experiments. Default: True.out_dir (str, optional) – The root directory to save checkpoints. If not specified, runner.work_dir will be used by default. If specified, the out_dir will be the concatenation of out_dir and the last level directory of runner.work_dir. Changed in version 1.3.16.max_keep_ckpts (int, optional) – The maximum checkpoints to keep. In some cases we want only the latest few checkpoints and would like to delete old ones to save the disk space. Default: -1, which means unlimited.save_last (bool, optional) – Whether to force the last checkpoint to be saved regardless of interval. Default: True.sync_buffer (bool, optional) – Whether to synchronize buffers in different gpus. Default: False.file_client_args (dict, optional) – Arguments to instantiate a FileClient. See mmcv.fileio.FileClient for details. Default: None. New in version 1.3.16.5. 日志配置MMDetection系列 | 5. MMDetection运行配置介绍(mmdetection optimizer)

包装多个记录器log_config挂钩并允许设置间隔。现在 MMCV 支持WandbLoggerHook、MlflowLoggerHook和TensorboardLoggerHook.

log_config = dict( interval=50, # 每500个迭代就打印一次训练信息 hooks=[ dict(type='TextLoggerHook'), # dict(type='TensorboardLoggerHook') ])

参数说明见:https://mmcv.readthedocs.io/en/latest/api.html#mmcv.runner.EvalHook

CLASSmmcv.runner.LoggerHook(interval: int = 10, ignore_last: bool = True, reset_flag: bool = False, by_epoch: bool = True)[SOURCE]

interval (int) – Logging interval (every k iterations). Default 10.ignore_last (bool) – Ignore the log of last iterations in each epoch if less than interval. Default True.reset_flag (bool) – Whether to clear the output buffer after logging. Default False.by_epoch (bool) – Whether EpochBasedRunner is used. Default True.6. 评估配置

配置的evaluation将用于初始化EvalHook. 除了 key interval,其他参数如metric将传递给dataset.evaluate() evaluation = dict(interval=1, metric=‘bbox’)

参数说明:https://mmcv.readthedocs.io/en/latest/api.html?highlight=EpochBasedRunner#mmcv.runner.EpochBasedRunner

mmcv.runner.EvalHook(dataloader: torch.utils.data.dataloader.DataLoader, start: Optional[int] = None, interval: int = 1, by_epoch: bool = True, save_best: Optional[str] = None, rule: Optional[str] = None, test_fn: Optional[Callable] = None, greater_keys: Optional[List[str]] = None, less_keys: Optional[List[str]] = None, out_dir: Optional[str] = None, file_client_args: Optional[dict] = None, **eval_kwargs)

dataloader (DataLoader) – A PyTorch dataloader, whose dataset has implemented evaluate function.start (int | None, optional) – Evaluation starting epoch. It enables evaluation before the training starts if start <= the resuming epoch. If None, whether to evaluate is merely decided by interval. Default: None.interval (int) – Evaluation interval. Default: 1.by_epoch (bool) – Determine perform evaluation by epoch or by iteration. If set to True, it will perform by epoch. Otherwise, by iteration. Default: True.save_best (str, optional) – If a metric is specified, it would measure the best checkpoint during evaluation. The information about best checkpoint would be saved in runner.meta[‘hook_msgs’] to keep best score value and best checkpoint path, which will be also loaded when resume checkpoint. Options are the evaluation metrics on the test dataset. e.g., bbox_mAP, segm_mAP for bbox detection and instance segmentation. AR@100 for proposal recall. If save_best is auto, the first key of the returned OrderedDict result will be used. Default: None.rule (str | None, optional) – Comparison rule for best score. If set to None, it will infer a reasonable rule. Keys such as ‘acc’, ‘top’ .etc will be inferred by ‘greater’ rule. Keys contain ‘loss’ will be inferred by ‘less’ rule. Options are ‘greater’, ‘less’, None. Default: None.test_fn (callable, optional) – test a model with samples from a dataloader, and return the test results. If None, the default test function mmcv.engine.single_gpu_test will be used. (default: None)greater_keys (List[str] | None, optional) – Metric keys that will be inferred by ‘greater’ comparison rule. If None, _default_greater_keys will be used. (default: None)less_keys (List[str] | None, optional) – Metric keys that will be inferred by ‘less’ comparison rule. If None, _default_less_keys will be used. (default: None)out_dir (str, optional) – The root directory to save checkpoints. If not specified, runner.work_dir will be used by default. If specified, the out_dir will be the concatenation of out_dir and the last level directory of runner.work_dir. New in version 1.3.16.file_client_args (dict) – Arguments to instantiate a FileClient. See mmcv.fileio.FileClient for details. Default: None. New in version 1.3.16.**eval_kwargs – Evaluation arguments fed into the evaluate function of the dataset.7. 训练设置runner = dict(type='EpochBasedRunner', max_epochs=150) # 设置模型训练多少次

参数说明:https://mmcv.readthedocs.io/en/latest/api.html#mmcv.runner.EpochBasedRunner

mmcv.runner.EpochBasedRunner(model: torch.nn.modules.module.Module, batch_processor: Optional[Callable] = None, optimizer: Optional[Union[Dict, torch.optim.optimizer.Optimizer]] = None, work_dir: Optional[str] = None, logger: Optional[logging.Logger] = None, meta: Optional[Dict] = None, max_iters: Optional[int] = None, max_epochs: Optional[int] = None)

总结:

一般来说,我们写配置文件都会继承default_runtime.py这个文件

_base_ = [ '../_base_/default_runtime.py']

这个文件的内容如下所示:

checkpoint_config = dict(interval=5) # 每5个epoch保存一次权重# yapf:disablelog_config = dict( interval=50, # 每500个迭代就打印一次训练信息 hooks=[ dict(type='TextLoggerHook'), # dict(type='TensorboardLoggerHook') ])# yapf:enablecustom_hooks = [dict(type='NumClassCheckHook')]dist_params = dict(backend='nccl')log_level = 'INFO'load_from = None # 加载权重文件resume_from = Noneworkflow = [('train', 1)]# disable opencv multithreading to avoid system being overloadedopencv_num_threads = 0# set multi-process start method as `fork` to speed up the trainingmp_start_method = 'fork'# Default setting for scaling LR automatically# - `enable` means enable scaling LR automatically# or not by default.# - `base_batch_size` = (8 GPUs) x (2 samples per GPU).auto_scale_lr = dict(enable=False, base_batch_size=16)

一般不需要更改太多的内容,可以时代的更改log_config进行合理的打印训练信息,还有设置checkpoint_config进行合理的保存权重文件,其他的设置按默认即可。

下面展示我继承了default_runtime.py后更改的内容,其实就是更改了以上我所介绍的七点内容:

_base_ = [ '../_base_/default_runtime.py']......# optimizeroptimizer = dict( # 设置使用AdamW优化器(默认使用的是SGD) type='AdamW', lr=0.0001, weight_decay=0.0001, paramwise_cfg=dict(custom_keys={'backbone': dict(lr_mult=0.1, decay_mult=1.0)}))evaluation = dict(interval=5, metric='bbox') # 5个epoch验证一次optimizer_config = dict(grad_clip=dict(max_norm=0.1, norm_type=2)) # 设置梯度裁剪(default_runtime.py中默认为None)checkpoint_config = dict(interval=20) # 20个epoch保存一次权重log_config = dict(interval=50, # 每50次迭代训练就打印一次信息(注意是迭代而不是epoch) hooks=[dict(type='TextLoggerHook')])# learning policylr_config = dict(policy='step', step=[100]) # 学习率在100个epoch进行衰减runner = dict(type='EpochBasedRunner', max_epochs=150) # 训练150个epoch

参考资料:

1. Customize Runtime Settings

2. mmcv官方文档

本文链接地址:https://www.jiuchutong.com/zhishi/292341.html 转载请保留说明!

上一篇:【uniapp】页面下拉刷新(uniapp按钮)

下一篇:卡格拉格帝边境公园中一对正在求偶的鸵鸟,南非 (© Tina Malfilatre/Minden Pictures)(卡格拉河)

  • 华为荣耀8x手机多少厘米(华为荣耀8x手机壳)

    华为荣耀8x手机多少厘米(华为荣耀8x手机壳)

  • 抖音评论区黑色怎么调(抖音评论区黑色背景)

    抖音评论区黑色怎么调(抖音评论区黑色背景)

  • 小米手环跑步公里程严重不准(小米手环跑步公里程用手机准还是用手环准)

    小米手环跑步公里程严重不准(小米手环跑步公里程用手机准还是用手环准)

  • 小米手机强制关机(小米手机强制关机后开不了机怎么办)

    小米手机强制关机(小米手机强制关机后开不了机怎么办)

  • 机器数的表示范围由CPU中的寄存器决定(机器数的表示范围称为字长)

    机器数的表示范围由CPU中的寄存器决定(机器数的表示范围称为字长)

  • 怎么改图片格式为jpg(word怎么改图片格式)

    怎么改图片格式为jpg(word怎么改图片格式)

  • 手机带pro和不带pro有什么区别(手机带pro和不带pro)

    手机带pro和不带pro有什么区别(手机带pro和不带pro)

  • c语言0什么意思(c语言中0是对还是错)

    c语言0什么意思(c语言中0是对还是错)

  • ogp测量仪是什么(ogp测量仪编程及其步骤)

    ogp测量仪是什么(ogp测量仪编程及其步骤)

  • 华为nova7有没有耳机孔(华为nova7有没有红外线)

    华为nova7有没有耳机孔(华为nova7有没有红外线)

  • 抖音好友怎么备注姓名(抖音上加微信怎么加)

    抖音好友怎么备注姓名(抖音上加微信怎么加)

  • 在苹果ipad上怎么做ppt(在苹果iPad上怎么怎么下载字体)

    在苹果ipad上怎么做ppt(在苹果iPad上怎么怎么下载字体)

  • 红眼工具是干嘛的(红眼工具的哪一个参数用来设置瞳孔)

    红眼工具是干嘛的(红眼工具的哪一个参数用来设置瞳孔)

  • oppoa11和a11x手机壳通用吗(oppoa11和a11x手机壳有什么区别)

    oppoa11和a11x手机壳通用吗(oppoa11和a11x手机壳有什么区别)

  • wps文件储存在手机哪里(wps文件储存在手机哪里找)

    wps文件储存在手机哪里(wps文件储存在手机哪里找)

  • 视频怎么面对面快传(怎么用手机面对面传视频)

    视频怎么面对面快传(怎么用手机面对面传视频)

  • 快手私密作品删了怎么恢复(快手私密作品删掉了怎么恢复)

    快手私密作品删了怎么恢复(快手私密作品删掉了怎么恢复)

  • 电脑设置可以从哪里进去(电脑设置从哪里打开)

    电脑设置可以从哪里进去(电脑设置从哪里打开)

  • 误买了app怎么解决(误买了app怎么解决视频)

    误买了app怎么解决(误买了app怎么解决视频)

  • 关于电脑的谜语大全(有关电脑的谜题)

    关于电脑的谜语大全(有关电脑的谜题)

  • 多闪和抖音是什么关系(多闪app是干嘛的?抖音和多闪有什么区别?)

    多闪和抖音是什么关系(多闪app是干嘛的?抖音和多闪有什么区别?)

  • servlet是什么(servlet技术)

    servlet是什么(servlet技术)

  • 红包已被领取怎么删除(红包已领取怎么删除)

    红包已被领取怎么删除(红包已领取怎么删除)

  • gtx1660比1060强多少

    gtx1660比1060强多少

  • PyTorch 之 强大的 hub 模块和搭建神经网络进行气温预测(pytorch with no grad)

    PyTorch 之 强大的 hub 模块和搭建神经网络进行气温预测(pytorch with no grad)

  • 待抵扣进项税的账务处理
  • 自查补缴增值税的会计处理
  • 应交税费是什么会计科目
  • 收到发票冲红怎么做分录
  • 收到对方红字发票如何做账
  • 应交税费贷方有余额,怎么销账
  • 红字发票需要认证吗之前的发票还有用吗
  • 以前年度成本多入了怎样调整
  • 付了定金一定会有货吗
  • 企业固定资产入账金额标准
  • 电子发票报销后还能冲红么
  • 公司买了商品做活动会计分录
  • 增值税开票员的岗位职责
  • 技术开发费税收优惠政策
  • 生育津贴缴纳
  • 公司员工出差补贴与差旅费报销制度
  • 怎样理解递归
  • 网上银行转账被骗能追回吗
  • 建筑公司工程款支付审批流程
  • 拿提成的工资怎么算
  • 一般纳税人出售不动产增值税税率是多少
  • 定期存款计入什么科目
  • 二手车过户员怎么样
  • 工效挂钩企业工资税前扣除有何规定?
  • 勒索病毒文件怎么恢复
  • u盘的内存卡怎么装
  • 下花园6路公交车时间表
  • PHP:session_name()的用法_Session函数
  • 所得税和应交所得税
  • yifile怎么使用
  • php伪静态规则写法
  • 委托开发软件如何入账
  • 康沃尔公国范围
  • php消息队列kafka
  • 猪肉税票怎么开
  • php array操作
  • 机动车组织机构代码查询
  • redisson php
  • php+jquery+html实现点击不刷新加载更多的实例代码
  • 学费入账处理
  • 印花税和工会经费用不用计提
  • 预付款能不能开票入账
  • python输入函数帮助
  • mysql数据库如何回滚
  • 用于研发的材料做成产品出售后怎么做账
  • 普通发票能不能重新开
  • sqlserver2012开发版
  • ibm db2认证
  • mysql批量新增字段
  • 个税手续费返还增值税申报表怎么填
  • mysql show privileges
  • 资本公积含义
  • 股东分红申报个税怎么填
  • 企业持有住房税费
  • 发票开错作废如何处理?
  • 增值税进项税额转出的情况有哪些
  • 应收账款收不回来怎么处理比较好
  • 工地会计怎么做账
  • 担保公司的担保费能退吗
  • 企业所得税国税地税怎么分
  • 固定资产转让开票大类是什么
  • sql中where语句的写法
  • 微软和苹果是什么关系
  • mac系统播放器声音小
  • 让mac桌面变整洁的方法
  • linux中tailf命令
  • 一台电脑多个用户组怎么显示在一个屏幕上
  • macbookair2015安装win7 单系统
  • centos n1
  • windows7旗舰版怎样扩大虚拟内存
  • .json()
  • opengl纹理叠加
  • 用python编写程序
  • jquery移动div到另一个div中
  • jq获取url
  • 用python写爬虫
  • js class 私有方法
  • 银行代扣流程
  • 税务稽查证据问题
  • 鸿蒙2.0哪个版本续航好
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设