位置: IT常识 - 正文

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

编辑:rootadmin
Pytorch DataLoader中的num_workers (选择最合适的num_workers值) 一、概念

推荐整理分享Pytorch DataLoader中的num_workers (选择最合适的num_workers值),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

num_workers是Dataloader的概念,默认值是0。是告诉DataLoader实例要使用多少个子进程进行数据加载(和CPU有关,和GPU无关) 如果num_worker设为0,意味着每一轮迭代时,dataloader不再有自主加载数据到RAM这一步骤(因为没有worker了),而是在RAM中找batch,找不到时再加载相应的batch。缺点当然是速度慢。

当num_worker不为0时,每轮到dataloader加载数据时,dataloader一次性创建num_worker个worker,并用batch_sampler将指定batch分配给指定worker,worker将它负责的batch加载进RAM。

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

num_worker设置得大,好处是寻batch速度快,因为下一轮迭代的batch很可能在上一轮/上上一轮…迭代时已经加载好了。坏处是内存开销大,也加重了CPU负担(worker加载数据到RAM的进程是CPU复制的嘛)。num_workers的经验设置值是自己电脑/服务器的CPU核心数,如果CPU很强、RAM也很充足,就可以设置得更大些。

num_worker小了的情况,主进程采集完最后一个worker的batch。此时需要回去采集第一个worker产生的第二个batch。如果该worker此时没有采集完,主线程会卡在这里等。(这种情况出现在,num_works数量少或者batchsize 比较小,显卡很快就计算完了,CPU对GPU供不应求。)

即,num_workers的值和模型训练快慢有关,和训练出的模型的performance无关

Detectron2的num_workers默认是4

二、选择最合适的num_workers值

最合适的num_works值与数据集有关 最好是跑代码之前先用这段script跑一下,选择最合适的num_workers值

from time import timeimport multiprocessing as mpimport torchimport torchvisionfrom torchvision import transformstransform = transforms.Compose([ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize((0.1307,), (0.3081,))])trainset = torchvision.datasets.MNIST( root='dataset/', train=True, #如果为True,从 training.pt 创建数据,否则从 test.pt 创建数据。 download=True, #如果为true,则从 Internet 下载数据集并将其放在根目录中。 如果已下载数据集,则不会再次下载。 transform=transform)print(f"num of CPU: {mp.cpu_count()}")for num_workers in range(2, mp.cpu_count(), 2): train_loader = torch.utils.data.DataLoader(trainset, shuffle=True, num_workers=num_workers, batch_size=64, pin_memory=True) start = time() for epoch in range(1, 3): for i, data in enumerate(train_loader, 0): pass end = time() print("Finish with:{} second, num_workers={}".format(end - start, num_workers))

可以看到,这个服务器24个CPU, 最合适的num_workers值是14

三、可能出现的问题

linux系统中可以使用多个子进程加载数据,windows系统里是不可以的,可以发现报错时产生在DataLoader文件中的。我们找到自己调用DataLoader的文件中num_workers的设置,设置为0或者采用默认为0的设置。

本文链接地址:https://www.jiuchutong.com/zhishi/289634.html 转载请保留说明!

上一篇:苏格兰高地上的欧亚红松鼠,苏格兰 (© Scotland: The Big Picture/Minden Pictures)(苏格兰高地什么意思)

下一篇:威尼斯海滩滑板公园鸟瞰图,洛杉矶 (© Ingus Kruklitis/Getty Images)(威尼斯海滩滑板场)

  • 三星笔记本怎么用u盘重装系统(三星笔记本质量)(三星笔记本怎么进bios)

    三星笔记本怎么用u盘重装系统(三星笔记本质量)(三星笔记本怎么进bios)

  • 小米手机怎么拉黑对方手机号码(小米手机怎么换锁屏壁纸)

    小米手机怎么拉黑对方手机号码(小米手机怎么换锁屏壁纸)

  • 荣耀30pro支持反向充电吗(荣耀30pro+有没有反向充电功能)

    荣耀30pro支持反向充电吗(荣耀30pro+有没有反向充电功能)

  • 新买的iphone11第一次充电(新买的iphone11第一次充电需要注意什么)

    新买的iphone11第一次充电(新买的iphone11第一次充电需要注意什么)

  • 路由器发热会着火吗(路由器发热会影响信号吗)

    路由器发热会着火吗(路由器发热会影响信号吗)

  • 淘宝和天猫的区别(淘宝和天猫的区别在哪)

    淘宝和天猫的区别(淘宝和天猫的区别在哪)

  • 打印机显示一个文档被挂起是什么意思(打印机显示一个文档被挂起)

    打印机显示一个文档被挂起是什么意思(打印机显示一个文档被挂起)

  • 华为荣耀9x怎么关机重启(华为荣耀9x怎么分屏)

    华为荣耀9x怎么关机重启(华为荣耀9x怎么分屏)

  • 同一个微信号可以在手机和平板上同时用吗?(同一个微信号可以在两台电脑上登录吗)

    同一个微信号可以在手机和平板上同时用吗?(同一个微信号可以在两台电脑上登录吗)

  • qq2g在线有几种可能(qq2g在线是什么意)

    qq2g在线有几种可能(qq2g在线是什么意)

  • 怎样把一个手机上的东西移到另一个手机上(怎样把一个手机的内容移至新手机)

    怎样把一个手机上的东西移到另一个手机上(怎样把一个手机的内容移至新手机)

  • 水滴筹回复怎么删除(水滴筹怎样回复)

    水滴筹回复怎么删除(水滴筹怎样回复)

  • i7蓝牙耳机是什么牌子(i7s蓝牙耳机是什么牌子)

    i7蓝牙耳机是什么牌子(i7s蓝牙耳机是什么牌子)

  • word兼容模式啥意思(word2019兼容模式是什么意思)

    word兼容模式啥意思(word2019兼容模式是什么意思)

  • 红米note8怎么隐藏刘海(红米note8怎么隐藏应用)

    红米note8怎么隐藏刘海(红米note8怎么隐藏应用)

  • 怎么改照片大小(手机美图秀秀怎么改照片大小)

    怎么改照片大小(手机美图秀秀怎么改照片大小)

  • 华为td-lte什么型号(华为td lte)

    华为td-lte什么型号(华为td lte)

  • 怎么找回旧的京东账号(如何找回以前的京东账号)

    怎么找回旧的京东账号(如何找回以前的京东账号)

  • 快手支持obs吗(快手可以用obs直播吗?)

    快手支持obs吗(快手可以用obs直播吗?)

  • c语言volatile关键字的作用(c语言中volatile关键字)

    c语言volatile关键字的作用(c语言中volatile关键字)

  • coaxial接口是什么(coaxal接口是干嘛用)

    coaxial接口是什么(coaxal接口是干嘛用)

  • 点赞又取消别人知道吗(点赞又取消别人能看到吗)

    点赞又取消别人知道吗(点赞又取消别人能看到吗)

  • 电脑时间不准怎么调整(电脑时间不准怎么自动更新)

    电脑时间不准怎么调整(电脑时间不准怎么自动更新)

  • 基于RuoYi框架自动生成后端代码及前端界面(ruoyi框架快速入门)

    基于RuoYi框架自动生成后端代码及前端界面(ruoyi框架快速入门)

  • 超详细的VSCode下载和安装教程以及解决VSCode下载速度特别慢的问题(vscode2010下载)

    超详细的VSCode下载和安装教程以及解决VSCode下载速度特别慢的问题(vscode2010下载)

  • 从税法经济法角度分析冰冰偷漏税事件?
  • 特定减免税货物的通关程序为
  • 收回应收账款编制什么凭证
  • 税费返还计入什么费用
  • 公司与公司之间借款需要交税吗
  • 2021小规模纳税人减免增值税
  • 个体工商户开普票流程
  • 税控技术维护费每年都能抵扣吗
  • 工业企业员工工资占收入比例
  • 购进出口商品的会计分录
  • 当期发生的费用
  • 一张发票多个单位报销,怎么分辨
  • 如何减少资产负债表上的资本公积
  • 发行债券支付的费用要减吗
  • 安装工程劳务合同
  • 地税迁移期间能开发票吗
  • 房地产开发企业土地增值税清算
  • 保险公司如何计算车辆折旧
  • 印花税是填开票金额吗
  • 对公人民币转账、汇款(含退汇)分录
  • 前期物业管理公司
  • 2人注册的公司换一个人怎么办
  • 企业的无形资产包括哪些内容
  • 这个月只有销项没有进项怎么申报
  • 支付工程款会计处理
  • 工程已验收,质量问题怎么解决
  • 小企业成本核算方法移动加权平均法
  • 华为手机屏幕变成黑白怎么调回来
  • 应收账款和预收账款的关系
  • 小规模计提增值税的会计科目
  • 爱奇艺以图搜剧不见了
  • 建筑工程给排水的内容
  • 福利企业即征即退优惠政策
  • nuxt怎么用
  • 耕地佔用税的缴纳期限
  • php表单的作用是什么
  • 限售股是好是坏
  • 资产减值准则所规范的资产
  • 公司开发新产品或购买许可证最快的方法是
  • vue destroyed销毁组件
  • 大数据投资发展有限公司
  • php中单双引号的区别
  • 企业账户有什么好处
  • php上传视频到服务器
  • 关于存货跌价准备
  • 个人所得税申报流程图
  • Mysql优化之Zabbix分区优化
  • 什么是外勤会计制度
  • 企业将重组债务转为资本的会计处理
  • 小规模开发票免税如何记账?
  • 过路费发票可以抵扣进项税吗
  • 小企业会计准则2023电子版
  • 商品流通企业有哪些企业
  • sql server入门新手教程
  • WINDOWS操作系统最新版本
  • 提升英语
  • windows7文件夹选项在哪里
  • 如何隐藏与显示元素
  • 诺基亚安装ngage
  • SCP 方便的Linux文件互传
  • 如何彻底解决win10自动重启
  • 电脑微软拼音输入法
  • 铁嘴啥意思
  • android 自定义
  • android item属性
  • css3兼容性问题
  • unity 扩展编辑器
  • unity3d documentation
  • opengl房子建模
  • unity引擎用什么模拟器
  • jquery中的siblings方法
  • python文件a
  • 深入浅析是什么意思
  • Jquery uploadify上传插件使用详解
  • javascript设计的初衷和特点
  • flask框架数据可视化
  • 河北电子税务局新版登录
  • 企业取得了哪些成绩
  • 重庆地方税务局电子税务局官网
  • 国税地税怎么分成
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设