位置: IT常识 - 正文

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

编辑:rootadmin
Pytorch DataLoader中的num_workers (选择最合适的num_workers值) 一、概念

推荐整理分享Pytorch DataLoader中的num_workers (选择最合适的num_workers值),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

num_workers是Dataloader的概念,默认值是0。是告诉DataLoader实例要使用多少个子进程进行数据加载(和CPU有关,和GPU无关) 如果num_worker设为0,意味着每一轮迭代时,dataloader不再有自主加载数据到RAM这一步骤(因为没有worker了),而是在RAM中找batch,找不到时再加载相应的batch。缺点当然是速度慢。

当num_worker不为0时,每轮到dataloader加载数据时,dataloader一次性创建num_worker个worker,并用batch_sampler将指定batch分配给指定worker,worker将它负责的batch加载进RAM。

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

num_worker设置得大,好处是寻batch速度快,因为下一轮迭代的batch很可能在上一轮/上上一轮…迭代时已经加载好了。坏处是内存开销大,也加重了CPU负担(worker加载数据到RAM的进程是CPU复制的嘛)。num_workers的经验设置值是自己电脑/服务器的CPU核心数,如果CPU很强、RAM也很充足,就可以设置得更大些。

num_worker小了的情况,主进程采集完最后一个worker的batch。此时需要回去采集第一个worker产生的第二个batch。如果该worker此时没有采集完,主线程会卡在这里等。(这种情况出现在,num_works数量少或者batchsize 比较小,显卡很快就计算完了,CPU对GPU供不应求。)

即,num_workers的值和模型训练快慢有关,和训练出的模型的performance无关

Detectron2的num_workers默认是4

二、选择最合适的num_workers值

最合适的num_works值与数据集有关 最好是跑代码之前先用这段script跑一下,选择最合适的num_workers值

from time import timeimport multiprocessing as mpimport torchimport torchvisionfrom torchvision import transformstransform = transforms.Compose([ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize((0.1307,), (0.3081,))])trainset = torchvision.datasets.MNIST( root='dataset/', train=True, #如果为True,从 training.pt 创建数据,否则从 test.pt 创建数据。 download=True, #如果为true,则从 Internet 下载数据集并将其放在根目录中。 如果已下载数据集,则不会再次下载。 transform=transform)print(f"num of CPU: {mp.cpu_count()}")for num_workers in range(2, mp.cpu_count(), 2): train_loader = torch.utils.data.DataLoader(trainset, shuffle=True, num_workers=num_workers, batch_size=64, pin_memory=True) start = time() for epoch in range(1, 3): for i, data in enumerate(train_loader, 0): pass end = time() print("Finish with:{} second, num_workers={}".format(end - start, num_workers))

可以看到,这个服务器24个CPU, 最合适的num_workers值是14

三、可能出现的问题

linux系统中可以使用多个子进程加载数据,windows系统里是不可以的,可以发现报错时产生在DataLoader文件中的。我们找到自己调用DataLoader的文件中num_workers的设置,设置为0或者采用默认为0的设置。

本文链接地址:https://www.jiuchutong.com/zhishi/289634.html 转载请保留说明!

上一篇:苏格兰高地上的欧亚红松鼠,苏格兰 (© Scotland: The Big Picture/Minden Pictures)(苏格兰高地什么意思)

下一篇:威尼斯海滩滑板公园鸟瞰图,洛杉矶 (© Ingus Kruklitis/Getty Images)(威尼斯海滩滑板场)

  • p40拍照放大多少倍(华为p40拍照放大多少倍)

    p40拍照放大多少倍(华为p40拍照放大多少倍)

  • 红米k50屏幕尺寸多大(红米k50最严重缺点)

    红米k50屏幕尺寸多大(红米k50最严重缺点)

  • 微信转帐一次能转多少?每月能转多少不收手续费(微信转帐一次能转多少?每月能转多少不收手续)

    微信转帐一次能转多少?每月能转多少不收手续费(微信转帐一次能转多少?每月能转多少不收手续)

  • 华为荣耀9xpro电池多大(荣耀9xpro更换电池)

    华为荣耀9xpro电池多大(荣耀9xpro更换电池)

  • 苹果输入法怎么换行(苹果输入法怎么清除记忆)

    苹果输入法怎么换行(苹果输入法怎么清除记忆)

  • 微信没有网络可以计步吗(微信没有网络可以删除好友吗)

    微信没有网络可以计步吗(微信没有网络可以删除好友吗)

  • qq删除好友是互删吗(qq删除好友互动标识还在吗?qq好友互动标识有哪些?)

    qq删除好友是互删吗(qq删除好友互动标识还在吗?qq好友互动标识有哪些?)

  • 抖音封禁的原因是什么(抖音封禁的原因在哪儿看?)

    抖音封禁的原因是什么(抖音封禁的原因在哪儿看?)

  • 有苹果10吗(有苹果10吗?)

    有苹果10吗(有苹果10吗?)

  • 注册微信需要什么条件(注册微信需要什么信息)

    注册微信需要什么条件(注册微信需要什么信息)

  • 电脑用5年太卡了

    电脑用5年太卡了

  • 网络电视可以下载钉钉软件吗(网络电视可以下载百度网盘吗)

    网络电视可以下载钉钉软件吗(网络电视可以下载百度网盘吗)

  • word文字填充色怎么设置(word文档填充字体颜色快捷键)

    word文字填充色怎么设置(word文档填充字体颜色快捷键)

  • qq明明在线为什么别人看是不在线(qq明明在线为什么语音打不通)

    qq明明在线为什么别人看是不在线(qq明明在线为什么语音打不通)

  • 苹果11和11pro相机区别(苹果11跟苹果11pro差多少钱)

    苹果11和11pro相机区别(苹果11跟苹果11pro差多少钱)

  • ipadmini5a2133是什么版本(ipad迷你5a2133是什么机型)

    ipadmini5a2133是什么版本(ipad迷你5a2133是什么机型)

  • 华为mate20pro怎么升级emui10(华为mate20pro怎么设置指纹解锁)

    华为mate20pro怎么升级emui10(华为mate20pro怎么设置指纹解锁)

  • 卸载未使用的应用坏处(卸载未使用的应用是什么意思)

    卸载未使用的应用坏处(卸载未使用的应用是什么意思)

  • 苹果手机下载大于150怎么设置(苹果手机下载大于200m怎么用流量)

    苹果手机下载大于150怎么设置(苹果手机下载大于200m怎么用流量)

  • 微信文档修改过的保存在哪里(微信文档修改后 保存在哪里)

    微信文档修改过的保存在哪里(微信文档修改后 保存在哪里)

  • 淘宝直播热门款是怎么设置(淘宝直播间热门款值得买吗)

    淘宝直播热门款是怎么设置(淘宝直播间热门款值得买吗)

  • 拼多多怎么看砍价记录(拼多多怎么看砍一刀记录)

    拼多多怎么看砍价记录(拼多多怎么看砍一刀记录)

  • 最右怎么找通讯录好友(最右怎么匹配通讯录)

    最右怎么找通讯录好友(最右怎么匹配通讯录)

  • cad图纸怎么输入文字(cad图纸怎么输入密码解密)

    cad图纸怎么输入文字(cad图纸怎么输入密码解密)

  • 什么是税目税基税率,简答题
  • 税务师考试各科老师推荐
  • 先报税还是先清卡反写
  • 免税商品进项增值税发票怎么做账
  • 发票后面附清单明细能导出吗
  • 混合经营销售额合并计算还是分开计算
  • 联营企业股利收入
  • 长期挂账的应付账款如何写申请报告
  • 两免三减半的概率是多少
  • 长期投资包括哪些会计科目
  • 法定预算调整的范围
  • 增值税专用发票和普通发票的区别
  • 个体户哪种税率最低
  • 企业法人信息变更
  • 退回工资能退个税吗
  • 建筑业进项税抵扣不足
  • 个税抵扣申报截止时间
  • php获取用户名
  • mac系统中文输入法切换
  • 苹果15手机价格和图片颜色
  • 电子商票到期后多少天有效?
  • bug is
  • 佣金手续费开什么发票
  • 1.exe是什么文件
  • 华为路由器怎么设置wifi密码
  • 企业个人借款会计分录
  • node升级版本
  • 资产负债表是不是根据记账凭证生成的
  • 印花税不足一元需要缴纳吗
  • 自学前端好学吗
  • [深度学习] fast-reid入门教程
  • dmsetup remove_all 会不会清掉数据
  • wordpress限制ip访问
  • 小微企业所得税优惠政策2023
  • 工会会费收取
  • 消费税增值税和个人所得税是什么意思
  • 网上申报完还需要去税务局吗
  • 在vue项目如何引入异步组件?
  • 发票收到款项未付做什么凭证编制
  • mysql监控sql性能
  • sql服务器无法启动的解决
  • 进项税额红字
  • 餐饮毛利率多少为合理范围
  • 长期股权投资与其他权益工具投资的区别
  • 坏账准备如何计算
  • 住宿发票费率是多少
  • 产业扶持资金账户是什么
  • 营业利润为负数表示什么
  • 外贸企业汇兑损益如何减少
  • 员工工资怎么核算
  • 所有者权益的来源包括
  • 汽车生产企业三大战略
  • 临时工工资如何做账
  • 滴滴普票可以计算抵扣吗
  • 个体工商户必须建账吗
  • 固定资产处置有什么问题
  • 固定资产公司
  • 数据库性能优化面试题
  • 重装系统注册表会重置吗
  • win8系统如何激活
  • iexploresrv.exe
  • linux咋用
  • win7电脑711
  • mac如何开启查找我的mac
  • 解决登陆xp系统问题
  • linux网络设备有哪些
  • windows应用图标
  • 层序遍历递归实现
  • opengl transform
  • 微信小程序实现文件上传
  • jquery form表单
  • unity 角色控制器设置isTrigger问题
  • angular 嵌入html
  • jQuery中Nicescroll滚动条插件的用法
  • node.js介绍
  • shell获取字符串中的数字
  • PYTHON使用缩进来体现代码之间的逻辑关系
  • 写给小白的情书
  • 贵州省电子税务
  • 天津市税务机关代码
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设