位置: IT常识 - 正文

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

编辑:rootadmin
Pytorch DataLoader中的num_workers (选择最合适的num_workers值) 一、概念

推荐整理分享Pytorch DataLoader中的num_workers (选择最合适的num_workers值),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

num_workers是Dataloader的概念,默认值是0。是告诉DataLoader实例要使用多少个子进程进行数据加载(和CPU有关,和GPU无关) 如果num_worker设为0,意味着每一轮迭代时,dataloader不再有自主加载数据到RAM这一步骤(因为没有worker了),而是在RAM中找batch,找不到时再加载相应的batch。缺点当然是速度慢。

当num_worker不为0时,每轮到dataloader加载数据时,dataloader一次性创建num_worker个worker,并用batch_sampler将指定batch分配给指定worker,worker将它负责的batch加载进RAM。

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

num_worker设置得大,好处是寻batch速度快,因为下一轮迭代的batch很可能在上一轮/上上一轮…迭代时已经加载好了。坏处是内存开销大,也加重了CPU负担(worker加载数据到RAM的进程是CPU复制的嘛)。num_workers的经验设置值是自己电脑/服务器的CPU核心数,如果CPU很强、RAM也很充足,就可以设置得更大些。

num_worker小了的情况,主进程采集完最后一个worker的batch。此时需要回去采集第一个worker产生的第二个batch。如果该worker此时没有采集完,主线程会卡在这里等。(这种情况出现在,num_works数量少或者batchsize 比较小,显卡很快就计算完了,CPU对GPU供不应求。)

即,num_workers的值和模型训练快慢有关,和训练出的模型的performance无关

Detectron2的num_workers默认是4

二、选择最合适的num_workers值

最合适的num_works值与数据集有关 最好是跑代码之前先用这段script跑一下,选择最合适的num_workers值

from time import timeimport multiprocessing as mpimport torchimport torchvisionfrom torchvision import transformstransform = transforms.Compose([ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize((0.1307,), (0.3081,))])trainset = torchvision.datasets.MNIST( root='dataset/', train=True, #如果为True,从 training.pt 创建数据,否则从 test.pt 创建数据。 download=True, #如果为true,则从 Internet 下载数据集并将其放在根目录中。 如果已下载数据集,则不会再次下载。 transform=transform)print(f"num of CPU: {mp.cpu_count()}")for num_workers in range(2, mp.cpu_count(), 2): train_loader = torch.utils.data.DataLoader(trainset, shuffle=True, num_workers=num_workers, batch_size=64, pin_memory=True) start = time() for epoch in range(1, 3): for i, data in enumerate(train_loader, 0): pass end = time() print("Finish with:{} second, num_workers={}".format(end - start, num_workers))

可以看到,这个服务器24个CPU, 最合适的num_workers值是14

三、可能出现的问题

linux系统中可以使用多个子进程加载数据,windows系统里是不可以的,可以发现报错时产生在DataLoader文件中的。我们找到自己调用DataLoader的文件中num_workers的设置,设置为0或者采用默认为0的设置。

本文链接地址:https://www.jiuchutong.com/zhishi/289634.html 转载请保留说明!

上一篇:苏格兰高地上的欧亚红松鼠,苏格兰 (© Scotland: The Big Picture/Minden Pictures)(苏格兰高地什么意思)

下一篇:威尼斯海滩滑板公园鸟瞰图,洛杉矶 (© Ingus Kruklitis/Getty Images)(威尼斯海滩滑板场)

  • 小米返回键在哪里设置(小米返回键怎么弄)

    小米返回键在哪里设置(小米返回键怎么弄)

  • 华为nova4跟nova4e的区别(华为nova4跟nova9se差别)

    华为nova4跟nova4e的区别(华为nova4跟nova9se差别)

  • 手机一天最多可以玩几个小时(手机一天最多可以打多少个号码)

    手机一天最多可以玩几个小时(手机一天最多可以打多少个号码)

  • 1tssd固态硬盘有必要吗(固态硬盘有没有1t)

    1tssd固态硬盘有必要吗(固态硬盘有没有1t)

  • 苹果se的home键是实体按键吗(iphone se的home键是下陷的吗)

    苹果se的home键是实体按键吗(iphone se的home键是下陷的吗)

  • 要关闭正在运行的程序窗口可以按什么组合键(要关闭正在运行的窗口可以按什么键)

    要关闭正在运行的程序窗口可以按什么组合键(要关闭正在运行的窗口可以按什么键)

  • 快手为什么不能一次性点完所有作品(快手为什么不能搜索视频)

    快手为什么不能一次性点完所有作品(快手为什么不能搜索视频)

  • 闲鱼拍下未付款别人还能拍吗(闲鱼拍下未付款别人可以再买吗)

    闲鱼拍下未付款别人还能拍吗(闲鱼拍下未付款别人可以再买吗)

  • 笔记本电脑开合轴坏了(笔记本电脑开合处裂开)

    笔记本电脑开合轴坏了(笔记本电脑开合处裂开)

  • pot-tl00a是什么型号(POT-TL00A是什么型号)

    pot-tl00a是什么型号(POT-TL00A是什么型号)

  • 苹果wapl是什么意思(wapi开着好还是关闭好)

    苹果wapl是什么意思(wapi开着好还是关闭好)

  • 华为手机插上耳机总是跳出语音助手(华为手机插上耳机还是外放)

    华为手机插上耳机总是跳出语音助手(华为手机插上耳机还是外放)

  • 微信充错话费多久退钱(微信充错话费了怎么办能要回来吗)

    微信充错话费多久退钱(微信充错话费了怎么办能要回来吗)

  • 探探是左边喜欢还是右边喜欢(探探左边喜欢还是右边)

    探探是左边喜欢还是右边喜欢(探探左边喜欢还是右边)

  • 通过微信能查到对方的手机号么(通过微信能查到什么)

    通过微信能查到对方的手机号么(通过微信能查到什么)

  • iphone储存空间其他怎么清理(iPhone储存空间其他系统数据怎么清理)

    iphone储存空间其他怎么清理(iPhone储存空间其他系统数据怎么清理)

  • 淘宝网址是什么(淘宝的网站网址是多少)

    淘宝网址是什么(淘宝的网站网址是多少)

  • 小米8支持双4g信号吗(小米8支持双移动卡吗)

    小米8支持双4g信号吗(小米8支持双移动卡吗)

  • 微信手机号码被别人绑定了怎么办(微信手机号码被别人绑定了登不上)

    微信手机号码被别人绑定了怎么办(微信手机号码被别人绑定了登不上)

  • 抖音能解除私密设置吗(抖音解除私密账号后别人会看到我的喜欢列表吗)

    抖音能解除私密设置吗(抖音解除私密账号后别人会看到我的喜欢列表吗)

  • 苹果系统48个g怎么清理(苹果手机系统50个g)

    苹果系统48个g怎么清理(苹果手机系统50个g)

  • 苹果手机语音备忘录怎么关(苹果手机语音备忘录下载)

    苹果手机语音备忘录怎么关(苹果手机语音备忘录下载)

  • 小米手机分身弊端(小米手机分身对手机有影响吗)

    小米手机分身弊端(小米手机分身对手机有影响吗)

  • 美团众包如何注销账号(美团众包如何注册)

    美团众包如何注销账号(美团众包如何注册)

  • 公司代扣代缴个人所得税如何退税
  • 金税盘技术维护费
  • 递延收益所得税负债
  • 无偿使用厂房用交税吗
  • 小规模纳税人的企业所得税税率
  • 公司税务状态变更怎么办
  • 职工的取暖补贴上税吗
  • 企业大股东减持股份
  • 建帐时库存的原材料如何入帐?
  • 子公司向母公司借款对合并报表的影响
  • 企业接收政府划入资产的税务处理办法
  • 企业法人股东向个人借款能起诉查封公司财产吗
  • 拍卖的房产
  • 物流公司一般纳税人和小规模纳税人
  • 取得不动产时的作价
  • 预收的电费增值税如何缴纳?
  • 餐饮个体户税务登记需要什么资料
  • 应收账款产生的利息分录
  • PHP验证信用卡卡号是否正确函数
  • 公司收入算认缴出资吗
  • 运输发票符合什么要求
  • php屏蔽错误
  • spring ioc di aop
  • yum命令详解
  • discuz 移动端
  • css page-break-after
  • 企业如何利用期货对冲风险怎么操作
  • 增值税报销是什么意思
  • 一般纳税人费用专票如何做账
  • 区块管理办法
  • 票据带息和不带息
  • python如何在一个文件中运行另一个文件
  • 银行收到几分钱怎么做账
  • phpipam使用
  • mysql使用技巧
  • mysql日期和时间类型
  • 委托收款的含义
  • 蔬菜开发票到哪里开呢?
  • windowsserver2008r2开启远程桌面
  • 个体工商户经营所得税核定征收
  • 个人所得税相关会计分录
  • 累计折旧需要分录吗
  • 个体户需要给员工买五险一金吗
  • 购入需安装设备的会计分录
  • 建筑公司工程款税率
  • 收政府的慰问金合法吗
  • 复利和年金的区别通俗易懂的
  • 公司买的吃的计入什么科目
  • 已付款未认证发票怎么做账
  • 在筹建期间的费用属于什么
  • 长期借款和长期贷款一样吗
  • 本月无收入还用结转吗
  • 利润表中财务费用中的利息费用和利息收入
  • 收到上市公司分红企业所得税减半征收的情景
  • 出售房产收入属于转让财产收入吗
  • 其他资本公积核算哪些内容
  • 数据库优化的作用是什么?
  • mysql的分区表
  • sql语句的查询语句
  • linux下安装mysql简单的方法
  • windows命令行使用
  • win8系统之家官网
  • 怎样升级智慧中小学版本软件
  • sata驱动怎么装
  • 从哪里看windows是多少位的
  • imessage如何群发
  • window8输入法怎么设置
  • win10系统打开任务管理器的快捷键
  • opengl光线跟踪代码
  • linux流量监测工具
  • 谈谈关于中华文明的五个突出特性
  • python的get
  • logcatapp
  • 安卓手机加速方法
  • 新疆油田在哪个地方
  • 小规模纳税人进口环节的增值税税率
  • 上海工资8000税后多少
  • 什么情况适用简易诉讼程序
  • 用于直接销售消费品的消费税计入
  • 广东省国税局局长潘
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设