位置: IT常识 - 正文

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

编辑:rootadmin
Pytorch DataLoader中的num_workers (选择最合适的num_workers值) 一、概念

推荐整理分享Pytorch DataLoader中的num_workers (选择最合适的num_workers值),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

num_workers是Dataloader的概念,默认值是0。是告诉DataLoader实例要使用多少个子进程进行数据加载(和CPU有关,和GPU无关) 如果num_worker设为0,意味着每一轮迭代时,dataloader不再有自主加载数据到RAM这一步骤(因为没有worker了),而是在RAM中找batch,找不到时再加载相应的batch。缺点当然是速度慢。

当num_worker不为0时,每轮到dataloader加载数据时,dataloader一次性创建num_worker个worker,并用batch_sampler将指定batch分配给指定worker,worker将它负责的batch加载进RAM。

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

num_worker设置得大,好处是寻batch速度快,因为下一轮迭代的batch很可能在上一轮/上上一轮…迭代时已经加载好了。坏处是内存开销大,也加重了CPU负担(worker加载数据到RAM的进程是CPU复制的嘛)。num_workers的经验设置值是自己电脑/服务器的CPU核心数,如果CPU很强、RAM也很充足,就可以设置得更大些。

num_worker小了的情况,主进程采集完最后一个worker的batch。此时需要回去采集第一个worker产生的第二个batch。如果该worker此时没有采集完,主线程会卡在这里等。(这种情况出现在,num_works数量少或者batchsize 比较小,显卡很快就计算完了,CPU对GPU供不应求。)

即,num_workers的值和模型训练快慢有关,和训练出的模型的performance无关

Detectron2的num_workers默认是4

二、选择最合适的num_workers值

最合适的num_works值与数据集有关 最好是跑代码之前先用这段script跑一下,选择最合适的num_workers值

from time import timeimport multiprocessing as mpimport torchimport torchvisionfrom torchvision import transformstransform = transforms.Compose([ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize((0.1307,), (0.3081,))])trainset = torchvision.datasets.MNIST( root='dataset/', train=True, #如果为True,从 training.pt 创建数据,否则从 test.pt 创建数据。 download=True, #如果为true,则从 Internet 下载数据集并将其放在根目录中。 如果已下载数据集,则不会再次下载。 transform=transform)print(f"num of CPU: {mp.cpu_count()}")for num_workers in range(2, mp.cpu_count(), 2): train_loader = torch.utils.data.DataLoader(trainset, shuffle=True, num_workers=num_workers, batch_size=64, pin_memory=True) start = time() for epoch in range(1, 3): for i, data in enumerate(train_loader, 0): pass end = time() print("Finish with:{} second, num_workers={}".format(end - start, num_workers))

可以看到,这个服务器24个CPU, 最合适的num_workers值是14

三、可能出现的问题

linux系统中可以使用多个子进程加载数据,windows系统里是不可以的,可以发现报错时产生在DataLoader文件中的。我们找到自己调用DataLoader的文件中num_workers的设置,设置为0或者采用默认为0的设置。

本文链接地址:https://www.jiuchutong.com/zhishi/289634.html 转载请保留说明!

上一篇:苏格兰高地上的欧亚红松鼠,苏格兰 (© Scotland: The Big Picture/Minden Pictures)(苏格兰高地什么意思)

下一篇:威尼斯海滩滑板公园鸟瞰图,洛杉矶 (© Ingus Kruklitis/Getty Images)(威尼斯海滩滑板场)

  • 如何提高直通车关键词质量分(如何提高直通车转化率)

    如何提高直通车关键词质量分(如何提高直通车转化率)

  • qq怎么破解加好友答案(怎么破解qq加好友)

    qq怎么破解加好友答案(怎么破解qq加好友)

  • 微信怎么查银行卡余额(微信怎么查银行卡绑定了哪些微信)

    微信怎么查银行卡余额(微信怎么查银行卡绑定了哪些微信)

  • 智能传感器在交互信息能力方面的特点(智能传感器在交互信息能力方面的特点是)

    智能传感器在交互信息能力方面的特点(智能传感器在交互信息能力方面的特点是)

  • 微信缩略图是什么意思(微信缩略图是什么格式)

    微信缩略图是什么意思(微信缩略图是什么格式)

  • 华为nova7怎么设置24小时时间(华为nova7怎么设置时间24小时制)

    华为nova7怎么设置24小时时间(华为nova7怎么设置时间24小时制)

  • 选中的磁盘具有mbr分区表 无法安装系统(选中的磁盘具有mbr分区表无法安装系统)

    选中的磁盘具有mbr分区表 无法安装系统(选中的磁盘具有mbr分区表无法安装系统)

  • 快手注销账号以后还能再注册吗(快手注销账号以后会怎样)

    快手注销账号以后还能再注册吗(快手注销账号以后会怎样)

  • 户户通出t02解决方法(户户通t02解决方案)

    户户通出t02解决方法(户户通t02解决方案)

  • 720p hd摄像头是多少万像素(摄像头的720p是什么意思)

    720p hd摄像头是多少万像素(摄像头的720p是什么意思)

  • 苹果11手机怎么开机(苹果11手机怎么强制关机重启)

    苹果11手机怎么开机(苹果11手机怎么强制关机重启)

  • 表格中间线如何加粗(中间表格的线不见怎么加上去)

    表格中间线如何加粗(中间表格的线不见怎么加上去)

  • 闲鱼商品被保护多久能释放(闲鱼商品被保护是什么意思)

    闲鱼商品被保护多久能释放(闲鱼商品被保护是什么意思)

  • 电池健康度72%要换吗(电池健康 75%)

    电池健康度72%要换吗(电池健康 75%)

  • 抖音设置黑名单对方知道吗(抖音设置黑名单后还可以看到我的视频吗)

    抖音设置黑名单对方知道吗(抖音设置黑名单后还可以看到我的视频吗)

  • 微信收藏视频删除怎么找回(微信收藏视频删了怎么恢复找回来)

    微信收藏视频删除怎么找回(微信收藏视频删了怎么恢复找回来)

  • word文档可以打印彩版吗(word文档可以打多少字)

    word文档可以打印彩版吗(word文档可以打多少字)

  • 怎么把淘宝号变成健康(怎么把淘宝变成英文版)

    怎么把淘宝号变成健康(怎么把淘宝变成英文版)

  • 用什么软件可以更换图片背景(用什么软件可以提取图片文字)

    用什么软件可以更换图片背景(用什么软件可以提取图片文字)

  • xsmax支持多大的快充(xsmax最大支持多大快充)

    xsmax支持多大的快充(xsmax最大支持多大快充)

  • qq注销之后显示什么(注销的qq号为什么还会显示信息)

    qq注销之后显示什么(注销的qq号为什么还会显示信息)

  • 上台唱歌要注意什么(上台唱歌要注意哪些事项)

    上台唱歌要注意什么(上台唱歌要注意哪些事项)

  • cad格式刷在哪(2022cad格式刷在哪)

    cad格式刷在哪(2022cad格式刷在哪)

  • 抖音橱窗必须开通淘宝联盟吗(抖音橱窗必须开通聚合账户有个扣款吗)

    抖音橱窗必须开通淘宝联盟吗(抖音橱窗必须开通聚合账户有个扣款吗)

  • 删除朋友圈全部一起删怎么删(删除朋友圈全部消息怎么删)

    删除朋友圈全部一起删怎么删(删除朋友圈全部消息怎么删)

  • 苹果xr怎么退后台(苹果xr如何退出程序)

    苹果xr怎么退后台(苹果xr如何退出程序)

  • 阿里tv怎么投屏(阿里tv投屏没字幕)

    阿里tv怎么投屏(阿里tv投屏没字幕)

  • Win10没有投影到这台电脑功能(win没有投影到此电脑怎么办)

    Win10没有投影到这台电脑功能(win没有投影到此电脑怎么办)

  • clone下来的vue项目出现“An unknown git error occurred”,vue全局挂载axios及配置全局请求和响应拦截,uni-app的全局请求和响应拦截,对请求方法的封装(vue clonedeep)

    clone下来的vue项目出现“An unknown git error occurred”,vue全局挂载axios及配置全局请求和响应拦截,uni-app的全局请求和响应拦截,对请求方法的封装(vue clonedeep)

  • 利用openpose提取自建数据集骨骼点训练st-gcn,复现st-gcn(openpose的输出)

    利用openpose提取自建数据集骨骼点训练st-gcn,复现st-gcn(openpose的输出)

  • 企业缴纳残疾人保证金按什么标准缴纳
  • 技术证怎么办理
  • 原材料被盗计入什么科目
  • 非货币资产交换的会计处理原则
  • 计提坏账准备为什么要加借方
  • 应付福利费余额在借方
  • 收到进口增值税发票可以直接抵扣吗
  • 有限合伙企业分红个人所得税
  • 企业分立房产税税收政策
  • 借差旅费退回现金怎么办
  • 期末余额全部转出的有哪些
  • 劳务费发票是几个点的税率
  • 税务行业软件
  • 小企业会计准则科目
  • 茶具可以作为固定资产吗
  • 企业咨询费可以抵扣吗
  • 退回工资能退个税吗
  • 发票打印注意什么
  • 持有至到期投资是什么意思
  • 收回已核销的坏账并入账是什么意思
  • 车间的制造费用包括哪些
  • 企业广告费的会计处理方法研究
  • 开增值税专用发票需要什么资料
  • windows10一直刷屏
  • 加拿大沿海城市有哪些
  • html前端技术
  • 没有了睡眠功能
  • 未分配利润转增股本交印花税
  • mscorsvw.exe是什么进程
  • 电子承兑兑现手续费
  • php如何实现伪静态
  • php操作oracle
  • yolov3图像识别
  • php websocket教程
  • 金蝶现金流量表不对怎么处理
  • 企业财政拨款所得免税吗
  • 代收代付进项税转出吗
  • 长期债权投资业务处理
  • 电子缴款凭证在哪里找
  • 银行代发工资流程
  • 一般纳税人销售旧货
  • 个人所得税应纳税额
  • 稳岗补贴算不算财政补贴
  • 水利建设基金的税率
  • 第二季度所得税表中研发费用
  • 其他应收款审计说明怎么写
  • 公司从异地迁移到本地怎么向当地政府写申请
  • 法律是如何规定家用家具折旧
  • 固定资产后续支出计入的科目
  • 开具发票的单位名称与实际收款不一致?
  • 差旅费车票是否可以报销
  • 限定性净资产举例
  • 会计分录要怎么写
  • ubuntu mysql 5.6版本的删除/安装/编码配置文件配置
  • win8系统笔记本出现意外错误
  • steam游戏支持的手柄
  • fedora系统安装教程
  • win7系统关闭开机启动项设置
  • win7的收藏夹在哪里
  • win8怎么用一键ghost
  • freebsd连接wifi
  • cocos2dx4.0入门
  • android 动态布局
  • java框架怎么用
  • node.js和go
  • 使用forever管理nodejs应用教程
  • javascript获取css
  • unity3d有什么用
  • mac打开多个窗口
  • android插件化原理面试
  • Unity PlayerPrefs.DeleteAll 无效以及 PlayerPrefs文件保存位置
  • 深入理解innodb
  • 怎样查询灵活就业养老保险缴费记录
  • 江苏税务社保缴纳查询缴费记录
  • 税收分类分级管理后如何开展风险管理
  • 溧阳北站规划图
  • 如何在国税电子税务平台为员工办理定制社保卡
  • 广州市地税服务大厅
  • 烟台税务系统缴费
  • 小企业会计准则会计科目表
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设