位置: IT常识 - 正文

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

编辑:rootadmin
Pytorch DataLoader中的num_workers (选择最合适的num_workers值) 一、概念

推荐整理分享Pytorch DataLoader中的num_workers (选择最合适的num_workers值),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

num_workers是Dataloader的概念,默认值是0。是告诉DataLoader实例要使用多少个子进程进行数据加载(和CPU有关,和GPU无关) 如果num_worker设为0,意味着每一轮迭代时,dataloader不再有自主加载数据到RAM这一步骤(因为没有worker了),而是在RAM中找batch,找不到时再加载相应的batch。缺点当然是速度慢。

当num_worker不为0时,每轮到dataloader加载数据时,dataloader一次性创建num_worker个worker,并用batch_sampler将指定batch分配给指定worker,worker将它负责的batch加载进RAM。

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

num_worker设置得大,好处是寻batch速度快,因为下一轮迭代的batch很可能在上一轮/上上一轮…迭代时已经加载好了。坏处是内存开销大,也加重了CPU负担(worker加载数据到RAM的进程是CPU复制的嘛)。num_workers的经验设置值是自己电脑/服务器的CPU核心数,如果CPU很强、RAM也很充足,就可以设置得更大些。

num_worker小了的情况,主进程采集完最后一个worker的batch。此时需要回去采集第一个worker产生的第二个batch。如果该worker此时没有采集完,主线程会卡在这里等。(这种情况出现在,num_works数量少或者batchsize 比较小,显卡很快就计算完了,CPU对GPU供不应求。)

即,num_workers的值和模型训练快慢有关,和训练出的模型的performance无关

Detectron2的num_workers默认是4

二、选择最合适的num_workers值

最合适的num_works值与数据集有关 最好是跑代码之前先用这段script跑一下,选择最合适的num_workers值

from time import timeimport multiprocessing as mpimport torchimport torchvisionfrom torchvision import transformstransform = transforms.Compose([ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize((0.1307,), (0.3081,))])trainset = torchvision.datasets.MNIST( root='dataset/', train=True, #如果为True,从 training.pt 创建数据,否则从 test.pt 创建数据。 download=True, #如果为true,则从 Internet 下载数据集并将其放在根目录中。 如果已下载数据集,则不会再次下载。 transform=transform)print(f"num of CPU: {mp.cpu_count()}")for num_workers in range(2, mp.cpu_count(), 2): train_loader = torch.utils.data.DataLoader(trainset, shuffle=True, num_workers=num_workers, batch_size=64, pin_memory=True) start = time() for epoch in range(1, 3): for i, data in enumerate(train_loader, 0): pass end = time() print("Finish with:{} second, num_workers={}".format(end - start, num_workers))

可以看到,这个服务器24个CPU, 最合适的num_workers值是14

三、可能出现的问题

linux系统中可以使用多个子进程加载数据,windows系统里是不可以的,可以发现报错时产生在DataLoader文件中的。我们找到自己调用DataLoader的文件中num_workers的设置,设置为0或者采用默认为0的设置。

本文链接地址:https://www.jiuchutong.com/zhishi/289634.html 转载请保留说明!

上一篇:苏格兰高地上的欧亚红松鼠,苏格兰 (© Scotland: The Big Picture/Minden Pictures)(苏格兰高地什么意思)

下一篇:威尼斯海滩滑板公园鸟瞰图,洛杉矶 (© Ingus Kruklitis/Getty Images)(威尼斯海滩滑板场)

  • oppo怎么用相册的视频做壁纸(oppo怎么用相册的视频做动态壁纸)

    oppo怎么用相册的视频做壁纸(oppo怎么用相册的视频做动态壁纸)

  • 华为nova7有无线充电功能吗(华为nova7有无线调试吗)

    华为nova7有无线充电功能吗(华为nova7有无线调试吗)

  • qq浮屏如何取消(qq悬浮怎么关闭)

    qq浮屏如何取消(qq悬浮怎么关闭)

  • 苹果11按键音如何关闭(苹果按键音如何设置)

    苹果11按键音如何关闭(苹果按键音如何设置)

  • uc无法验证服务器身份(uc无法验证服务器身份是什么意思)

    uc无法验证服务器身份(uc无法验证服务器身份是什么意思)

  • 怎样才能合成抖音钻卡(抖音如何合成)

    怎样才能合成抖音钻卡(抖音如何合成)

  • 怎么避免收款码被投诉(怎么避免收款码被盗)

    怎么避免收款码被投诉(怎么避免收款码被盗)

  • 文档和文件夹一样吗(文档和文件夹一起发送)

    文档和文件夹一样吗(文档和文件夹一起发送)

  • excel中不等于怎么表示(excel中不等于怎么打出来)

    excel中不等于怎么表示(excel中不等于怎么打出来)

  • 禁止打电话标志一般出现在什么地方(红米手机禁止打电话标志)

    禁止打电话标志一般出现在什么地方(红米手机禁止打电话标志)

  • 电脑企业微信打不开(电脑企业微信打不开PPT文件)

    电脑企业微信打不开(电脑企业微信打不开PPT文件)

  • 打电话为什么显示无法访问移动网络(打电话为什么显示呼叫失败)

    打电话为什么显示无法访问移动网络(打电话为什么显示呼叫失败)

  • 钉钉怎么知道自己看没看直播(钉钉怎么知道自己看了直播回放)

    钉钉怎么知道自己看没看直播(钉钉怎么知道自己看了直播回放)

  • b站追剧哪里找(b站app追剧哪里找)

    b站追剧哪里找(b站app追剧哪里找)

  • ios13.3.1录屏在哪(苹果13.3系统录屏在哪里)

    ios13.3.1录屏在哪(苹果13.3系统录屏在哪里)

  • 什么是plc(什么是plc控制)

    什么是plc(什么是plc控制)

  • switch刚充电开不了机(switch充电开机没反应)

    switch刚充电开不了机(switch充电开机没反应)

  • oppor17长宽高多少(oppor 17长宽)

    oppor17长宽高多少(oppor 17长宽)

  • 手机拦截的信息在哪里可以找到(手机拦截的信息怎么看)

    手机拦截的信息在哪里可以找到(手机拦截的信息怎么看)

  • cc系统是什么意思啊(cc体系是什么意思)

    cc系统是什么意思啊(cc体系是什么意思)

  • iphonex通话听筒没声音(苹果x听筒打电话有杂音)

    iphonex通话听筒没声音(苹果x听筒打电话有杂音)

  • 华为m30和pro有什么不同(华为m30pro和p30pro哪个好)

    华为m30和pro有什么不同(华为m30pro和p30pro哪个好)

  • qb怎么换成余额(qb怎么换成余额的钱)

    qb怎么换成余额(qb怎么换成余额的钱)

  • 手机最大屏是多少寸(手机最大屏幕多少)

    手机最大屏是多少寸(手机最大屏幕多少)

  • PS基本的照片处理有哪些(ps图片的基本处理)

    PS基本的照片处理有哪些(ps图片的基本处理)

  • 百视通怎么投屏

    百视通怎么投屏

  • Win8如何连接到无线网络?(win8系统怎么连接无线)

    Win8如何连接到无线网络?(win8系统怎么连接无线)

  • IE的增强安全设置(ie增强的安全配置已启用上不了网)

    IE的增强安全设置(ie增强的安全配置已启用上不了网)

  • 房地产开发企业资质等级有几个
  • 企业所得税的会计处理
  • 城建税是什么税率
  • 职工食堂费用计入管理费用
  • 社保和公积金是从工资里面扣吗
  • 税收分类编码不对发票可以用吗
  • 逆流交易合并报表抵消分录
  • 工程收到奖励款怎么账务处理?
  • 固定资产忘了折旧有什么影响
  • 核定征收的企业所得税怎么算
  • 不是本公司员工
  • 红字发票可用于入账吗
  • 银行贷款的纳税申报表指的所得税还是增值税
  • 2016年的发票2020年可以认证吗
  • 个体工商户是否属于法人
  • 破产报表日是哪一日
  • 公司账户收到车险怎么做账
  • 工资薪金个税税率表
  • 签发空头支票的赔偿金
  • 金税盘月末做哪些事情
  • 本年利润期末
  • 公益性捐赠所得税处理
  • 在售房地产土地使用税如何计算?
  • 无法取得房地产原值怎么缴纳房产税?
  • 升级打装备的手游
  • 公司法人的车租赁合法吗
  • 以前年度应付账款做到制造费用如何改账
  • koeids.dll
  • 电脑老是弹出广告怎么处理
  • PHP:Memcached::fetchAll()的用法_Memcached类
  • php socket_read
  • 应付债券到期偿还
  • 前端如何用canvas绘制座位图
  • nicconfigsvc.exe - nicconfigsvc是什么进程 有什么用
  • php操作oracle
  • 工程项目成本核算的依据主要有
  • pytorch广播相乘
  • es6 promise是什么
  • cd播放模式
  • create命令属于什么语句
  • 床垫可以开专票抵扣吗
  • 公司股东利润分配方案范本
  • 城市维护建设税,教育费附加,地方教育费附加
  • 所得税申报表收入包含营业外收入吗
  • 企业之间支付的管理费指什么
  • 投资性房地产的后续计量
  • 个人包含什么
  • 解决烧心最快方法
  • SQL Server 2005 DTS导入平面数据出现错误解决方案
  • 申报过的印花税在哪查询呢
  • 劳务支出如何做账
  • 原材料采用实际成本法,在会计核算上应设置的账户是
  • 退货与销售折让的区别
  • 利息与资金占用费
  • 工会经费征收项目是什么
  • 备查账包括哪些
  • SQL Server Bulk Insert 只需要部分字段时的方法
  • bios如何设置关机键开机
  • linux cat 命令
  • 意大利的福利政策
  • win10开机提醒
  • win7打开tftp服务器
  • P2PNetworking3.exe - P2PNetworking3是什么进程 有什么用
  • win7怎样解除无线连接限制
  • win7系统怎么设置屏保
  • js继承的关键字
  • android textview设置字体
  • 详细分析我国针对疫情的国防动员举措
  • python 如何生成随机数
  • div显示边框线
  • 粒子form
  • 利用python进行
  • python支持中文字符
  • Easyui form combobox省市区三级联动
  • unity loom插件
  • window.showModalDialog谷歌不兼容
  • python模拟ajax
  • 房产税自用改为出租,房产税如何申报
  • 审计如何聚焦主责主业
  • 江苏省教师增量绩效多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设