位置: IT常识 - 正文

深度学习模型精度fp16和fp32

编辑:rootadmin
深度学习模型精度fp16和fp32

推荐整理分享深度学习模型精度fp16和fp32,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

当前的深度学习框架大都采用的都是fp32来进行权重参数的存储,比如Python float的类型为双精度浮点数fp64,PyTorch Tensor的默认类型为单精度浮点数fp32。

使用fp32主要存在问题:

模型尺寸大,训练的时候对显卡的显存要求高;模型训练速度慢;模型推理速度慢。深度学习模型精度fp16和fp32

解决方案:使用低精度计算对模型进行优化

1.推理过程中,模型优化目前比较成熟的方案就是fp16量化和int8量化;

2.训练方面的方案是混合精度训练,它的基本思想很简单: 精度减半(fp32→ fp16) ,训练时间减半。与单精度浮点数float32(32bit,4个字节)相比,半精度浮点数float16仅有16bit,2个字节组成。

训练过程中,直接使用半精度进行计算会导致的两个问题:

舍入误差(Rounding Error):对足够小的浮点数执行的任何操作都会将该值四舍五入到零,在反向传播中很多甚至大多数梯度更新值都非常小,在反向传播中舍入误差累积可以把这些数字变成0或者nan,这会导致不准确的梯度更新,影响网络的收敛。溢出错误(Grad Overflow / Underflow):精度下降(小数点后16相比较小数点后8位要精确的多)会导致得到的值大于或者小于fp16的有效动态范围,也就是上溢出或者下溢出。

解决方案:使用混合精度训练(Mixed Precision)和损失缩放(Loss Scaling)

基于apex的apm(Apex混合精度加速):

自动:Tensor的dtype类型会自动变化,框架按需自动调整tensor的dtype混合精度:采用不止一种精度的Tensor,torch.FloatTensor和torch.HalfTensor

本文链接地址:https://www.jiuchutong.com/zhishi/281013.html 转载请保留说明!

上一篇:sentstrt.exe - sentstrt进程是什么文件 有什么用

下一篇:linux系统怎么使用vmstat命令显示虚拟内存状态?(linux zmodem)

  • 境外代扣代缴增值税
  • 二手车固定资产
  • 报表申报错误怎么作废重报
  • 铲车用什么燃油
  • 购买金税盘抵扣
  • 企业清算货币资金怎么算
  • 行政事业单位国有资产处置管理办法
  • 作废的支票银行怎么处理
  • 原材料亏损率怎么算
  • 超市费用能否税前扣减?
  • 经济合同
  • 未收到发票暂估入库的进项税额可以暂估进原料成本吗
  • 企业收到退回商品的会计分录
  • 发票缴税怎么交的
  • 防洪费2019年税率
  • 非专利技术属于无形资产吗?
  • 金蝶财务软件录入凭证
  • 会计调账有哪些方式
  • 产品质量认证的基本条件有哪些
  • 公司股权转让会议决议
  • 个人所得税住房租金可以扣多少
  • php技术基础知识
  • 筹建期间费用计什么科目
  • 共用水电无法取水怎么办
  • php 设计模式 鸟哥
  • 怎么计算应缴所得税
  • 微笑的树懒哥斯达黎加
  • 销售废旧设备增值税率
  • 小企业会计制度最新版
  • static php作用
  • 销售返利的会计处理方法
  • 在发生以下的情况下,可判定货物
  • 出售子公司股权不丧失控制权
  • 车辆转让后的责任谁承担
  • 出纳会计和现金会计的区别
  • 公司购买的商品是白酒用于招待现金流项目是哪类
  • 机票行程单可以在到达地打印吗
  • php网站漏洞
  • 起重机属于固定资产中什么设备类型
  • 企业所得税多预缴了怎么办
  • 以前年度多缴纳房产税,可以递延次年度使用么
  • 企业弥补亏损的会计分录
  • 纳税滞纳金的计算方法
  • 汽车买卖中介
  • 现金回收率怎么计算
  • 房地产影响投资和消费,事关民生和发展
  • 营改增后营业费用科目还有吗
  • 新开公司费用
  • 以前年度财务费用漏记
  • 其他应付款转应付账款分录
  • 向客户收取贴纸费用怎么说
  • 净资产是什么意思举例说明
  • 金税三期网络设置
  • mysql found_row()使用详解
  • sqlserver数据库备份
  • sql中去掉结果为零的
  • freebsd使用wifi
  • solaris init
  • 映泰重装系统按什么
  • 双屏windows
  • windows8触摸屏手势设置
  • 资源管理器 windows
  • ubuntu15.04安装教程
  • win10 mobile 1709
  • win7打开回收站
  • 免安装版怎么用
  • css div高度填满父容器剩余空间
  • perl 获取参数
  • cocos2dx ActionManager播放动画回调问题
  • 菜单下一章
  • 安卓微博评论界面图片
  • shift妙用之解决shell编程中的入参问题
  • python爬虫系统
  • shell读取文本内容到变量
  • Button.setOnClickListener(OnClickListener l) 原理
  • jquery实现div左右移动
  • jquery complete
  • 国家税务总局张局长
  • 小规模纳税人忘记作废发票导致超过免税范围
  • 税务局打来电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设