位置: IT常识 - 正文

bert-bilstm-crf提升NER模型效果的方法(bert数据增强)

编辑:rootadmin
bert-bilstm-crf提升NER模型效果的方法 1.统一训练监控指标和评估指标

推荐整理分享bert-bilstm-crf提升NER模型效果的方法(bert数据增强),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bert调优,bert+crf,bert crf,bert 增量训练,bert+bilstm+crf,bert+lstm+crf,bert+crf,bert+crf,内容如对您有帮助,希望把文章链接给更多的朋友!

评估一个模型的最佳指标是在实体级别计算它的F1值,而不是token级别计算它的的准确率。自定义一个f1值的训练监控指标传给回调函数

Preliminary

TP:实际为P,预测为P

TN:实际为N,预测为N

FP:实际为N,预测为P

FN:实际为P,预测为N

如何记忆:

TP/TN: 以T开头,表明预测正确,预测即为第二个字母

FP/FN: 以F开头,表明预测错误,预测与第二个字母相反

Accuracy

最简单也是最好理解的,也是我们很早就开始接触的一个指标就是准确率,即预测正确的样本除以总样本数

Recall, Precision, F1

Recall(召回率):预测正确的正类在正类样本中的比例(针对于样本真实情况)

Precision(精确率):预测正确的正类在预测为正类中的比例(针对于预测情况)

F1:两者通常难以兼得,因此引入两者的调和平均,来得到一个trade-off的值

2、学习率衰减策略

学习率是深度学习中的一个重要的超参,如何调整学习率是训练出好模型的关键要素之一。

在训练过程中,一般根据训练轮数设置动态变化的学习率。

刚开始训练时:学习率以 0.01 ~ 0.001 为宜。

一定轮数过后:逐渐减缓。

接近训练结束:学习速率的衰减应该在 100 倍以上。

两种学习率衰减模式,一种为线性衰减,一种为指数衰减。

如果学习率过小,梯度下降很慢,如果学习率过大,如 Andrew Ng 的 Stanford 公开课程所说梯度下降的步子过大可能会跨过最优值。不同的学习率对 loss 的影响如下图所示:

3、分层设置学习率,非bert层要大

在使用bert或者其它预训练模型进行微调,下接其它具体任务相关的模块时,会面临这样一个问题,bert由于已经进行了预训练,参数已经达到了一个较好的水平,如果要保持其不会降低,学习率就不能太大,而下接结构是从零开始训练,用小的学习率训练不仅学习慢,而且也很难与BERT本体训练同步。因此在训练时候就需要对预训练层设置较小学习率,对下接层设置较大学习率。

4、使用对抗训练提升模型鲁棒性

对抗训练是一种能有效提高模型鲁棒性和泛化能力的训练手段,其基本原理是通过在原始输入上增加对抗扰动(噪声),得到对抗样本,再利用对抗样本进行训练,从而提高模型的表现。

5、更精细化的调参

调整learning_rate or batch_size or lamb等等

实验数据记录

#

模型

超参数

实验结果

备注

1

bilstm+crf

lstm_units = 64

epochs =80

batch_size = 32

drop_rate = 0.2

f1=0.6075

2

bilstm+crf

lstm_units = 128

epochs = 80

batch_size = 32

drop_rate = 0.2

f1=0.6011

3

bert+bilstm+crf

epochs = 8

max_len = 80

batch_size = 32

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6697

4

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

bert-bilstm-crf提升NER模型效果的方法(bert数据增强)

leraning_rate = 1e-5

f1=0.7262

5

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6745

统一训练监控指标和评估指标

增加学习率衰减策略

6

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.7159

分层次设置学习率

lr_multiplier=500

7

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6889

分层次设置学习率

lr_multiplier=500

增加对抗训练(噪声)

8

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6828

统一训练监控指标和评估指标

增加学习率衰减策略

分层次设置学习率

lr_multiplier=500

增加对抗训练(噪声)

5

bert+bilstm+crf

epochs = 16

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.7201

统一训练监控指标和评估指标

5

本文链接地址:https://www.jiuchutong.com/zhishi/300671.html 转载请保留说明!

上一篇:ES6笔记————let,箭头函数,剩余参数(es6从入门到实战)

下一篇:【C语言进阶】文本与二进制操作文件,优化通讯录。(c语音进阶)

  • 微信电脑版为什么没有朋友圈(微信电脑版为什么打不开)

    微信电脑版为什么没有朋友圈(微信电脑版为什么打不开)

  • 爱奇艺随刻版真的免费吗(爱奇艺随刻版真的假的)

    爱奇艺随刻版真的免费吗(爱奇艺随刻版真的假的)

  • win10如何解压rar文件(win10如何解压pkg文件)

    win10如何解压rar文件(win10如何解压pkg文件)

  • redmi k30pro变焦版和标准版的区别(redmik30pro变焦版价格)

    redmi k30pro变焦版和标准版的区别(redmik30pro变焦版价格)

  • 携程候补抢票能抢到吗(携程火车票候补抢票还能买到吗)

    携程候补抢票能抢到吗(携程火车票候补抢票还能买到吗)

  • word工具栏变灰不能用怎么办(word工具栏变灰色用不了)

    word工具栏变灰不能用怎么办(word工具栏变灰色用不了)

  • 滴滴可用余额和账户余额不一致(滴滴的余额和可用余额)

    滴滴可用余额和账户余额不一致(滴滴的余额和可用余额)

  • 微信朋友圈怎么显示全文(微信朋友圈怎么转发别人的朋友圈)

    微信朋友圈怎么显示全文(微信朋友圈怎么转发别人的朋友圈)

  • 微星主板usb电涌无法开机(微星主板usb供电)

    微星主板usb电涌无法开机(微星主板usb供电)

  • 咕咕机可以打印彩色相片吗(咕咕机可以打印不干胶贴纸吗)

    咕咕机可以打印彩色相片吗(咕咕机可以打印不干胶贴纸吗)

  • 怎么把cad中的图形复制到另外一个窗口中(怎么把cad中的图形复制到excel中)

    怎么把cad中的图形复制到另外一个窗口中(怎么把cad中的图形复制到excel中)

  • ps ctrl+t没反应(ps ctrl+j没反应)

    ps ctrl+t没反应(ps ctrl+j没反应)

  • 解封辅助验证有风险吗(解封辅助验证有危险吗)

    解封辅助验证有风险吗(解封辅助验证有危险吗)

  • ef-s镜头跟ef镜头区别(ef-s镜头和ef-m)

    ef-s镜头跟ef镜头区别(ef-s镜头和ef-m)

  • 手机120hz刷新率什么意思(手机120hz刷新率费电吗)

    手机120hz刷新率什么意思(手机120hz刷新率费电吗)

  • 荣耀v10插内存卡会变慢吗(荣耀v10插内存卡在哪里)

    荣耀v10插内存卡会变慢吗(荣耀v10插内存卡在哪里)

  • 电脑用5年太卡了

    电脑用5年太卡了

  • 苹果11能用几个小时(苹果11和苹果12的区别)

    苹果11能用几个小时(苹果11和苹果12的区别)

  • qq秘密朋友的朋友是啥意思(qq朋友的朋友在秘密在哪)

    qq秘密朋友的朋友是啥意思(qq朋友的朋友在秘密在哪)

  • cpu首要任务是什么(cpu的首要任务是什么)

    cpu首要任务是什么(cpu的首要任务是什么)

  • 苹果手机不设置id账号可以用吗(苹果手机不设置id可以使用吗)

    苹果手机不设置id账号可以用吗(苹果手机不设置id可以使用吗)

  • 手机怎么把照片p到另一张照片上(手机怎么把照片转换成jpg格式)

    手机怎么把照片p到另一张照片上(手机怎么把照片转换成jpg格式)

  • oppoa9x抬头灯怎么设置(oppo手机怎么关闭一抬头就亮呢)

    oppoa9x抬头灯怎么设置(oppo手机怎么关闭一抬头就亮呢)

  • 怎么在目录前添加空白页(怎么在目录里加东西)

    怎么在目录前添加空白页(怎么在目录里加东西)

  • 硬盘读写速度慢(移动硬盘读写速度慢)

    硬盘读写速度慢(移动硬盘读写速度慢)

  • xsmax屏幕刷新率多少(xsmax刷新率多少hz)

    xsmax屏幕刷新率多少(xsmax刷新率多少hz)

  • 苹果虚拟键怎么调出来(苹果虚拟键怎么取消掉)

    苹果虚拟键怎么调出来(苹果虚拟键怎么取消掉)

  • 个人房产投资入股公司过户
  • 小规模纳税人申请一般纳税人条件
  • 小规模企业税收优惠政策2023
  • 拍卖行业收取手续费标准
  • 资产管理公司的使命
  • 电力工程服务费计入什么科目
  • 网银盾属于什么费用
  • 投资者回售选择权是什么意思
  • 银行转账结算的方式有哪些
  • 企业取得5%的房产增值税发票是否可以抵扣呢?
  • 多缴纳的税款不退税怎么入账
  • 领用包装物会计处理
  • 企业支付员工一年多少钱
  • 一般纳税人企业所得税政策最新2023税率
  • 在建工程完工,并当日签订出租协议的会计分录
  • 购买方申请的红字信息表需要邮寄给销售方吗
  • 加盟费需要缴纳多少税
  • 小规模纳税人核定征收标准
  • 销售价格调整
  • 发票金额与实际付款金额不一致
  • 亿企代账怎么删除科目
  • 打样费入什么科目
  • 长期待摊费用的概念
  • 公对公如何转账不用开票
  • 车船使用税凭证还要过户吗怎么办
  • PHP:zip_entry_compressionmethod()的用法_Zip函数
  • 收不回的应收账款会计分录
  • 集团与子公司资产的关系
  • 已计提的存货跌价准备计入成本吗
  • 社保基数和实际工资怎么算
  • 如何用css设置图片大小
  • php获取访问者信息
  • 企业的安全费用怎么弄
  • python爬虫中数据接口的含义
  • 购扶贫产品怎么记账
  • 发票2种
  • pycharm cant find main
  • 增值税发票上多了一个点能刮掉吗
  • 发票章丢了会不会有事
  • 社保代扣代缴的办理流程
  • 银行存款余额调节表保管期限
  • 农民专业合作组织法律制度的类型包括哪些?
  • 限额领料单属于什么凭证
  • 发票可以付款前开吗
  • 医院发票丢失怎么补办
  • 电子承兑汇票承兑后几天到账
  • 公司被仲裁后怎么补救
  • 银行承兑汇票套利案例
  • 企业出租房产增值税怎么计算
  • 施工单位名称变更需不需要单独做一个联络函
  • 应缴国库款和应缴专户款的区别
  • 主营业务成本如何设置明细
  • 代理进口货物如何确定增值税纳税人
  • 参加新冠疫情防控工作感悟 医务人员
  • 应收账款的会计要素
  • 未确认收入的会计分录
  • 工程材料票占工程款的比例
  • 应收账款周转率范围多少合适
  • 工业企业产值如何确定
  • 房地产核算
  • 怎样设置windows不更新
  • yum更新所有软件
  • xp系统的启动快捷键
  • avsched32.exe是什么进程 avsched32进程有什么作用
  • win8系统无法开机出现字母
  • win8 怎么样
  • 网卡被禁用一启动就死机
  • 麒麟系统命令
  • JavaScript的Ext JS框架中的GridPanel组件使用指南
  • 炉石传说代码怎么导入
  • qt渲染引擎
  • css布局的经典网站
  • javascript的dom操作
  • android网络编程题库
  • 关于怀孕在线咨询
  • 安卓自定义app
  • 江苏国税电子税务局打印控件
  • 查汽车发票从哪个网站查
  • 网上税务局网址
  • 企业税收有哪些税种
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设