位置: IT常识 - 正文

BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么)

编辑:rootadmin
BERT模型基本理念、工作原理、配置讲解(图文解释) 一、BERT的基本理念

推荐整理分享BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bert模型的缺点,bert模型结构详解,bert模型怎么读,bert模型的缺点,bert模型结构详解,bert模型全称,bert模型的缺点,bert模型原理,内容如对您有帮助,希望把文章链接给更多的朋友!

BERT是Birdirectional Encoder Representation from Transformers的缩写,意为多Transformer的双向编码器表示法,它是由谷歌发布的先进的嵌入模型,BERT是自然语言处理领域的一个重大突破,它在许多自然语言处理任务中取得了突出的成果,比如问答任务,文本生成,句子分类等等,BERT成功的一个主要原因是,它是基于上下文的嵌入模型,这是它与其他流行的嵌入模型的最大不同,首先让我么了解有上下文的嵌入模型和无上下文的嵌入模型之间的区别,如以下两个句子

A:he got bit by python(他被蟒蛇咬了)

B:python is my favorite programming lauguage(python是我最喜爱的编程语言)

如果使用上下文无关的的嵌入模型进行计算单词python的嵌入值,则两个句子中python嵌入值相同,因为它会忽略语境

BERT是一个基于上下文的模型,它先理解预警,然后根据上下文生成该词的嵌入值,对于上面两个句子它将生成python不同的嵌入值,BERT将该句中的每个单词与句子中的所有单词相关联,以了解每个单词的上下文含义

 

由此可见,与上下文无关的模型生成的静态嵌入不同,BERT能够根据语境生成动态嵌入

二、BERT的工作原理

 顾名思义,BERT是基于Transformer的,我们可以把它看成只有编码器的Transformer

Transformer的编码器是双向的,它可以从两个方向读取一个句子,因此BERT由Transformer获得双向编码器特征,通过BERT模型,对于一个给定的句子,我们可以获得每个单词的上下文特征

三、BERT的配置

BERT的研究人员在发布该模型是提出了两种标准配置

BERT-base

BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么)

BERT-large

1:BERT-base 

它由十二层编码器叠加而成,每层编码器都使用十二个注意力头,其中前馈网络层由768个隐藏神经元组成,所以它得到的特征向量的大小为768

我们使用符号来表示上述内容

编码器的层数用L表示

注意力头的数量用A表示

隐藏神经元的数量用H表示

它的网络参数总数可达1.1亿个

2:BERT-large

该模型由二十四层编码器叠加而成,每层编码器都使用十六个注意力头,其中前馈网络层包含1024个隐藏神经元,所以得到的特征向量大小为1024

它的网络参数可达3.4亿个

3:BERT的其他配置

除了上述两种标准配置外,BERT还有多种不同的配置,下面列举一些小型配置

BERT-tiny L=2 H=128

BERT-mini L=4 H=256

BERT-small L=4 H=512

BERT-medium L=8 H=512

在计算资源有限的情况下,我们可以使用较小的BERT配置,但是标准的BERT配置可以得到更准确的结果并且应用更为广泛

创作不易 觉得有帮助请点赞关注收藏~~~ 

本文链接地址:https://www.jiuchutong.com/zhishi/298791.html 转载请保留说明!

上一篇:微信小程序实现滑动/点击切换Tab(微信小程序实现文件上传)

下一篇:前端中的BFC是什么?(前端bs是什么)

  • 免税合并和应税合并商誉
  • 免税外汇商品
  • 建筑施工企业增值税税率是多少
  • 金蝶迷你版年结怎么操作
  • 包工包料的税率2023
  • 金税盘坏了更换需要几天
  • 一般纳税人销售自己使用过的汽车
  • 残保基金的计算公式
  • 债务重组的会计处理方法
  • 固定资产出租的收入计入什么科目
  • 企业注销合适还是转让出去合适
  • 企业进货不收发票怎么做帐?
  • 企业无形资产摊销表述不正确
  • 哪些费用可以计入待摊费用
  • 资产负债表其他流动资产包括什么
  • 协议报价税率与开出的发票不一致怎么办?
  • 企业增值税不可以跨月交吗
  • 购买礼品赠送客户进项税处理
  • 土地使用税能计入土地转让的土地增值税清算吗
  • 进项大于销项怎么做账
  • 企业费用抵扣
  • 收到其他与经营活动有关的现金减少
  • 公司租车交税
  • i5 8500装win10
  • 生产成本在资产负债表中怎么填
  • 设计行业开票税点
  • win10任务栏隐藏正在运行的程序
  • PHP:pcntl_sigprocmask()的用法_PCNTL函数
  • 企业所得税汇算表
  • 房地产取得土地怎么做账
  • php yield 异步
  • 展开双翅的绯红之花
  • 企业所得税季度申报表营业收入怎么填写
  • vue3 element-plus
  • 冰川湾国家公园的冰川不止有白色一种
  • 进口货物完税价格怎么算
  • vue3 hooks实现
  • php中preg_replace_callback函数简单用法示例
  • 遍历enumeration
  • php类的定义
  • 所得税费用为什么不计入营业利润
  • 办理对公账户时间
  • 企业进行成本核算时,应根据生产经营特点
  • 行政事业单位工作时间
  • 纸质专票红冲
  • 单位内部食堂怎么收费
  • 中小企业开发票税率是多少
  • 建筑行业未取得收入如何结转成本
  • 简易计税项目的进项税能抵一般项目的销项税额吗?
  • 支付技术转让费所得税处理
  • 盘亏存货可以转回来吗
  • 幼儿园报税的基础是什么
  • 土地使用权使用年限怎么算
  • 固定资产改变用途折旧处理
  • 净资产收益率计算公式
  • 银行余额调节表电子版
  • 建账的过程包括哪些内容
  • windowsxp无法定位程序输入点
  • macos time machine
  • mac声音怎么调大
  • 如何使用升级助力器
  • 升级win10之后东西不见了
  • win7集成补丁教程
  • 双系统怎么转移文件
  • win7怎么录屏为什么不是视频
  • 关于node.js中的模块化规范
  • activity lunchmode详解
  • 详解16型人格
  • android开发项目实战+源码教程
  • html lang属性
  • nodejs连接mongodb副本集
  • jquery模拟表单提交
  • unity3d创建模型
  • mongoose python
  • 别踩白块世界纪录视频
  • cocos2d安装
  • 吉林税务网上办事大厅
  • 个体户开票怎么开步骤
  • 刚出生的宝宝身长多少正常
  • 盘锦税务局招聘信息
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设