位置: IT常识 - 正文

【pytorch】有关nn.EMBEDDING的简单介绍(pytorch nn.parameters)

编辑:rootadmin
【pytorch】有关nn.EMBEDDING的简单介绍 1. 引例

推荐整理分享【pytorch】有关nn.EMBEDDING的简单介绍(pytorch nn.parameters),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:pytorch nn.lstm,pytorch nn.model,pytorch nn.parameters,pytorch nn.parameters,pytorch nn.parameter,pytorch gan 例子,pytorch的nn.linear,pytorch的nn.linear,内容如对您有帮助,希望把文章链接给更多的朋友!

假设有一本字典,就一共只有10单词,每个单词有5个字母组成。 每一页上只写一个单词,所以这10页纸上分别写了这10个单词。

内如如下,

[[a,p,p,l,e], # page 0[g,r,e,e,n], # page 1[s,m,a,l,l], # page 2[w,a,t,c,h], # page 3[b,a,s,i,c], # page 4[e,n,j,o,y], # page 5[c,l,a,s,s], # page 6[e,m,b,e,d], # page 7[h,a,p,p,y], # page 8[p,l,a,t,e] # page 9]

我们假定这本字典叫embeding(10,5), 这里的10和5即上面介绍的含义,10个单词,每个单词5个字母;

现在我要查看第2页和第3页(从0开始),那么我会得到 [s,m,a,l,l], [w,a,t,c,h] 内容。

假定我们约定一个暗号,你告诉我页数,我就返回对应页数的单词。

如,你发给我暗号 [ [2,3], [1,0], [8,6] ] (即 shape为(3,2)的LongTensor)

我通过查询字典,告诉你

[[ [s,m,a,l,l], [w,a,t,c,h] ],[ [g,r,e,e,n], [a,p,p,l,e] ],[ [h,a,p,p,y], [c,l,a,s,s] ]]

这里的字典就是embeding table,而暗号就是查询这个table的索引值。

2. 为什么需要embeding?【pytorch】有关nn.EMBEDDING的简单介绍(pytorch nn.parameters)

有的时候我们直观看到的不一定就是事物的本质,我们需要透过现象看到“本质特征”或“隐藏特征”。 那么怎么透过呢? 或者说什么是“隐藏特征”呢?

embeding就是做这个事情,它将一句话,或者一段音通过查询“embeding table”来获取到“隐藏特征”。

embeding table一般是一组浮点型数值,它跟CNN,LSTM网络中一样,属于网络可学习的参数。 所以它的值不是人为定义的,人也定义不了这样的“字典”,它是通过深度学习网络中逐渐学习到的。

3. 回到pytoch

pytorch中的nn.Embeding提供了这样的实现;

下面是一个例子

import torch# 如同上面例子中的page索引a = torch.LongTensor([[1,2], [5,2]]) # 一个10个单词,每个单词5个字母的字典emb = torch.nn.Embedding(10,5)print(emb.weight, emb.weight.shape)# 同过索引查询embeding内容y = emb(a)print(y, y.shape)

可以看到“字典”不再是单词,而是一些浮点数,这些浮点数表示的就是隐藏特征。

4. 官方API

embedding

4.1参数介绍4.1.1 num_embedding和embedding_dim

num_embedding, embedding_dim就是上文中介绍 “单词”和“每个单词字母个数”,它表示了字典中embedding个数,以及每个embedding的维度。

4.1.2 padding_idx

padding_idx,是不更新梯度的“单词”的index;可以在字典中指定一个不被训练的embedding。 看下面的例子:

import torcha = torch.LongTensor([[1,2], [5,2]])emb = torch.nn.Embedding(10,5, padding_idx=0)print(emb.weight, emb.weight.shape)y = emb(a)print(y, y.shape)

这里的padding_index=0,它表示该index下的embedding不会学习更新,初始化的时候默认也是0.

4.1.3 max_norm和norm_type

max_norm,norm_type是获取到embedding后做正则化; norm_type 的可取值为1,2. 分别表示范式1和范式2,默认是2.

max_norm是定义范式中的最大值,如果embeding中的值大于这个阈值,则会重新做一下norm

本文链接地址:https://www.jiuchutong.com/zhishi/300724.html 转载请保留说明!

上一篇:Nginx跨域解决方案(nginx跨域配置详解)

下一篇:YOLO V7源码解析(yolov5源码解读)

  • 花呗如何关闭(花呗如何关闭信用购)

    花呗如何关闭(花呗如何关闭信用购)

  • 漫步者蓝牙耳机怎么调节音量(漫步者蓝牙耳机一个响一个不响怎么办)

    漫步者蓝牙耳机怎么调节音量(漫步者蓝牙耳机一个响一个不响怎么办)

  • 华为荣耀50怎么恢复彩色屏幕(华为荣耀50怎么开空调)

    华为荣耀50怎么恢复彩色屏幕(华为荣耀50怎么开空调)

  • 双卡怎么设置一个卡不接电话(双卡怎么设置一样的来电铃声)

    双卡怎么设置一个卡不接电话(双卡怎么设置一样的来电铃声)

  • 微信怎么是黑色背景(微信怎么是黑色屏幕啊)

    微信怎么是黑色背景(微信怎么是黑色屏幕啊)

  • 微信给多个人同时发普通红包(微信怎样给多人发同样信息?)

    微信给多个人同时发普通红包(微信怎样给多人发同样信息?)

  • 文本分为哪几种类型(文本的种类)

    文本分为哪几种类型(文本的种类)

  • 移动硬盘的数据在电脑上有痕迹吗(如何恢复移动硬盘的数据)

    移动硬盘的数据在电脑上有痕迹吗(如何恢复移动硬盘的数据)

  • 关闭共享的相簿会删除什么(关闭共享相簿会怎么样)

    关闭共享的相簿会删除什么(关闭共享相簿会怎么样)

  • 直播导流是什么意思(直播导流好做吗)

    直播导流是什么意思(直播导流好做吗)

  • 抖音身份证怎么解绑(抖音身份证怎么换绑)

    抖音身份证怎么解绑(抖音身份证怎么换绑)

  • windows7 32位和64位区别

    windows7 32位和64位区别

  • 台式电脑键盘坏了怎么用模拟键盘(台式电脑键盘坏了怎么输入开机密码)

    台式电脑键盘坏了怎么用模拟键盘(台式电脑键盘坏了怎么输入开机密码)

  • word文档出现蓝色字体(word文档出现蓝色双线是什么意思)

    word文档出现蓝色字体(word文档出现蓝色双线是什么意思)

  • 网约车包括滴滴快车吗(网约车司机是滴滴司机吗)

    网约车包括滴滴快车吗(网约车司机是滴滴司机吗)

  • 手机号怎么查找抖音号(手机号怎么查找对方位置)

    手机号怎么查找抖音号(手机号怎么查找对方位置)

  • 小米手环4有没有测血压的功能(小米手环4有没有血氧监测)

    小米手环4有没有测血压的功能(小米手环4有没有血氧监测)

  • p30手机时间怎么设置(p30手机怎么录屏)

    p30手机时间怎么设置(p30手机怎么录屏)

  • 陌陌探探滑滑的区别(探探陌陌是干嘛的)

    陌陌探探滑滑的区别(探探陌陌是干嘛的)

  • qq怎么展示最近音乐(qq怎么展示最近听的歌曲)

    qq怎么展示最近音乐(qq怎么展示最近听的歌曲)

  • 管理软件对相机、麦克风等外设的使用权限(管理软件对相机的要求)

    管理软件对相机、麦克风等外设的使用权限(管理软件对相机的要求)

  • mediaman.exe是什么进程 有什么用 mediaman进程查询(media是什么文件)

    mediaman.exe是什么进程 有什么用 mediaman进程查询(media是什么文件)

  • JavaWeb web.xml配置详解(javaweb.xml配置文件)

    JavaWeb web.xml配置详解(javaweb.xml配置文件)

  • 工商年审实缴时间
  • 个人所得税年底返税
  • 小规模纳税人增值税申报表怎么填
  • 亏损可以不用缴增值税吗
  • 异地工程预缴税有哪些流程
  • 支出没有发票怎么做账
  • 社保证明缴费证明查询在哪查
  • 农产品加工业数据
  • 小规模纳税人增值税账务处理
  • 2021年电子税务局印花税怎么申报
  • 固定资产一次性扣除账务处理
  • 生育津贴计入应付职工薪酬吗
  • 企业外籍个人子女教育补贴
  • 预缴地实现的月销售额未超过
  • 设备拆装费计入什么科目
  • 收回已核销的坏账并入账
  • 非正常损失为什么不赔偿
  • 财政拨款结余的明细科目
  • 发票被盗丢失如何处理
  • amdr5 1400
  • 在Mac OS Yosemite 系统中如何发送超大邮件附件
  • linux命令使用
  • 实缴资金少有什么风险
  • 采用权益法核算
  • Kamikōchi, Nagano Prefecture, Japan (© sadao/Shutterstock)
  • 又十个超级有用的PHP代码片段
  • 借款业务包括以下哪些形式
  • vue组件继承并重写属性方法
  • php能开发微信小程序吗
  • php获取路径和目录的方法
  • 并发操作的定义
  • php mysql procedure实现获取多个结果集的方法【基于thinkPHP】
  • 年应税额是怎么算的
  • CSS SandBox
  • access数据库干嘛的
  • mysql清空缓存
  • mongodb从入门到商业实战
  • 全国通用机打销售票查询
  • 现金流量表的本期数是本月数还是本年数
  • 金税盘税务申报流程
  • 固定资产加速折旧的方法有哪些
  • 人力资源行业企业成长
  • 残保金申报方式改变时间
  • 怎样暂估成本的会计分录
  • 冲销暂估入账用什么凭证
  • 话费报销属于什么费用
  • 公司注销流程是哪些
  • 质量问题举例
  • 其他应收款个人在贷方表示什么
  • 咨询企业发生的费用计入
  • 保本理财产品如何赎回
  • 超市发票报销一般写什么明细
  • 采购费用属于什么会计分录
  • 企业开发有多个产品
  • 整个期间影响损耗的因素
  • 利润表每股收益增加说明什么
  • 制造费用怎么结算
  • mysql复制命令
  • windows任务管理
  • linux crontab命令详解
  • 如何在百度上发布自己的广告
  • mac系统锁屏
  • win8如何输入命令
  • android模块开发
  • 杀死oracle进程
  • qq自动登出
  • relative absolute无法冲破的等级问题解决第1/3页
  • 怎么在html中调用js的函数
  • 简述javascript的作用
  • linux c语言获取当前路径
  • python 操作微信
  • python中sort()的用法
  • js中的?
  • js实现自定义打印
  • window.showModalDialog谷歌不兼容
  • 冲减多计提的坏账准备
  • 企业所得税法中所称有关的支出是指
  • 农机作业服务费用 如何开发票
  • 新疆捡陨石地方叫什么
  • 税务之星ii驱动
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设