位置: IT常识 - 正文

【pytorch】有关nn.EMBEDDING的简单介绍(pytorch nn.parameters)

编辑:rootadmin
【pytorch】有关nn.EMBEDDING的简单介绍 1. 引例

推荐整理分享【pytorch】有关nn.EMBEDDING的简单介绍(pytorch nn.parameters),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:pytorch nn.lstm,pytorch nn.model,pytorch nn.parameters,pytorch nn.parameters,pytorch nn.parameter,pytorch gan 例子,pytorch的nn.linear,pytorch的nn.linear,内容如对您有帮助,希望把文章链接给更多的朋友!

假设有一本字典,就一共只有10单词,每个单词有5个字母组成。 每一页上只写一个单词,所以这10页纸上分别写了这10个单词。

内如如下,

[[a,p,p,l,e], # page 0[g,r,e,e,n], # page 1[s,m,a,l,l], # page 2[w,a,t,c,h], # page 3[b,a,s,i,c], # page 4[e,n,j,o,y], # page 5[c,l,a,s,s], # page 6[e,m,b,e,d], # page 7[h,a,p,p,y], # page 8[p,l,a,t,e] # page 9]

我们假定这本字典叫embeding(10,5), 这里的10和5即上面介绍的含义,10个单词,每个单词5个字母;

现在我要查看第2页和第3页(从0开始),那么我会得到 [s,m,a,l,l], [w,a,t,c,h] 内容。

假定我们约定一个暗号,你告诉我页数,我就返回对应页数的单词。

如,你发给我暗号 [ [2,3], [1,0], [8,6] ] (即 shape为(3,2)的LongTensor)

我通过查询字典,告诉你

[[ [s,m,a,l,l], [w,a,t,c,h] ],[ [g,r,e,e,n], [a,p,p,l,e] ],[ [h,a,p,p,y], [c,l,a,s,s] ]]

这里的字典就是embeding table,而暗号就是查询这个table的索引值。

2. 为什么需要embeding?【pytorch】有关nn.EMBEDDING的简单介绍(pytorch nn.parameters)

有的时候我们直观看到的不一定就是事物的本质,我们需要透过现象看到“本质特征”或“隐藏特征”。 那么怎么透过呢? 或者说什么是“隐藏特征”呢?

embeding就是做这个事情,它将一句话,或者一段音通过查询“embeding table”来获取到“隐藏特征”。

embeding table一般是一组浮点型数值,它跟CNN,LSTM网络中一样,属于网络可学习的参数。 所以它的值不是人为定义的,人也定义不了这样的“字典”,它是通过深度学习网络中逐渐学习到的。

3. 回到pytoch

pytorch中的nn.Embeding提供了这样的实现;

下面是一个例子

import torch# 如同上面例子中的page索引a = torch.LongTensor([[1,2], [5,2]]) # 一个10个单词,每个单词5个字母的字典emb = torch.nn.Embedding(10,5)print(emb.weight, emb.weight.shape)# 同过索引查询embeding内容y = emb(a)print(y, y.shape)

可以看到“字典”不再是单词,而是一些浮点数,这些浮点数表示的就是隐藏特征。

4. 官方API

embedding

4.1参数介绍4.1.1 num_embedding和embedding_dim

num_embedding, embedding_dim就是上文中介绍 “单词”和“每个单词字母个数”,它表示了字典中embedding个数,以及每个embedding的维度。

4.1.2 padding_idx

padding_idx,是不更新梯度的“单词”的index;可以在字典中指定一个不被训练的embedding。 看下面的例子:

import torcha = torch.LongTensor([[1,2], [5,2]])emb = torch.nn.Embedding(10,5, padding_idx=0)print(emb.weight, emb.weight.shape)y = emb(a)print(y, y.shape)

这里的padding_index=0,它表示该index下的embedding不会学习更新,初始化的时候默认也是0.

4.1.3 max_norm和norm_type

max_norm,norm_type是获取到embedding后做正则化; norm_type 的可取值为1,2. 分别表示范式1和范式2,默认是2.

max_norm是定义范式中的最大值,如果embeding中的值大于这个阈值,则会重新做一下norm

本文链接地址:https://www.jiuchutong.com/zhishi/300724.html 转载请保留说明!

上一篇:Nginx跨域解决方案(nginx跨域配置详解)

下一篇:YOLO V7源码解析(yolov5源码解读)

  • 华为gt3和华为watch3手表区别(华为gt3和华为watch2pro手表区别)

    华为gt3和华为watch3手表区别(华为gt3和华为watch2pro手表区别)

  • 抖音k歌怎么录完整版(抖音k歌怎么录视频)

    抖音k歌怎么录完整版(抖音k歌怎么录视频)

  • 把对方抖音拉黑还能看到发的抖音吗(把对方抖音拉黑后看他主页会被发现吗)

    把对方抖音拉黑还能看到发的抖音吗(把对方抖音拉黑后看他主页会被发现吗)

  • 4k显卡最低要求(带动4k屏的最低显卡)

    4k显卡最低要求(带动4k屏的最低显卡)

  • 抖音直播可以屏蔽某个人吗(抖音直播可以屏蔽附近的人吗)

    抖音直播可以屏蔽某个人吗(抖音直播可以屏蔽附近的人吗)

  • 手提电脑有摄像头吗(手提电脑有摄像功能吗)

    手提电脑有摄像头吗(手提电脑有摄像功能吗)

  • 苹果电脑最小化快捷键(苹果电脑最小化窗口手势)

    苹果电脑最小化快捷键(苹果电脑最小化窗口手势)

  • 什么叫抖音流量(什么叫抖音流量?)

    什么叫抖音流量(什么叫抖音流量?)

  • 微信添加黑名单对方显示什么(微信添加黑名单后对方那里显示吗)

    微信添加黑名单对方显示什么(微信添加黑名单后对方那里显示吗)

  • 高通765和865的区别(高通765g和高通865哪个处理器好)

    高通765和865的区别(高通765g和高通865哪个处理器好)

  • 手机直播为何有电流声(手机直播为何有沙沙声)

    手机直播为何有电流声(手机直播为何有沙沙声)

  • 抖音网络不给力什么情况(抖音网络不给力请重试)

    抖音网络不给力什么情况(抖音网络不给力请重试)

  • 不小心点了确认收货可以收到吗(不小心点了确认收货还会正常派送吗)

    不小心点了确认收货可以收到吗(不小心点了确认收货还会正常派送吗)

  • pcie4.0有什么用(pcie4.0有什么用配什么显卡)

    pcie4.0有什么用(pcie4.0有什么用配什么显卡)

  • 微信跳过绑卡实名技术(2021微信跳过绑卡实名技术)

    微信跳过绑卡实名技术(2021微信跳过绑卡实名技术)

  • 手机管家清理的照片怎么恢复(手机管家清理的照片和视频怎么恢复)

    手机管家清理的照片怎么恢复(手机管家清理的照片和视频怎么恢复)

  • 一加7pro5g版上市时间(一加7pro有5g版吗)

    一加7pro5g版上市时间(一加7pro有5g版吗)

  • 抖音为什么不能转发(抖音为什么不能微信支付钱了呢)

    抖音为什么不能转发(抖音为什么不能微信支付钱了呢)

  • 钉钉打卡定位不准怎么修改(钉钉打卡定位不对怎么改)

    钉钉打卡定位不准怎么修改(钉钉打卡定位不对怎么改)

  • 黑鲨2支持nfc吗(黑鲨2pro手机支持nfc)

    黑鲨2支持nfc吗(黑鲨2pro手机支持nfc)

  • iphone x卡顿什么原因(iphone x有点卡)

    iphone x卡顿什么原因(iphone x有点卡)

  • 高德地图怎么没有声音(高德地图怎么没有自定义路线)

    高德地图怎么没有声音(高德地图怎么没有自定义路线)

  • pyqt5在python中调出提示框(pyqt5 pycharm)

    pyqt5在python中调出提示框(pyqt5 pycharm)

  • 个人独资企业需要报税吗
  • 关税的征收对象是贸易性商品,不包括
  • 应收账款的账龄在年报的哪里
  • 电子税务局利润表本期金额
  • 调拨单可以根据哪些单据生成
  • 个体户不足征是否要交房产税
  • 企业发生事故后的处理流程
  • 代扣代缴车船税手续费比例
  • 房租费可以摊销吗
  • 子公司给总公司开发票
  • 聘用劳务人员派遣合法吗
  • 发给一个人的说说
  • 房地产开发成本和开发费用的区别
  • 一般纳税人购进鸡蛋怎样抵扣
  • 没有认证方式
  • 劳保用品增值税税率是多少
  • 清包工程增值税税率
  • 未办理土地使用证违反了什么法律
  • 小微企业所得税税率多少
  • 交通卡定额发票购买
  • 填制和审核凭证是什么意思
  • 个人转让怎么写
  • 合作保证金规定
  • 补发住房补贴征求意见
  • 年报弥补以前年度亏损了还需要填107040表吗
  • 外购公司的长期投资如何做账
  • 专用发票已认证怎么退回
  • 台式电脑开不了机怎么办 屏幕黑屏
  • 怎么获得2021
  • php最新动态
  • php获取多选框的值
  • 产权登记在开发商名下怎么过户
  • 公共基础设施的英语
  • 国有企业所得税政策
  • 生产型企业出口退税计算案例
  • 新手会计怎么做帐
  • windows. location
  • 为什么那么多人考公务员
  • js方案
  • 织梦cms为什么不维护了
  • 转出未交增值税最终怎么转平
  • 保险中介手续费规定最新
  • 印花税都有什么类目
  • access里面也暗含了sql
  • 应计入应付款项的科目
  • 固定资产是怎么管理的
  • 品种法分批法分步法的区别
  • 季度缴纳房租申请怎么写
  • 装修费用账务怎么处理
  • 提取备用金如何填写现金日记账
  • 应收账款提坏账分录
  • 外币转入账户什么意思
  • 财政总预算会计的主体是
  • 贷款买车成功后,给客户什么手续
  • 采购自产自销的商品
  • 五证合一的办理流程是什么
  • 明细账建账的步骤
  • sql server常规错误
  • windows server特点
  • xp系统无法重装系统
  • 电脑怎样进入安全模式
  • windows内核版本9600
  • windowsxp网页打不开怎么办
  • windows windows.old
  • avgnt.exe
  • gwsystemservice.exe是什么进程 有什么作用 gwsystemservice进程查询
  • WIN10系统英文怎么改中文?
  • windows8语言栏不见了
  • win10/win8.1/win7系统遇到中英文输入法无法切换怎么办?
  • jquery表单验证代码
  • unity配置安卓sdk
  • css中清除浮动的目的有哪些
  • for语句中的++i
  • window.parent与window.openner区别介绍
  • 友盟的功能
  • 让你略表情包
  • javascript面向对象编程指南第三版
  • 福建省税务报税系统官网
  • 全资子公司和全资子企业的区别
  • 票种核定流程审批时间
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设