位置: IT常识 - 正文

最通俗易懂的LSTM讲解,一个例子理解通透!!(最通俗易懂的电动力学教材)

编辑:rootadmin
最通俗易懂的LSTM讲解,一个例子理解通透!!

推荐整理分享最通俗易懂的LSTM讲解,一个例子理解通透!!(最通俗易懂的电动力学教材),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:最通俗易懂的资治通鉴,最通俗易懂的庄子书籍,最通俗易懂的资治通鉴,最通俗易懂的朗道能级,最通俗易懂的庄子书籍,最通俗易懂的背诊话术,最通俗易懂的朗道能级,最通俗易懂的背诊话术,内容如对您有帮助,希望把文章链接给更多的朋友!

刚开始做程序开发时,提交代码前需要让大佬review,大佬们看完,总会在评论区打出一串"LGTM"。作为小白的我,天真的以为大佬觉得我的代码质量很好,在开玩笑的夸我说"老哥太猛"。

后来才知道,这原来是review的一种黑话,look good to me的意思,也就是说"我觉得没问题"。

后来学算法,看到了LSTM,心想,这又是个啥,不会是"老师太猛"吧!当然不是!

LSTM——long short term memory,长短时记忆,是一种特殊的循环神经网络。这个网络的主要是用来处理具有时间序列的数据任务,比如文本翻译、文本转语音等等。LSTM 的文章有很多,一百度五花八门,基本上来就是公式一扔,三个门一讲完事。看完之后,也就是看完之后了,还是不能有感性认识,“为啥,LSTM处理这种具有时间序列的任务效果会很好呢?”

通俗的例子,才是理解的王道,下面是我用一个小例子来说明这个原理。通俗的讲解,可能会丢失算法的严谨,但不妨碍对lstm有个感性认识。(很早之前看过的例子,来自B站up主 @老弓的学习日记,最近又确认下确实是这个,帮up署个名)。

请跟上我的思路,文章不长,读完后,希望你会有一个全新的认识。

进入假设

首先我们假设一个场景,我们是大学生,目前正处于期末考试阶段,并且已经考完了线性代数,接下来还有一门高数要考,而我们作为学生,很自然的要开始复习(学习)高数的内容了。在这个场景中,使用LSTM来处理这种带有时间序列的任务,即考完了线性代数,接着去学习高数。我们来看看,LSTM是怎么和人一样,学到了高数的内容的。虽然不打算说技术细节,但是LSTM里的一些概念还是要结合例子来说。

首先,LSTM的结构大致如下面这样。

我们只看中间的一个方框,他接受了前面方框的两个输出(一个是上一层真正的输出状态—上面的黑色箭头,一个是上一层输出的隐藏状态—下面的输出箭头),同时接受了一个新的Xt作为输入。

好,那我们就从这里开始。

我们现在要参加高数考试了,在学习高数知识。我们肯定是希望把所有与高数有关的内容都记住,与高数无关的都忘掉,最好就是在参加高数考试时,大脑里全是高数知识,其他的什么物理化学知识全部忘掉。我们从中间的大方框的最左边来分析。

首先这个时候,我们接受了上一个单元时刻的输出,上一个时刻我们考线性代数,输出的状态是刚考完线性代数的状态,那我们这个时候最想做的是什么?当然是把之前学的与本次考高数无关的都忘掉(选择性遗忘),为什么说是选择性遗忘呢?我们上一场考的是线性代数,那本场接着考高数,其实线性代数和高数之间还是有很多知识相关的,所以这个时候我们肯定希望把相关的部分留下来,把不相关的忘掉。那如果上一场我们考的是英语,那么大概率所有知识都是不相关的,我们几乎都可以忘掉。

ok,说到这,怎么把上一个方框单元的输出状态进行选择性遗忘呢?这里就遇到了 LSTM 结构中的第一个门 —— 遗忘门。

遗忘门

最通俗易懂的LSTM讲解,一个例子理解通透!!(最通俗易懂的电动力学教材)

​我们可以看第一个遗忘门是由一个激活函数和一个乘法来完成的,它接受了本次状态的信息(xt),也就是我们正在复习的高数的知识,同时接受了上一个方框单元的隐藏状态(ht-1, 上一场考试后我们的大脑状态),然后通过激活函数后与上一个单元的输出(Ct-1)做乘法。形象的解释一下这个过程。我们学习了高数的内容(xt),大脑中还保留了一部分上一场线性代数的内容,也就是隐藏状态(ht-1),这两个状态经过激活函数激活,选择性的保留,谁的权重大,那么谁最后保留下来的信息就多。

所以,这一步,我们刻苦复习高数和不刻苦复习高数,对应xt的权重是不一样的,肯定刻苦复习高数会使得高数的权重更大,那么保留下来的信息就多,经过激活函数之后,我们认为保留下来的更多的是和高数有关的信息。那么这个信息去和上一场考试完成时的输出状态相乘(得到的信息就是和高数有关的信息(这个信息会继续往后传),其余的与高数无关的信息由于激活后几乎为零,也就被遗忘了。

ok到了这,我们把之前该遗忘的都遗忘了,但是要参加高数考试,光遗忘(清空大脑无用信息)是远远不够的,更重要的是要把我们学到的高数知识(xt)给记住。那我们需要给大脑输入新学到的高数知识,也就是LSTM要学习高数知识,接下来就到了第二个门 - 输入门。

输入门

从名字也很好理解,输入本层想学的知识,所以叫做输入门。

​看上图,本次学习的高数知识(xt)和上次隐层的状态结合后,通过一个激活,然后还通过了一个tanh,然后两者相乘。本次的激活与遗忘门的激活不同之处在于,遗忘门的激活输出是作用在上一层的输出上,而输入门的激活是作用在tanh的输出上。通俗的理解,这样会选择我们本次学习的高数的内容(因为不是所有的高数内容都会被考到),两者相乘起到一个信息过滤的作用,乘法的输出为提纯后的高数知识(这些高数知识大概率会被考到),然后和上面经过遗忘门筛选过的信息相加,就得到了一个新的考高数时的知识库(在这里,有上一层(考完线性代数后)遗留下来的与高数考试相关的知识,比如最简单的加减乘除等通用运算知识,也有本次复习高数之后经过提纯的知识,比如微积分,可以说是必考题)。

那到了这一步,基本上我们就可以去参加考试了,下面就是输出门。

输出门

​输入门和遗忘门的信息相加之后(Ct),直接输出到下一层。

​输出门还有个分支,xt通过激活之后和tanh的输出相乘,然后作为隐藏状态传给下一层。

那这是在干嘛呢?还记得我们的目的是干什么?考试!这里就理解为正在考高数好了。带着之前提纯过的知识以及本次学的知识,做了几道高数题,然后考完了高数(又是一次信息过滤,只记住了考完高数后的考的那几道题),作为隐藏状态传给下一层。有可能下层又要考数理统计了,数理统计可能又要用到本层的高数知识以及前一层的线性代数的知识了,又一个循环,直到所有的考试结束。

用这个考试的例子,通俗的描述了下遗忘门、输入门和输出门的作用,以及LSTM是如何做到选择性遗忘和信息过滤的。希望能帮助到学习LSTM的你。

至于为什么在LSTM中,遗忘门可以遗忘掉我们不想要的信息,输入门可以提纯信息,输出门去考试的时候可以发挥最好的状态去做题呢?

那是LSTM网络训练的事了。在训练LSTM的时候,最终网络收敛会得到一系列的权值,用于帮助遗忘门更好的遗忘,输入门更好的输入,输出门更好的输出。

最后,一些技术细节比如为什么要选sigmoid激活,大家感兴趣可以去Google,这里不再赘述了。希望你看完能对LSTM有个感性的认识。

最近手撸了一本《长文解析Resnet50的算法原理》,用偏专业性的科普通俗语言,讲解了Resnet50中几乎所有层的算法。关注公众号回复【resnet】即可领取电子版pdf。

用写毕业论文的姿态写的,一把辛酸泪,1.8w字,全是干货。赶快来下载吧。

码字不易,欢迎一点三连关注 @董董灿是个攻城狮

董董灿自述 | 我是一个攻城狮

点个赞呗

本文链接地址:https://www.jiuchutong.com/zhishi/297717.html 转载请保留说明!

上一篇:Vue中的Pinia状态管理工具 | 一篇文章教会你全部使用细节(vue pending)

下一篇:2022年电子设计竞赛B题倒库闭环的思考(2022年电子设计大赛F题)

  • 腾讯会议有美颜吗(腾讯会议有美颜功能吗)

    腾讯会议有美颜吗(腾讯会议有美颜功能吗)

  • 苹果手机怎么改视频文件名(苹果手机怎么改定位)

    苹果手机怎么改视频文件名(苹果手机怎么改定位)

  • 中国电信4g网络变慢(中国电信4g网络测速)

    中国电信4g网络变慢(中国电信4g网络测速)

  • hs8145c5是千兆光猫吗(hs8145c 千兆)

    hs8145c5是千兆光猫吗(hs8145c 千兆)

  • 抖音已读功能怎么关闭(抖音已读功能怎么设置未读)

    抖音已读功能怎么关闭(抖音已读功能怎么设置未读)

  • sim卡是手机号卡吗(手机sim卡属于什么卡)

    sim卡是手机号卡吗(手机sim卡属于什么卡)

  • cad默认工具栏没了(cad默认工具栏没反应)

    cad默认工具栏没了(cad默认工具栏没反应)

  • 手机版网易云音乐怎么把歌词放到桌面(手机版网易云音乐怎么看歌词)

    手机版网易云音乐怎么把歌词放到桌面(手机版网易云音乐怎么看歌词)

  • 微博名片二维码在哪里(微博主页二维码)

    微博名片二维码在哪里(微博主页二维码)

  • 快手长腿瘦身特效在哪(快手长腿瘦身特效跟以前不一样)

    快手长腿瘦身特效在哪(快手长腿瘦身特效跟以前不一样)

  • 荣耀青春版10系统要不要更新(荣耀青春版10系列参数)

    荣耀青春版10系统要不要更新(荣耀青春版10系列参数)

  • leftshift是哪个键(left键盘哪个键)

    leftshift是哪个键(left键盘哪个键)

  • ml6h2ch a是什么版本(ml6h2ch/a是苹果什么型号)

    ml6h2ch a是什么版本(ml6h2ch/a是苹果什么型号)

  • 手机怎么安装微信(手机怎么安装微信电脑版)

    手机怎么安装微信(手机怎么安装微信电脑版)

  • airpods怎么升级(airpods怎么升级?)

    airpods怎么升级(airpods怎么升级?)

  • 理财产品排行榜里哪种理财产品更可靠?(理财产品排行榜前十名)

    理财产品排行榜里哪种理财产品更可靠?(理财产品排行榜前十名)

  • 米8闪屏什么原因引起(米8se屏幕老是闪)

    米8闪屏什么原因引起(米8se屏幕老是闪)

  • 三星s10 耳机型号(三星s10耳机是什么接口)

    三星s10 耳机型号(三星s10耳机是什么接口)

  • 苹果手机怎么看电视直播(苹果手机怎么看是不是正品新机)

    苹果手机怎么看电视直播(苹果手机怎么看是不是正品新机)

  • 收款音响怎么连接手机(收款音响怎么连接蓝牙)

    收款音响怎么连接手机(收款音响怎么连接蓝牙)

  • 微信老是延迟收到消息(微信老是延迟收到短信)

    微信老是延迟收到消息(微信老是延迟收到短信)

  • 如何解决win10电脑键盘被锁住无法打开?(windows10 电脑)

    如何解决win10电脑键盘被锁住无法打开?(windows10 电脑)

  • 蜡梅的养殖方法(蜡梅的养殖方法视频)

    蜡梅的养殖方法(蜡梅的养殖方法视频)

  • 可视化大屏的几种屏幕适配方案,总有一种是你需要的(可视化大屏的几种模式)

    可视化大屏的几种屏幕适配方案,总有一种是你需要的(可视化大屏的几种模式)

  • 材料抵扣货款怎么写简单协议范本
  • 红字专票进项税额如何做
  • 一次性分红到期还本的会计分录
  • 固定资产报废属于非常损失吗
  • 保证金交易收益率
  • 挂靠单位怎么缴纳增值税?
  • 行政单位的财务报告包括财务报表和财务情况说明书
  • 一次还本付息债券到期收益率
  • 核销确实无法收回的应收账款后会影响资产负债率
  • 融资租赁开始日最低租赁付款额
  • 小规模和一般纳税人的区别
  • 公司进货可以计提折旧吗
  • 对公业务指什么
  • 非独立核算的分公司企业所得税怎么申报
  • 小规模免征增值税政策
  • 代缴水电费是什么意思
  • 接受个人投资现金怎么做账务处理?
  • 大巴车票抵扣税率
  • 建筑设计公司的账务处理
  • 离婚后房产过户需要多少钱
  • 如何增强无线网卡的接收能力
  • 教育培训行业收入
  • 打开浏览器时间长
  • 劳务费费用
  • 在建工程进项税可以抵扣吗
  • 微软win11预览版
  • element_ui
  • 发票开错了怎么处理好?
  • 会计分录的基本构成要素
  • phpunicode
  • ipad air3发布会价格
  • SSD目标检测算法
  • 一般纳税人企业所得税多久申报一次
  • yolo v5详解
  • lxml&xpath一站式教学
  • 如何在idea上运行python
  • 个体户个人所得税税率表2023计算
  • 业务招待费进项转出报表怎么填
  • 公司承担员工的社保费会计分录
  • 零申报不报税有什么后果
  • sql server如何设置远程连接
  • 增值税为什么不在利润表里体现
  • 赠送商品入什么科目
  • 申报要补税怎么办
  • acca中ebq等于
  • 暂估回冲方式
  • 进项税额转出结转还是红冲
  • 固定资产报废如何进行账务处理
  • 检测费用的会计分录
  • 预收账款处理
  • 银行的现金解款需要多久
  • 如何操作开具红字发票
  • 生产性生物资产账务处理
  • 发现错账后进行错账更正的方式
  • MySQL ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO) 的原因分解决办法
  • windows server2008 64位没有安装音频怎么办?
  • 修改远程桌面端口命令是什么
  • ubuntu怎么安装程序
  • 如何查看电脑型号及配置
  • windows7桌面出现一个窗口删除不了
  • WFXMOD32.EXE - WFXMOD32是什么进程
  • gnaupdaemon.exe是什么
  • 无人值守工厂
  • win8一直在开始界面
  • 虚拟机里面如何设置网络
  • win7如何查询电脑使用记录
  • win10使用入门教程
  • linux桌面设置界面在哪
  • js获取数组元素个数
  • Unity3D游戏开发培训课程大纲
  • linux rsync同步命令(值得收藏)
  • 输出语句的执行过程
  • javascript基本语句
  • js函数详解
  • 自定义dialog屏蔽按键
  • 黑龙江地方税务总局官网
  • 生活垃圾处理合作协议
  • 主要领导成员是指
  • 价税分离有什么好处
  • 购买税控盘的发票需要交印花税吗?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设