位置: IT常识 - 正文

三分钟认知Softmax和Sigmoid的详细区别(softag)

编辑:rootadmin
三分钟认知Softmax和Sigmoid的详细区别 目录前言1. Softmax2. Sigmoid3. 总结前言

推荐整理分享三分钟认知Softmax和Sigmoid的详细区别(softag),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:soft learning,softens,softism,soft-mindedness,soft learning,soft learning,softag,softni,内容如对您有帮助,希望把文章链接给更多的朋友!

Softmax以及Sigmoid这两者都是神经网络中的激活函数,对应还有其他的激活函数

引入激活函数是为了将其输入非线性化,使得神经网络可以逼近任何非线性函数 (原本没有引入激活函数,就是多个矩阵进行相乘,无论神经网络多少层都是线性组合,这个概念是感知机)

Softmax以及Sigmoid两者都是作为神经网络的最后一层,通过激活函数之后转换为概率值

1. Softmax

作为二分类问题探讨,是二分类的拓展版,将其拓展为N分类,对应以概率的形式展示(概率最大的类别为此类别)

全连接层的输出使用Softmax,将其输出的结果表示为概率类别(所有概率加起来为1)。

Softmax将其泛化为多分类(SVM得出的是每个类别的分数),Softmax得出的是归一化类别概率(将其所有的输出结果都归一到0和1范围内)。 对应Softmax输入N个值,输出的结果为这N个值的概率(符合概率分布),预测出的所有值加起来为1,对应哪个值比较大,则判定为该类别

其公式具体如下:(使用ex,是为了将其预测结果转换为正数,保证概率不为负数)

通过其公式可看出其特性为:

零点不可微负输入梯度为0

例子如下:

A = 1,B = 2,C = 3 对应的概率值分别为: P(A)= e1 / (e1 + e2 + e3) P(B)= e2 / (e1 + e2 + e3) P(C)= e3 / (e1 + e2 + e3)

对应代码模块如下:

import numpy as npscores = np.array([1, 2, 3])softmax = np.exp(scores) / np.sum(np.exp(scores))print(softmax)

截图如下:

三分钟认知Softmax和Sigmoid的详细区别(softag)

三者的概率值加起来为1,而且P(C)的概率值要远远大于P(A)以及 P(B)

对此Softmax的特性:

归一化并且对应的所有概率值加起来为1对应的真实类别概率值特别大,有放大(但是数值过大可能会有溢出的风险)算出的概率值为非负数

一般在使用Softmax函数作为激活函数的时候,避免溢出,通常会做特殊的处理,将其ex都替换成e-x,防止数值过大产生溢出

在TensorFlow中一般使用统一的接口:

tf.keras.losses.categorical_crossentropy(y_true, y_pred, from_logits = False)

通过from_logits参数设置,该参数为布尔变量

False,网络预测值y_pred经过Softmax输出值True,网络预测值y_pred未经过Softmax输出值

测试代码如下:

import tensorflow as tf# 3个样本,10个类别x = tf.random.normal([3,10])# 3个样本标签值y = tf.constant([9,99,999]) # 采用one_hot编码模式y_true = tf.one_hot(y, depth = 10) loss = tf.keras.losses.categorical_crossentropy(y_true, x, from_logits = False)loss = tf.reduce_mean(loss)print(loss)

截图如下:(如下使用的是False,表示经过激活函数。如果为True,输出的值也是一样的,只不过异常值的时候,False参数,Softmax会有所优化)

2. Sigmoid

逻辑回归二分类将其输入映射到【0,1】的概率分布中,Sigmoid也有这样的功能

数学公式如下:

单调递增且其反函数也有递增的性质,此函数也经常被用作神经网络的阈值函数中

用此函数预测类别,对应其值加起来并不为1,而Softmax函数加起来为1

其图像如下:

用在神经网络中,其特点如下:

梯度平滑,避免梯度跳跃连续函数,可导可微

但是缺点如下:

横向坐标轴正负无穷的时候,两侧导数为0,造成梯度消失输出非0时,均值收敛速度慢(容易对梯度造成影响)e的幂次运算比较复杂,训练时间比较长3. 总结

这两种激活函数如何选择,以及如何应用在不同场景,本身就是伯努利分布和二项分布的差别

Softmax是为了判定该类别是什么(激活函数Softmax可使用的情况下,Sigmoid也可用)

N分类互斥,且只能选择其一,选择SoftmaxN分类互斥,可选多个类别,选择Sigmoid
本文链接地址:https://www.jiuchutong.com/zhishi/292296.html 转载请保留说明!

上一篇:Drömling湿地中的灰鹤,德国 (© Mike Friedrichs/Getty Images)

下一篇:一年一度的施瓦本哈尔圣诞市集,德国巴登-符腾堡州 (© sack/Getty Images Plus)

  • 新浪微博增加高质量粉丝的技巧有哪些?(微博增高长高分享达人)

    新浪微博增加高质量粉丝的技巧有哪些?(微博增高长高分享达人)

  • 华为手环7支持语音助手吗(华为手环7支持NFC吗)

    华为手环7支持语音助手吗(华为手环7支持NFC吗)

  • 苹果7p摄像头抖动怎么办(苹果7P摄像头抖动模糊怎么解决)

    苹果7p摄像头抖动怎么办(苹果7P摄像头抖动模糊怎么解决)

  • 苹果11怎么关闭横屏(苹果11怎么关闭屏幕自动调节亮度)

    苹果11怎么关闭横屏(苹果11怎么关闭屏幕自动调节亮度)

  • bose音响充电没反应(bose音响充电没有灯)

    bose音响充电没反应(bose音响充电没有灯)

  • 闲鱼买家个人原因拒收(闲鱼买家个人原因退货)

    闲鱼买家个人原因拒收(闲鱼买家个人原因退货)

  • oppo怎么截视频的一部分画面出来(oppo怎么截视频方法)

    oppo怎么截视频的一部分画面出来(oppo怎么截视频方法)

  • 抖音如何上热门(抖音如何上热门卖货)

    抖音如何上热门(抖音如何上热门卖货)

  • 华为什么型号有红外线功能吗(华为什么型号有5g)

    华为什么型号有红外线功能吗(华为什么型号有5g)

  • 登录超时是什么意思(登录显示超时什么原因)

    登录超时是什么意思(登录显示超时什么原因)

  • 苹果手机内屏坏了什么现象(苹果手机内屏坏了保修吗)

    苹果手机内屏坏了什么现象(苹果手机内屏坏了保修吗)

  • oppo闪充怎么充电慢了(oppo 闪充)

    oppo闪充怎么充电慢了(oppo 闪充)

  • 发语音对方忙线中是什么意思(发语音对方忙线是怎么回事)

    发语音对方忙线中是什么意思(发语音对方忙线是怎么回事)

  • vivox23充满自动断电吗(vivo手机自动充电)

    vivox23充满自动断电吗(vivo手机自动充电)

  • 手机里的照片删了怎么恢复(手机里的照片删除后在哪里还能看到)

    手机里的照片删了怎么恢复(手机里的照片删除后在哪里还能看到)

  • 简述计算机系统的工作原理(简述计算机系统的层次结构)

    简述计算机系统的工作原理(简述计算机系统的层次结构)

  • 在微信里面买的电影票可以退吗(在微信里面买的电影票怎么退)

    在微信里面买的电影票可以退吗(在微信里面买的电影票怎么退)

  • ps发散光线怎么做(ps如何做散发的光线)

    ps发散光线怎么做(ps如何做散发的光线)

  • ps铅笔怎么画直线(ps 铅笔画)

    ps铅笔怎么画直线(ps 铅笔画)

  • word里面简历模板在哪(word里面简历模板)

    word里面简历模板在哪(word里面简历模板)

  • 如何创建一个用户(如何创建一个用户关系表)

    如何创建一个用户(如何创建一个用户关系表)

  • 华为智能识物功能在哪(智能识物软件下载华为)

    华为智能识物功能在哪(智能识物软件下载华为)

  • YOLOV7训练自己的数据集以及训练结果分析(手把手教你)(yolov7训练自己的模型用 flask封装)

    YOLOV7训练自己的数据集以及训练结果分析(手把手教你)(yolov7训练自己的模型用 flask封装)

  • 分公司可以计提安全生产费吗
  • 税务季度申报如何网上申报填写
  • 管理费用怎么结转成本
  • 没有报关单可以结汇吗
  • 退土增税后账务处理
  • 银行漏记账会造成什么后果
  • 广告公司制作警示牌可以开具什么样的发票?
  • 售楼部垃圾桶
  • 工资做账原始凭证是什么
  • 印花税是不是不用计提
  • 减免税额结转到待认证是什么意思
  • 红包营销活动方案
  • 反向吸收合并账务处理
  • 购进货物运费会退吗
  • 理财赎回本金没赎回利息咋办
  • 学校维修维护费包括哪些
  • 滴滴电子发票怎么填写
  • 餐查账征收企业所得税会计分录?
  • 2020年预付卡增值税税收政策
  • 无发票 入账
  • vue2editor
  • 财政扶持企业政策
  • php常用设计模式(大总结)
  • 小米路由器2代改8t
  • phpstorm 断点
  • 进项税额转出余额在贷方怎么处理
  • 金门大桥和马林大桥区别
  • 现金流量表 科目
  • php操作json
  • php分页查询的简称是什么
  • php输出mysql查询结果
  • 填报的资产总额在季初和季末存在差异是什么意思
  • react 组件化
  • 关于申请补发工资的申请
  • 企业亏损企业汇算清缴怎么处理
  • 非本公司员工能上班吗
  • 每个月工资扣的税为什么不一样
  • 如何理解符合立案标准的,行政机关应当及时立案
  • mysql主要支持哪些数据类型?
  • Discus X 3 门户改造熊掌号网页教程
  • 个体户交个税新政策
  • sqlserver2005属于
  • 增值税留抵税额借贷方向
  • 清算期间研发费怎么算
  • 收回客户货款会计分录怎么写
  • 结转固定资产清理损益的账务处理
  • 坏账准备的余额百分比法
  • 购买500元的保险会计分录
  • mysql关联语句
  • 设置mysql数据库字符集的语句
  • mysql 5.7.13 winx64安装配置方法图文教程
  • 电脑主机windows 7
  • xp剪贴板怎么打开
  • linux系统讲解
  • macbookair自带系统
  • 电脑windowxp系统重装
  • 升级怎么玩
  • mac系统怎么删除用户
  • cnqmax.exe进程的详细注解 cnqmax进程是病毒吗 安全吗
  • 获取windows的最新信息
  • linux中nfs的搭建
  • win8.1安全模式怎么进入
  • linux在u盘中运行
  • 五步轻松实现zTree的使用
  • 表单元素的基本语法
  • cmd Tasklist与Tskill管理Windows系统进程
  • js中arguments
  • 在javascript中如何定义并调用函数
  • js class实现原理
  • python生成pyc
  • jquery弹出窗口
  • js复制字符串的方法
  • python自动化部署oracle csdn
  • android获取网络数据
  • android mvp mvc
  • 深度定制Python的Flask框架开发环境的一些技巧总结
  • 企业所得税要在几号之前申报
  • 发票可以异地领用吗
  • 税务系统党支部工作法
  • ic卡读取失败是怎么回事
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设