位置: IT常识 - 正文

三分钟认知Softmax和Sigmoid的详细区别(softag)

编辑:rootadmin
三分钟认知Softmax和Sigmoid的详细区别 目录前言1. Softmax2. Sigmoid3. 总结前言

推荐整理分享三分钟认知Softmax和Sigmoid的详细区别(softag),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:soft learning,softens,softism,soft-mindedness,soft learning,soft learning,softag,softni,内容如对您有帮助,希望把文章链接给更多的朋友!

Softmax以及Sigmoid这两者都是神经网络中的激活函数,对应还有其他的激活函数

引入激活函数是为了将其输入非线性化,使得神经网络可以逼近任何非线性函数 (原本没有引入激活函数,就是多个矩阵进行相乘,无论神经网络多少层都是线性组合,这个概念是感知机)

Softmax以及Sigmoid两者都是作为神经网络的最后一层,通过激活函数之后转换为概率值

1. Softmax

作为二分类问题探讨,是二分类的拓展版,将其拓展为N分类,对应以概率的形式展示(概率最大的类别为此类别)

全连接层的输出使用Softmax,将其输出的结果表示为概率类别(所有概率加起来为1)。

Softmax将其泛化为多分类(SVM得出的是每个类别的分数),Softmax得出的是归一化类别概率(将其所有的输出结果都归一到0和1范围内)。 对应Softmax输入N个值,输出的结果为这N个值的概率(符合概率分布),预测出的所有值加起来为1,对应哪个值比较大,则判定为该类别

其公式具体如下:(使用ex,是为了将其预测结果转换为正数,保证概率不为负数)

通过其公式可看出其特性为:

零点不可微负输入梯度为0

例子如下:

A = 1,B = 2,C = 3 对应的概率值分别为: P(A)= e1 / (e1 + e2 + e3) P(B)= e2 / (e1 + e2 + e3) P(C)= e3 / (e1 + e2 + e3)

对应代码模块如下:

import numpy as npscores = np.array([1, 2, 3])softmax = np.exp(scores) / np.sum(np.exp(scores))print(softmax)

截图如下:

三分钟认知Softmax和Sigmoid的详细区别(softag)

三者的概率值加起来为1,而且P(C)的概率值要远远大于P(A)以及 P(B)

对此Softmax的特性:

归一化并且对应的所有概率值加起来为1对应的真实类别概率值特别大,有放大(但是数值过大可能会有溢出的风险)算出的概率值为非负数

一般在使用Softmax函数作为激活函数的时候,避免溢出,通常会做特殊的处理,将其ex都替换成e-x,防止数值过大产生溢出

在TensorFlow中一般使用统一的接口:

tf.keras.losses.categorical_crossentropy(y_true, y_pred, from_logits = False)

通过from_logits参数设置,该参数为布尔变量

False,网络预测值y_pred经过Softmax输出值True,网络预测值y_pred未经过Softmax输出值

测试代码如下:

import tensorflow as tf# 3个样本,10个类别x = tf.random.normal([3,10])# 3个样本标签值y = tf.constant([9,99,999]) # 采用one_hot编码模式y_true = tf.one_hot(y, depth = 10) loss = tf.keras.losses.categorical_crossentropy(y_true, x, from_logits = False)loss = tf.reduce_mean(loss)print(loss)

截图如下:(如下使用的是False,表示经过激活函数。如果为True,输出的值也是一样的,只不过异常值的时候,False参数,Softmax会有所优化)

2. Sigmoid

逻辑回归二分类将其输入映射到【0,1】的概率分布中,Sigmoid也有这样的功能

数学公式如下:

单调递增且其反函数也有递增的性质,此函数也经常被用作神经网络的阈值函数中

用此函数预测类别,对应其值加起来并不为1,而Softmax函数加起来为1

其图像如下:

用在神经网络中,其特点如下:

梯度平滑,避免梯度跳跃连续函数,可导可微

但是缺点如下:

横向坐标轴正负无穷的时候,两侧导数为0,造成梯度消失输出非0时,均值收敛速度慢(容易对梯度造成影响)e的幂次运算比较复杂,训练时间比较长3. 总结

这两种激活函数如何选择,以及如何应用在不同场景,本身就是伯努利分布和二项分布的差别

Softmax是为了判定该类别是什么(激活函数Softmax可使用的情况下,Sigmoid也可用)

N分类互斥,且只能选择其一,选择SoftmaxN分类互斥,可选多个类别,选择Sigmoid
本文链接地址:https://www.jiuchutong.com/zhishi/292296.html 转载请保留说明!

上一篇:Drömling湿地中的灰鹤,德国 (© Mike Friedrichs/Getty Images)

下一篇:一年一度的施瓦本哈尔圣诞市集,德国巴登-符腾堡州 (© sack/Getty Images Plus)

  • 苹果13promax怎么截图(苹果13promax怎么关机)

    苹果13promax怎么截图(苹果13promax怎么关机)

  • 淘宝老年模式怎么关(手机淘宝老年模式怎么关)

    淘宝老年模式怎么关(手机淘宝老年模式怎么关)

  • 一个手机号怎么注册两个微信号(一个手机号怎么用两个微信)

    一个手机号怎么注册两个微信号(一个手机号怎么用两个微信)

  • 华为荣耀30s支持nfc功能吗(华为荣耀30S支持U盘数据吗)

    华为荣耀30s支持nfc功能吗(华为荣耀30S支持U盘数据吗)

  • 苹果7的快捷指令在哪(苹果7的快捷指令怎么调出来)

    苹果7的快捷指令在哪(苹果7的快捷指令怎么调出来)

  • 微信新号怎么不被封号(微信新号怎么不绑定银行卡实名认证)

    微信新号怎么不被封号(微信新号怎么不绑定银行卡实名认证)

  • 拼多多黑卡怎么领(拼多多黑卡怎么进)

    拼多多黑卡怎么领(拼多多黑卡怎么进)

  • 硬盘大小有什么区别(硬盘大小有什么影响)

    硬盘大小有什么区别(硬盘大小有什么影响)

  • 手机淘宝我的评价在哪里看(手机淘宝我的评价在哪里找出来?)

    手机淘宝我的评价在哪里看(手机淘宝我的评价在哪里找出来?)

  • commander可以卸载吗(comparing可以卸载吗)

    commander可以卸载吗(comparing可以卸载吗)

  • 小米手环和苹果适配吗(小米手环和苹果手机怎么连接)

    小米手环和苹果适配吗(小米手环和苹果手机怎么连接)

  • qq的网址是什么(qq网址是什么可以直接登入)

    qq的网址是什么(qq网址是什么可以直接登入)

  • 拼多多直通车点击率多少为正常(拼多多直通车点击率多少算正常)

    拼多多直通车点击率多少为正常(拼多多直通车点击率多少算正常)

  • 探探活跃时间什么意思(探探里的活跃时间是真的嘛)

    探探活跃时间什么意思(探探里的活跃时间是真的嘛)

  • 坚果pro3怎么设置分屏(坚果pro3小技巧)

    坚果pro3怎么设置分屏(坚果pro3小技巧)

  • 华为mate30需要贴膜吗(华为mate30需要贴屏幕膜吗)

    华为mate30需要贴膜吗(华为mate30需要贴屏幕膜吗)

  • iphone相机声音怎么关(iphone相机声音怎么关不关闭铃声)

    iphone相机声音怎么关(iphone相机声音怎么关不关闭铃声)

  • oppo录制屏幕怎么没有声音(oppo录制屏幕怎么关闭)

    oppo录制屏幕怎么没有声音(oppo录制屏幕怎么关闭)

  • 套索工具怎么结束(套索工具怎么结束保存)

    套索工具怎么结束(套索工具怎么结束保存)

  • 华为p30pro充电器型号(华为p30pro充电器是40w还是66w)

    华为p30pro充电器型号(华为p30pro充电器是40w还是66w)

  • 华为畅享9e返回键在哪里(华为畅享9e返回键在哪里设置)

    华为畅享9e返回键在哪里(华为畅享9e返回键在哪里设置)

  • qq影音怎样截取音乐(qq影音怎么截图)

    qq影音怎样截取音乐(qq影音怎么截图)

  • 苹果7喇叭声音小(苹果7喇叭声音变小是怎么回事)

    苹果7喇叭声音小(苹果7喇叭声音变小是怎么回事)

  • 微软Win12系统曝光! 内部代号为 HudsonValley(window12最新系统)

    微软Win12系统曝光! 内部代号为 HudsonValley(window12最新系统)

  • python 如何调用api(python 如何调用c)

    python 如何调用api(python 如何调用c)

  • 金税开票软件下载安装
  • 福建税务网上办税流程
  • 纳税人为风险纳税人
  • 记账更改的方法
  • 小规模简易征收计算方法
  • 报验户与正常户的区别
  • 小规模企业所得税税率多少
  • 所得税季报中营业外收入填哪里
  • 农民工工资保证金管理暂行办法
  • 盈亏平衡点产量越高,项目风险越大
  • 公益性捐赠税前扣除资格认定
  • 无形资产摊销以前年度摊多了
  • 现金解款单是什么业务
  • 收到运费发票的会计分录
  • 调整凭证分录
  • 签了合同后又要收额外费用
  • 购买未完工的厂房会计分录
  • 应付债券利息调整科目理解
  • 支付的票据承兑手续费计入财务费用
  • 季度开票超过9万个人所得税
  • 非学历教育培训费发票
  • 股利分配政策的研究背景
  • 企业所得税是当期收入吗
  • 门店关闭费用怎么处理
  • 子公司注销后人员怎么安置
  • 实收资本未到位借款利息可以税前扣除吗
  • 用友软件怎么反记账凭证
  • 个税是负数直接工资加上吗
  • 印花税需要哪些部门核准
  • linux进程操作命令
  • 电脑qq聊天框变成一侧显示的软件版本
  • 超市预售卡怎么记账
  • 未计发放待遇
  • video标签自动播放可以带声音吗
  • 收益性支出与资本性支出的主要特点
  • 什么时编制
  • 语音模块作用
  • thinkphp框架入门
  • 布拉塞龙图片
  • torch.nn.Conv3d
  • java 类型推导
  • 织梦怎么用
  • 已抵扣发票在什么地方查
  • 个人所得税房屋贷款扣除比例怎么选
  • 材料成本差异的超支与节约
  • 工商年报纳税总额从哪看
  • 民办幼儿园账务月末结转
  • 票据背书转让挂什么科目
  • 政府会计制度收回多发工资
  • 盈余公积转增资本对会计要素的影响
  • 小企业营业外支出坏账损失
  • 代扣代缴的增值税额
  • 小规模纳税人增值税账务处理
  • 物流公司账务处理流程及方法
  • mysql的全文索引的用处
  • window装机必备应用
  • 关闭 windows
  • windows vista 版本
  • 因为你的策略组阻止
  • win7删除windows.old
  • 怎么在centos中创建一个文件
  • browsercore.exe是什么
  • win8.1文件夹选项
  • win平板装ubuntu
  • 苹果完美越狱最新消息
  • centos7更改默认内核
  • 怎么从win8装回win7
  • linux中比较文件链接数的变化
  • 利用命令查看虚拟机的信息
  • opengl 投影矩阵
  • android layer
  • web标准化
  • javascript中的类型转换
  • node.js ts
  • shell脚本编程实例
  • android应用程序的主要语言是
  • 四川省一般纳税人资格证明
  • 江西社保申报时间
  • 一般纳税人资格是什么意思
  • 税务总局纪律作风
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设